我挺喜欢看书的,也挺喜欢看电子书——特别是有些时候,实体书搞不到,那就只能看电子书了。
之前吧,我用一个非常old的KPW3看书,也不敢抱怨:屏幕小了一点,英文单词翻译弱了一点,中文输入(比如添加笔记)拉了一点,导出功能肋了一点,售后服务是没有一点……但没有别的特别动心的选择。
这不,AI来了,我感觉我又行了,我编程能力一般,但可以让AI帮我写一个AI赋能的电子书阅读器啊!
说干就干。今年年初的时候,我萌生了这个想法,从GitHub那里拉了一个现成的Python ePub解析库,然后在此基础上加入自己的功能。
比起之前的随手0天完成项目,我是很认真地在创作——为此我专门升级了我的显卡呢!
先说开发工具、AI模型配置。
我选用了Visual Studio Code作为我的开发工具,同时用GitHub Copilot作为我的AI agent,其中的GPT 5.4作为模型。
用KPW3看书有一个重要的不便:它的标注功能太弱了。我看书有一个习惯:喜欢划线,有一些单词——特别是拉丁文短语——我想记下来,有一些地方我觉得很有意思——可以进行后续的讨论和写作……
有了一块很强的显卡后,这些我都想让AI来完成,于是我安装了Ollama,并安装了模型Hermes3作为本地快速查询的模型,然后安装了Gemma4:31b-cloud作为远程模型。
这么一来,整体应用的框架就算基本成了:
- 打开WEB界面,上传书籍,阅读。
- 阅读界面可以调整阅读界面、字体名称、字体大小、Light/Dark模式等。
- 如果看到我不认识的单词或者专属名词,可以划词翻译或者要求AI给出解释。
- 如果看到一段话我想加入我后续的讨论和写作,我可以要求AI就此给出讨论要点。
- 一般地,我可以随手加个批注。
- 以上所有这些AI产出的、我的内容都可以保存到数据库,以便整理、导出。
这就是我这个AI电子书阅读器的基本功能了。
在开发过程中,我基本没有写代码,就是在和我的IDE“聊天”。最终的阅读界面是这样的1:

(上图是模拟纸质背景读书的效果,并显示了我让AI查找Lynch syndrome返回的结果——用的是Cloud模型。)
回到书籍列表界面并展示深色效果:

以及本书所有划线部分的内容——导出部分还在开发:

这个程序的代码我已经放在了GitHub:https://github.com/taylorren/ai-reader,有兴趣的朋友可以克隆一份,启动不一样的电子书阅读之旅!
相关文章
- 微信可能会不让我发图片,但我不准备换了。 ↩

Leave a Reply