Blog

  • 合久必分

    合久必分

    话说天下大势,分久必合,合久必分。

    2002年的时候,肾上鄙人在下我受华中科技大学出版社的委托,担任李维(Gordon)新书《#C++Builder 6 SOAP/Web Service开发》的技术编辑,并写了一篇前言。我在前言中,(对广义的IT界)做了一个判断:和天下大势一样,IT界的技术发展也会遵守合-分-合-分……这样的一个趋势。

    如今套用在AI这些年的发展,我也看到了“合-分”的第一次进化。

    AI第一次进入大众视野时,是高大上的“集中”算力的成果。动辄上万片价值上万元显卡堆积起来的算力,不是任何个人能上手的,更何况还要有庞大的电力供应以及机房配套。

    所以,这个时期的AI演化呈现集中的态势:算力集中、人才集中、资本集中。这三年多来的集中式突进,让我们见识了什么叫做“指数级”发展。

    (指数级发展的特点之一,是越到后面发展越快;特点另之一,就是只要落后一步,那么差距只会越来越大。)

    不过,变化已经来了:分的苗头开始越来越浓了。

    今年3月,按摩店(AMD)发布AI Max+ 395芯片,展示了本地运行LLM的能力;6月,黄皮衣展示了RTX Spark。

    (据说,Lisa Su和Jensen Huang是比较近的亲戚,皮衣还长了一辈儿。)

    RTX Spark的价格大概在1800-2900美元之间。简单(按照1:9)换算到人民币也就是16200-26100之间。肾上觉得,这个价格还是比较合理的——因为,你家小朋友上一个补习班/训练班可能就要花这么多钱!

    如果现在的AI模型都这么便宜,我们为什么还需要本地的AI助理?

    我觉得至少有这么几个道理。

    1. 隐私:所有的对话、数据都在本地,没有任何信息在公网传送和保存。所以,你可以放心处理那些不适合上云的个人材料、工作草稿和敏感信息。
    2. 易用:无需联网、无需注册,就是打开TUI或者GUI界面,用就完了。如果愿意并有能力,你还可以调整本地模型的参数,让它更懂你。如果你还愿意更进一步,甚至可以训练自己专属的模型。
    3. 安全:你的东西就是你的,你可以通过自己所能采取的措施,进行加密、备份,而不需要受制于云服务商。

    但,本地AI为我们带来的还不止这些。

    换句话说,隐私、易用、安全不只是“个人使用体验”,它们还是“社会自组织”能够大规模发生的前置条件。

    =============

    随着AI的出现,一个问题悬停在我们头上:

    我的职业是不是会被AI替代?

    我不会盲目地说:不会,肯定不会。而且,我更倾向于说:会,很会,基本会。由于新技术的出现而导致一大批人失业的情形,已经不新鲜了。但是,从来没有因为技术发展而造成社会最终崩坏的情形。

    这不是说灾难性的失业问题其实就是nothing,而是说,新技术的出现和发展,必然带来新的需求,从而促生新的职业。(比如,因为程序员压力太大,于是就有了主要是由PLMM担当的编程陪护员。)

    但是,还需要一个更根本的前提:社会的底层设定,得是自组织

    什么意思?就是当旧结构被技术冲开时,不应该什么都等中心调度,不应该什么都靠单一路径分发。个体、社群、企业、教育节点,能够自行连接、自发协作、快速试错,然后把有效做法扩散出去。而社会需要做的,是破除可以破除的一切技术壁垒,将工具真正地放到每个人手上。

    这样的社会,面对AI带来的岗位重组,不会只表现为“被替代”;它还会表现为“再组合”。这才是真正有活力的。

    而本地AI的意义,也正在这里。它把能力从少数中心释放到更多终端,让普通人和小团队也能低成本搭建自己的工作流、知识库和生产链。也就是说,“分”不只是资源的分散,更是组织能力的下沉。

    所以,回到开头那句话:合久必分,分久必合。

    但如果社会具备自组织的底层设定,这一轮“分”,就可能不是失序,而是下一轮更高质量“合”的前奏。

  • 看爽文

    看爽文

    如果没有确定的读书计划,那你一定会去看网络小说。——匿名,来自网络

    是的,肾上就是如此。虽说家里的藏书近2000册,但认真看了的不到400。有时,虽然很想静下心来看一本大书——比如我一直想完成的《21世纪资本论》《资本的限度》《就业、利息和货币通论》等等,但总有各种事情窜来窜去,也就一直还没完成。

    于是,肾上就会看闲书,也就是各种网络小说。

    最近在看两本网络小说。两者有不少相同之处:都是大部头、都是穿越、而且都是讲明朝万历年间(一本讲万历摆烂之前、一本讲万历摆烂之后)。难道是受了《万历十五年》的影响?

    相比升仙得道、打穿三界,在历史节点处力挽狂澜、从而让中国历史走上不一样的进程,确实更有成就感——而且这里不需要考虑时光穿梭并修改历史后造成的"祖父悖论"。

    所有这样的类似小说,都遵循一个基本的出发点:我来自后世,对历史的进程有着深刻的理解,我同时掌握着相对而言极为先进的科技知识,因此能借助当时的(朝廷、官员、士农工商、满蒙夷狄)资源,量变引起质变,从而改写历史。

    这类小说还有一个特点就是,原本不可避免的王朝衰败都至少有一个强大的外因——比如,万历年间开始崛起的满清。虽然作者也都承认,大明内部也有着根深蒂固的问题,但总基于这样的一个判定:如果此时没有那个最终的外因,王朝应该还可以赓续,而自己的出现正是要内外兼治,从而彻底扭转历史的走向。

    ======

    肾上曾经和人讨论过一个很本质的问题,而且我认为对这个问题的回答,决定了我们是不是还能聊下去。

    有了权力而制定规则,还是因为遵守规则才有了权力?

    表面上看,这些小说中的主人公是在"遵守规则"的:在外部规则方面,他们依靠的是科技发展的客观规律;在内部"规则"方面,则是一个开明皇帝的存在。

    但哪个规则更优先、更强大?上述这个问题的答案,其实已经呼之欲出了。

    很可惜,作者们普遍滑入了开明皇帝的陷阱——这种滑落未必出于深思熟虑,更多是市场迎合与认知惯性使然。他们用一个明智的、愿意放权的皇帝,来替代真正意义上的制度建设。主角的成功,归根结底依赖的是皇帝"恰好"理解他、信任他、保护他、利用他。这本质上还是"有了权力而制定规则"的那条路——只不过换了一个更好说话的权力主人。如此的进程,不过是在原有的系统上打补丁而已。

    这就是这类小说无法回避的内在矛盾:它们在技术层面相信规律和规则,却在政治层面退回到了人治的怀抱。历史被改变了,但改变历史的逻辑,和它所批判的那个旧时代,并没有本质的区别。

    这或许也解释了,为什么读这类小说会有一种奇特的爽感——它满足的,不是对制度进步的想象、以及推进制度变革必然伴随的痛苦与斗争,而是凭一己之力在系统内部修修补补的幻觉。说到底,这不是0到1的突破,而只是在一个旧有起点上的小步挪移。

    混沌理论告诉我们,初始条件的微小差异,会在系统的演化中被指数级放大,最终导向截然不同的结果——这就是所谓的"蝴蝶效应"。这些穿越小说的作者们,或许以为自己笔下的主角就是那只蝴蝶:在历史的关键节点轻轻扇动翅膀,优雅地拨动历史的走向。然而实际上,一个携带着后世全套工业知识与改革蓝图、深度介入朝堂权争的穿越者,根本不是蝴蝶——他是一颗砸进系统的陨石。

    陨石落地之后,系统当然会剧烈震荡,走出一段看似全然不同的轨迹。小说里的那些章节,写的正是这段震荡:火器、蒸汽机、新式官僚体系,一切都在向好的方向演化。读者也在这里获得了最大的爽感。

    然而,震荡终究会衰减。真正决定系统长期走向的,不是初始扰动有多大,而是系统深层未曾触动的结构——那个始终存在的吸引子:权力凌驾于规则之上。只要这一点没变,无论中间经历了多少技术跃升、多少英明决策,系统终将被拉回它本来的轨道。盛极而衰,分久必合,王朝的宿命并未解除,不过是推迟了。

    所以,这类小说真正回避的问题,从来不是"能不能改变历史",而是"改变了又能维持多久"。

    image
  • 书友们推荐的书

    书友们推荐的书

    前两天突发奇想,请几位书友、好友推荐10本书——10本他们觉得对自己有帮助、有触动的书。

    我大概问了10名书友,他们回复了各自的一个书单——有的回复贼拉快,有的是回家后告诉我的。

    我自己也做了一个推荐,然后让AI做了个整理,最终有69本书。我会将我的推荐标注出来。

    260605-1

    小说/文学

    • 卡拉马佐夫兄弟(出现1次)
    • 红与黑(出现1次)
    • 霍乱时期的爱情(出现1次)
    • 隐形的城市(出现1次)
    • 神们自己(出现1次)
    • 基地系列(出现1次)
    • 活着(出现1次)
    • 平凡的世界(出现1次)
    • 白鹿原(出现1次)
    • 乱世佳人(出现1次)
    • 美丽新世界(出现1次)
    • 权力的游戏(出现1次)
    • 史蒂芬乔布斯传(出现1次,传记/回忆类)
    • 射雕英雄传(出现1次)
    • 神雕侠侣(出现1次)
    • 笑傲江湖(出现1次)
    • 傲慢与偏见(出现1次)
    • 呼啸山庄(出现1次)
    • 茶花女(出现1次)

    历史/政治

    • 史记(出现2次)
    • 中国近代史(徐中约版)(出现1次)
    • 中国历代政治得失(出现1次)
    • 罗马人的故事(出现1次)
    • 昨日的世界(出现1次)
    • 青年斯大林(出现1次)
    • 毛泽东选集(出现1次)
    • 毛泽东诗词(出现1次)
    • 李光耀传(出现1次)
    • 叫魂(出现1次)
    • 日本权力结构之谜(出现1次)

    哲学/宗教/思想

    • 圣经(出现2次)
    • 道德经(出现1次)
    • 理想国(出现1次)
    • 西方哲学史(出现1次)
    • 哲学的故事(出现1次)
    • 自由的伦理(出现1次)
    • 坛经(出现1次)

    科学/科普

    • 卡尔萨根《宇宙》(出现1次)
    • 时间简史(出现1次)
    • 枪炮、病菌和钢铁(出现1次)
    • 自私的基因(出现1次)
    • GEB(出现1次)
    • 混沌(出现1次)
    • 地理的报复(出现1次)

    管理/经济/社会科学

    • 卓有成效的管理者(出现2次)
    • 经济学(出现2次)
    • 经济学原理(出现1次)
    • 组织社会学十讲(出现1次)
    • 通往奴役之路(出现1次)
    • 人的行为(出现1次)
    • 高效能人士的七个习惯(出现1次)

    自我提升/实用类

    • 原子习惯(出现1次)
    • 发现心流:日常生活中的最优体验(出现1次)
    • 终身成长:重新定义成功的思维模式(出现1次)
    • 被讨厌的勇气(出现1次)
    • 自控力(出现1次)
    • 纳瓦尔宝典(出现1次)
    • 非暴力沟通(出现1次)
    • 常识(出现1次)

    传记/回忆/艺术

    • 爱因斯坦传(出现1次)
    • 爱因斯坦文集(出现1次)
    • 史蒂芬乔布斯传(出现1次)
    • 林语堂英文版苏东坡传(出现1次)
    • 莎士比亚全集(出现1次)
    • 鲁迅全集(出现2次)
    • 西方艺术史(出现1次)
    • 艺术的故事(出现1次)
    • 建筑的永恒之道(出现1次)

    其他/难归类

    • 罗伯特议事规则(出现1次,实用工具)
    • 送东阳马生序(出现1次,古典文献)
    • 失落的卫星(出现1次,未明确类别)

    我之前在读书会上一直说,读书是很私密的事情,书单就更私密。感谢这几位大佬的无私分享。出于对他们的尊重,我就不让AI再分析这个书单了。

    中国文人读书,最刺激的当属“雪夜闭门读禁书”——记住,千万不能是下雨天!——最旖旎的莫过“红袖添香”,最实在的无非“黄金屋/颜如玉/千钟粟”。

    我不能算一个读书人,只能算一个读了点书的人,但也要祝各位读书人、读书的人,有一个称心如意的环境,读上称心如意的书。

    相关文章

  • Careless People

    Careless People

    所谓“工欲善其事,必先利其器”,有了肾上自己开发的ePub阅读器,肾上终于能轻松欢快地看书了。

    第一本完成的书是《Careless People》。

    Sarah Wynn-Williams曾经工作于Facebook——对,现在叫Meta,职位是Director of Public Policy,不能算顶级高管。而且,按照书中所说,这个职位是她“说服”了Sheryl Sanderberg——对,就是那个写了Lean In的那位女COO——为她”造“出来的。

    Sarah在FB的工作时间是2011-2017年。她是被FB解雇的,FB给出的理由是”poor performance and toxic behavior“,但她坚持认为这个解雇是一种报复:报复她举报她老板对她进行了性骚扰。

    这本书于2025年3月出版,FB想通过诉讼禁止她推销此书1,但效果适得其反,当月本书登上了纽约时报畅销榜第一位。

    之后,Sarah被要求前往参议院作证:小扎为了让FB进入某一国家/地区而”愿意“根据该当地政府要求对FB上的内容进行过滤。

    本书的题目Careless People来自著名小说The Great Gatsby。如果我们不小心,将其翻译为”粗心(大意)之人“,那么如果Sarah在书中陈述的属实,FB所做的一些事情已经远远超出了”粗心大意“的范畴。

    回到”了不起的盖茨比“一书,"carelss people"来自这么一段著名的对话:

    They were careless people, Tom and Daisy—they smashed up things and creatures and then retreated back into their money or their vast carelessness, or whatever it was that kept them together, and let other people clean up the mess they had made.**

    所以,这里的careless不是粗心大意、无心,而是”冷漠、冷酷“。

    ======

    在我粗浅的认知中,”公共政策“可以约等于”政府关系“。在我不值一提的职业生涯中,也曾经和众多政府官员打过交道。我一直觉得这个职位/职能很鸡肋,看了Sarah的书,更加加强了我这个观点。

    以Meta来说,一方面是要进入更多的市场,获得更多的用户,从而才能让整个业务流、(广告)收入流增长——毫无疑问,这是所有业务的基本要求;一方面,作为一个美国公司,特别是一家可以让诸多用户发布内容的社交媒体公司,需要坚守一些constraints by the constitution,比如言论自由;和公序良德,比如不能发布鼓动暴力的内容;一方面是平台运营当地的政策法规以及政府的”偏好“。

    所以,在肾上看来,和诸多”不可能“三角那样,这三角恐怕也不能存在一个公共交集。

    • 保持:扩张+价值观:导致合规不能,进而商业上成功不能——一些地区进不去。
    • 保持:扩张+合规:删除特定言论、限制某些话题、数据本地化(因而政府可以”无限“获得),从而导致价值观崩塌。
    • 保持:价值观+合规:理想主义者的梦想——只要你没有一个董事会和/或股东会需要汇报,但你的业务不会做大。

    美股七巨头中,其他六家还好,而Meta是唯一真正面对这个不可能三角巨大挑战的公司,因此我个人是偏向于相信Sarah在文章中提出的种种问题,以及——基于我能看到的微不足道、但真实可信的消息——Meta高管(包括小扎、Sheryl)对此的carelessness,因为显然Meta做出了选择。

    去中心化不是这个”不可能三角“的解决方案,因为任何去中心化的方案对用户的要求都太高了。以获取信息自由而言,去中心化将极大提高一般用户获得信息的门槛,从而直接导致信息流通的不便。

    但,我们每个人其实都很careless。Careless成为了Zeitgeist。我们一边利用着极其先进的“器”来获取信息,一边却在算法的喂养下,逐渐丧失了审视“现实”的能力。

    从Common Sense出发,也许是一个个体能做到的最底限。

    相关文章


    1. ”禁止推销“来自Wiki上的记述:Meta sued to prevent Wynn-Williams from promoting the book。但我不是很懂这个prevent promoting是什么意思,但显然不是禁止出版。 
  • 手搓一个AI赋能的电子书阅读器

    手搓一个AI赋能的电子书阅读器

    我挺喜欢看书的,也挺喜欢看电子书——特别是有些时候,实体书搞不到,那就只能看电子书了。

    之前吧,我用一个非常old的KPW3看书,也不敢抱怨:屏幕小了一点,英文单词翻译弱了一点,中文输入(比如添加笔记)拉了一点,导出功能肋了一点,售后服务是没有一点……但没有别的特别动心的选择。

    这不,AI来了,我感觉我又行了,我编程能力一般,但可以让AI帮我写一个AI赋能的电子书阅读器啊!

    说干就干。今年年初的时候,我萌生了这个想法,从GitHub那里拉了一个现成的Python ePub解析库,然后在此基础上加入自己的功能。

    比起之前的随手0天完成项目,我是很认真地在创作——为此我专门升级了我的显卡呢!

    先说开发工具、AI模型配置。

    我选用了Visual Studio Code作为我的开发工具,同时用GitHub Copilot作为我的AI agent,其中的GPT 5.4作为模型。

    用KPW3看书有一个重要的不便:它的标注功能太弱了。我看书有一个习惯:喜欢划线,有一些单词——特别是拉丁文短语——我想记下来,有一些地方我觉得很有意思——可以进行后续的讨论和写作……

    有了一块很强的显卡后,这些我都想让AI来完成,于是我安装了Ollama,并安装了模型Hermes3作为本地快速查询的模型,然后安装了Gemma4:31b-cloud作为远程模型。

    这么一来,整体应用的框架就算基本成了:

    1. 打开WEB界面,上传书籍,阅读。
    2. 阅读界面可以调整阅读界面、字体名称、字体大小、Light/Dark模式等。
    3. 如果看到我不认识的单词或者专属名词,可以划词翻译或者要求AI给出解释
    4. 如果看到一段话我想加入我后续的讨论和写作,我可以要求AI就此给出讨论要点
    5. 一般地,我可以随手加个批注
    6. 以上所有这些AI产出的、我的内容都可以保存到数据库,以便整理、导出。

    这就是我这个AI电子书阅读器的基本功能了。

    在开发过程中,我基本没有写代码,就是在和我的IDE“聊天”。最终的阅读界面是这样的1

    (上图是模拟纸质背景读书的效果,并显示了我让AI查找Lynch syndrome返回的结果——用的是Cloud模型。)

    回到书籍列表界面并展示深色效果:

    以及本书所有划线部分的内容——导出部分还在开发:

    这个程序的代码我已经放在了GitHub:https://github.com/taylorren/ai-reader,有兴趣的朋友可以克隆一份,启动不一样的电子书阅读之旅

    相关文章


    1. 微信可能会不让我发图片,但我不准备换了。 
  • 让AI更懂你

    让AI更懂你

    如果说在不久前,碳基人类最值得学的“通用语言”是英语,那么到了硅基AI时代,我想再加一个:MD,也就是 Markdown。

    在我看来:只要你想认真使用AI,就最好学会用MD这种轻量级语言来组织表达。

    相信不少人和我一样,会刷到:“我只是拉了一个文件,AI就帮我做好了总结!”,“我写了三行提示,AI就帮我做好了PPT!”之类的标题党。

    我承认,这种情况确实存在——甚至我有时也会这么做,也会得到还算可以的结果。

    但这并不是让AI更懂你、更好为你做事的正确方式。

    原因很简单。自然语言适合聊天,却不擅长精确表达和协作。你随口问一句,AI当然也能答;可一旦你要它整理文章、比较方案、按固定格式输出、修改长文、分步骤执行任务,纯口语就很容易乱。

    而MD的价值就在这里:它能把你的意图结构化。

    比如,你当然可以直接这样说:

    帮我写一个方案,要包括背景目标风险预算时间安排,并且先给结论,再展开分析。

    但如果你用MD把要求写清楚:

    # 任务
    写一个项目方案
    
    ## 输出要求
    1. 先给结论
    2. 再展开分析
    
    ## 内容结构
    - 背景
    - 目标
    - 风险
    - 预算
    - 时间安排
    

    AI通常就会“聪明”得多。因为标题、列表、编号、代码块,这些在我们看来只是格式,在AI那里却是非常明确的路标(信标)。

    不是AI偏爱MD,而是它更容易处理层级清晰、约束明确的信息。

    常用的MD语法其实就那么多。如果要看一遍,也不用找太多资料,直接看 Markdown Guide 的基础语法 就够用了。

    # 标题
    ## 子标题
    
    - 并列要求
    - 并列要求
    
    1. 第一步
    2. 第二步
    
    **重点限制**
    
    > 背景材料
    

    MD最早出现,是为了用更少的标记完成基本排版,本来是个文档工具。但现在,它也越来越适合拿来和AI协作。它训练的并不只是格式习惯,更是一种表达能力:先分层级,再写要求;先给边界,再让AI发挥。写提示、写知识库、写任务单、写会议纪要,都会因此受益。

    支持MD的免费工具有不少。Windows和 Mac上都可以直接用ObsidianVS Code;前者更像笔记本,后者更像工具台。更轻量的编辑器也不少。

    不会MD,你当然也能用AI;但会MD,你往往更容易把需求讲清楚,也更容易让AI稳定地把事做好。

    所以如果今天有人问我:想把AI用好,最值得先学的东西是什么?

    我的答案会是:

    先学会把想法写清楚;而MD,往往是最好上手的起点。

    相关文章

    • [[251218.2026 AI辅助创作指南]]
    • [[251009.assert(编程!=抽烟烫头喝着酒)]]
    • [[250204.NotebookLM试用体验]]
  • 第二书房的第二电脑

    第二书房的第二电脑

    在肾后的指导下,最近我越来越喜欢在第二书房工作。之前我用的是一台2017年的老笔记本,倒也不是不能用,只是速度确实有点慢了:打开几个文档和网页还行,一旦开始多任务切换,就能明显感觉它已经进入老年期。

    前两天又被种草,看到水果新推出的MacBook Neo(MBN),一下子有点心动。

    我的使用场景其实很简单:

    1. 日常:Office全家桶、用Markdown进行写作。
    2. 轻度编程:偶尔写点小程序来帮助自己练脑子。
    3. 轻游戏:我不怎么玩大游戏,最多也就是一些卡牌游戏。
    4. 看视频:主要看看新闻和网站视频。
    5. AI辅助:这一项反而越来越重要,后面细说。

    上周我去苏州中心的水果店看了看,一眼就相中了那个被水果称为“柑橘黄”、而我觉得更像“鸭屎黄”的颜色。店员说,所有MBN都没有现货,于是我留了联系方式。前两天收到邮件,说我要的颜色和配置到了,我就赶紧跑去下单入手。

    这两天,我一边工作,一边慢慢把新机器上的环境重新搭起来。说起来,我以前也用过MBA,但那台机器更像是单纯的“工作工具”;而这次折腾MBN,感觉更像是在给第二书房搭一个新的工作台。于是我也顺手整理了一下:一台主要用于写作、办公和轻量AI的Mac,到底该装些什么。

    先说结论

    在我看来,MBN最大的价值并不是性能有多夸张,而是它足够轻、足够安静,也足够支撑我的日常工作流。它当然跑不了特别大的本地模型,也不适合拿来做重度创作或硬核游戏,但如果用途本来就是写作、办公、看视频,再加一点AI辅助,那它其实已经相当够用了。

    哦,对了,如果预算不是太紧,强烈建议买512G的。不仅是硬盘容量大了,而且还支持Touch-ID,可以用指纹解锁。

    最重要的软件:Resilio Sync

    我第一个装的还是Resilio Sync。简单说,它就是我的“私有云”,负责在不同电脑之间同步文件。

    我以前就是这么工作的:在公司的电脑上改完文件,回家以后继续修改;第二天再到公司,就能直接接着前一晚的版本往下写。它的设置很简单,而且内外网穿透能力相当强。哪怕一台机器在家里,一台机器在海外,只要网络状况别太离谱,文件同步基本都能维持住。

    对于我这种写作者来说,这个软件的重要性甚至比办公软件还高。因为写作最怕的不是没灵感,而是稿子散落在几台设备里,自己都不知道最新版在哪儿。

    基础环境:浏览器、启动器和常用软件

    浏览器方面,我还是装了Firefox。Mac自带的Safari不是不能用,但我始终觉得差点意思,尤其是迁移过来的使用习惯很难改。

    Raycast也是我必装的软件。Mac自带的Spotlight够基础,但还不够强;而Raycast相当于把“启动器”这件事做成了一个更顺手的工作入口。

    至于QQ、微信、直播软件、VLC、Microsoft Office这些,就属于按习惯补齐的基础配置了。它们不一定有多惊艳,但少了哪一个,工作和娱乐都会不太顺手。

    写作主力:Obsidian + VS Code

    我现在已经习惯用Markdown写东西:格式简单、迁移方便,而且对AI也很友好。所以在新机器上,Obsidian自然是第一批装上的。我会在里面开一个Vault,把相关写作串联在一起;另外,它导出PDF的能力也确实很强,这一点非常实用。

    不过,Obsidian更适合整理和串联,而不是处理那种稍微复杂一点的任务。比如解题、事实核查、发散讨论,或者和AI进行更密集的来回交互,我还是更愿意交给VS Code。因为我买的AI服务本来就是GitHub Copilot,放在VS Code里用起来也最顺手。

    所以现在我的写作环境大致是这样的:Obsidian负责沉淀、归档和组织;VS Code负责复杂处理和AI协作。前者像书桌,后者像工具台。

    AI配置:外出一套,在家一套

    MBN的配置决定了,它不可能承担“重型本地AI工作站”的角色。较大的本地模型,它是跑不起来的;但如果只是做一些发散讨论、简单问答和轻量事实核查,它还是能胜任。

    我最后给它配了两套方案:一套用于外出离线,一套用于在家联网。

    • Ollama:负责外出时的离线问答。我装了几个相对较小的模型:gemma4:e2bgemma4:e4bhermes3:3b。实测下来,虽然不能说飞快,但确实能用。
    • Cherry Studio:负责在家联网时调用桌面机的算力。我的桌面机上有更好的显卡,可以跑更大的模型,比如gemma4:26bgemma4:31b这一类。这样一来,MBN本身不需要太强,也能借助家里的大机器完成更复杂的任务。
    • Copilot CLI:我本来一直在用千问,每天免费一千问也挺够用;但4月15日以后,这项免费服务没了。既然我本来就订阅了Copilot,那干脆就转过来直接用。反正这个订阅本来也能覆盖VS Code、Obsidian等应用,整合起来反而更省事。

    最后

    折腾完这几天之后,我对这台MBN的判断也很明确了:它不是一台追求极限性能的机器,但它非常适合我现在的生活方式。

    我需要的不是一台能跑天花板级模型、也不是一台能硬扛3A大作的笔记本;我需要的是一台能安静地放在第二书房里,随手打开就能写、能查、能同步、能顺便和AI讨论几句的电脑。从这个角度看,MBN对我来说,算是买对了。

  • 让我来康康AI可以有多“靠谱”?

    让我来康康AI可以有多“靠谱”?

    Google沉寂了好一段时间,前两天放出了一个重要的模型升级:Gemma 4。我下载了、运行了。

    我用的测试工具比较多,包括:Visual Studio Code(VSC)中的Github Copilot(自动选择模型),Ollama(Gemma 4 31b),还有国产的豆包。

    其中,本地跑Ollama的桌面机配了一块5060 Ti 32G的显卡。

    我一直有收藏文档做站点的习惯,所以这次我就从我的维基站点中的两个专栏里随手拉了一些题目:

    第一题

    爱丽丝来到遗忘林的时候,她不是所有的事情都忘记了,她只是忘记了某些事情。她经常忘记自己的名字,最容易忘的是星期几。狮子和独角兽可是林中的常客。他们都是很奇怪的动物。狮子在周一、周二和周三撒谎,其它日子说实话。而独角兽呢,正好相反,它周四、周五、周六撒谎,而其它日子说实话。这天,爱丽丝遇见狮子和独角兽在树下休息。他们做了如下的陈述: 狮子:昨天是我说谎话的日子。 独角兽:昨天也是我说谎话的日子。 爱丽丝是个非常聪明的女孩,她从这两个陈述就可以知道今天是星期几了。那么今天是星期几?

    这是一道入门题。所有的AI都可以得到正确答案。但Gemma的推理过程比较突出:它检查了周一的情形后,总结出:无论是狮子还是独角兽,能说出这句话的日子和前一日必须是处于不同的说真话还是说假话的日子。所以,很快,它推理出狮子只有周一、周四,独角兽只有周四、周日,才能做出如题的陈述。所以,当天只能是周四。这个推理过程非常有意义。

    第二题

    莎士比亚的《威尼斯商人》中,鲍西娅有三个首饰盒:金的、银的和铅的。其中的一个盒子中放着鲍西娅的肖像。求婚者要在其中选一个盒子,如果他足够幸运(或者足够聪明)选到了有肖像的那个盒子,他就可以娶鲍西娅为妻。每个盒子的盖子上都有一段铭文来帮助求婚者做出聪明的选择。 现在,假定鲍西娅希望选择她的夫君时,不是基于他的品德,而只是基于他的聪颖。她在盒子上刻下了如下的铭文:
    肖像在这个盒子里。 肖像不在这个盒子里。 肖像不在金盒子里。
    鲍西娅对求婚者说明,这三句话中,最多只有一句是真的。 求婚者该选择哪个盒子?

    这道题也不难。所有AI都可以得到正确答案:求婚者应该选择银盒子。

    Gemma和Copilot的推理过程相似。它们都敏锐地判定出:由于金盒子和铅盒子上的陈述互相矛盾,那么这两个陈述肯定有一个为真。而题目中说“最多只有一句为真”,那么银盒子的陈述就是假的。既然如此,肖像必然在银盒子里。

    (以上两题来自我最喜欢的逻辑书《这本书叫什么?》。我选了其中最入门的两个章节中的两题。)

    第三题

    Life Isn’t a Bowl of Cherries 你和朋友Amit面前有4只樱桃碗,里面分别装着5,6,7,8颗樱桃。 你们轮流行动;每次可以任选一只碗,并从中取走至少1颗樱桃。 如果你先手,并且想确保最后一颗樱桃是Amit取走的,那么你的第一步应该从哪只碗里取走几颗樱桃?

    所有AI都知道这是一道有关NIM sum游戏的策略题,并给出了第一步操作:从8颗的碗里拿走4颗,并解释了其中的数学原理:各个碗的樱桃数量的异或值为零是本题的关键。

    但只有Gemma明确指出:这个所谓misere Nim(确保对手赢)游戏,策略和常规的Nim(确保自己赢)游戏,策略是一样的,直到最后一步。

    第四题

    Spaghetti Loops 把50根煮熟的意大利面看作50段线段,它们一共有100个端点。 现在把这100个端点随机两两配对并打结。 问:最终形成的闭合面条环(loop)个数的期望是多少?

    三个AI表现正常。但豆包只有第一步推理是对的:它知道在第一次挑面条的一头,并和任意另一头打结的时候,成环的概率是$\frac{1}{99}$。但它太早进行一般化,简单地将这个概率乘以了50。经过一次提示,它正确地得出,最终形成闭环的期望是$\frac{1}{99}+\frac{1}{97}+\frac{1}{95}+\cdots+\frac{1}{3}+1$。但在计算这个公式的时候出错。经过再次提示,得到了2.937…的正确结果。

    (以上两题来自我最近开始整理的《数学谜题》。)

    ====

    我觉得吧,AI能帮我总结东西、帮我做PPT都是极好的。但要是能帮我学习逻辑、学习数学,从而可以真正地与它开展严肃的讨论,那才是更好的。

  • 末日生存指南

    末日生存指南

    请你设想:突然有一天,电影里描写的Armageddon 降临:基础设施(包括电力)供应切断、交通瘫痪、网络瘫痪、(可能)伴随核污染、……

    你唯一还能获取的资源,也许只有家里的日常储备(瓶装水、粮油菜肉、日常用品……)。

    而你最重要的任务是:活下去,找到安全之所,并延续文明的火种!

    你只是一个普通人,只有最普通的知识,你该如何做到?

    你唯一还能感到欣慰的是:你有一台前天晚上充足了电的笔记本电脑——可以让你工作N个小时,而电脑上安装了一样最宝贵的东西。

    Project NOMAD:离线世界的知识方舟

    Project N.O.M.A.D.Node for Offline Media, Archives, and Data)就是你在此时此刻最宝贵的东西。

    NOMAD的词义是:游牧者。用它来命名这个项目再贴切不过了。

    这是一个免费、开源的离线服务器系统,它的宝贵之处就是:让人类最重要的知识在断网时代依然触手可及

    NOMAD 本质上是一座数字方舟,一个可运行于普通电脑上的离线知识中心。一旦部署完成,它就成为一个自给自足的“文明节点”——无需任何互联网连接,就能提供:

    • 维基百科全文:人类知识的总汇。让人类知识得以延续和传承。
    • 离线地图:完整的OpenStreetMap数据,断网也能导航1。水源在哪里?逃生道路在哪里?最近的安全屋在哪里?
    • 教育课程:可汗学院K-12完整课程。一旦末日降临,你可以为幸存下来的人类幼崽提供完整的基础教育。
    • 古腾堡计划:数万本公版电子书。目前我们还是需要有版权意识,但我相信如果真的末日降临,版权也就没有了。
    • 医疗与维修指南:关键时刻能救命的实用知识,让你能活下去!
    • AI 助手:基于Ollama的本地大语言模型,可以对话、写作、分析(支持GPU加速)。

    为什么它重要?

    商业世界其实早有类似产品,但价格不菲。NOMAD 的创始人说得很直白:这是给"有准备的人"的免费替代方案

    它的核心是数字独立:不依赖云服务,不交订阅费,数据和控制权完全在你手中。今天,它可以是房车或偏远小屋里的离线图书馆;明天,它可能是文明重启时的火种。

    即便末日遥遥无期,拥有一座属于个人的、永不下线的人类文明档案馆,本身就是一种极致的浪漫。

    安装

    • 硬件要求:最低2G的CPU,4G的内存,5GB的存储空间。
    • 软件要求:一套Ubuntu就可以。
    • 联网:这里需要注意的是,在国内可能需要科学一下。因为安装过程中涉及到的站点、安装后下载资料需要的站点,大部分都需要科学一下。

    准备就绪后,唤醒这座方舟仅需两行指令。

    这个项目完全开源,获取的资料也完全可自由获取。

    项目地址:https://www.projectnomad.us/

    我已经安装了最基本的系统,抓取了一些东西。让大家看下界面吧:

    Landing Page

    安装配套系统

    图书馆界面

    图书馆:续命指南:在冬日用什么取火

    愿末日永不降临。但若长夜将至,愿这星火长存。


    1. 目前我能看到的都是美国本土地图。 
  • 数学谜题总是那么让人着迷

    数学谜题总是那么让人着迷

    最近下载了一本书,叫作《Mathematical Puzzles》,我很喜欢。

    这本书讲什么?

    这本书汇集了300道难易不一的数学智力谜题——都是数学谜题中的经典且历史悠久——展示了如何用数学思维来解决各种有趣、甚至违反直觉的谜题。

    到目前,我看了50道题——完全能解出的,大概有10道,有思路的30道,ぜんぜん わからない(zen zen wakaranai)的有10道。

    这本书适合这样的你:喜欢逻辑推理、概率悖论和创造性问题解决等等。这本书里的例子大部分不需要正式的数学背景,却能提供大量的“Aha”、“Eureka”时刻!

    结构与组织

    从我看到的50道题目来看,难度分配还是有点挑战的:

    级别 比例 特点
    简单 ~74% 易于理解的”顿悟”时刻,日常场景
    中等 ~12% 需要特定数学概念
    困难 ~14% 非平凡证明,高级推理

    每道谜题遵循一致的格式:问题陈述 → 分析/解答,许多还包含可视化图表和"进一步思考"扩展。


    主题分类

    1. 概率与反直觉(约 12 道谜题)

    这里有很多反直觉的概率题。比如:

    • 星期二出生的男孩(困难):钱斯夫人有两个年龄不同的孩子。至少有一个是星期二出生的男孩。问:这两个孩子都是男孩的概率是多少?添加看似无关的信息(”星期二出生”)将概率从 $1/3$变为另外一个数字。
    • 硬币的另一面(简单):一枚双面都是正面的硬币、一枚双面都是反面的硬币,以及一枚普通硬币被放入一个袋子中。从中随机抽取一枚硬币并抛掷,结果是“正面”。问:这枚硬币的另一面也是正面的概率是多少?不是$1/2$!

    2. 博弈论与策略(约 8 道谜题)

    几道谜题介绍了基本的博弈论概念:

    • 生活是一碗樱桃(简单):完整的Nim游戏分析。
    • Chomp 游戏(困难):非构造性的”策略窃取”证明,先手必胜。
    • 下沉 15(简单):识别与井字棋的同构,揭示不存在必胜策略。

    3. 逻辑与演绎(约 10 道谜题)

    经典逻辑谜题,如果你看过《这本书叫什么》,应该对这类题目有兴趣。

    • 三个火星人站在岔路口(简单):一位逻辑学家来到火星。和逻辑谜题中的常见情形一样,她走到一个岔路口,想知道两条路中哪一条通往村庄。这里有三个愿意回答问题的火星人:一个来自永远说真话的部落,一个来自永远说假话的部落,一个来自随机回答的部落。逻辑学家不知道他们各自属于哪个部落。现在她只被允许提出两个是非问题,而且每个问题都只能问给其中一位火星人。她能否据此确定哪条路通向村庄?如果她只能提出一个是非问题,又是否还能做到?

    4. 几何与空间推理(约 10 道谜题)

    需要空间洞察力的视觉谜题:

    • 旋转的硬币(简单):一枚硬币绕另一枚滚动时旋转两圈,而非一圈(硬币旋转悖论)

    5. 不变量与守恒律(约 6 道谜题)

    通过识别不变量来解决的问题:

    • 细菌繁殖(简单):当两只pixo细菌交配时,会产生一只新细菌:如果父母性别不同,子代为雌性,否则为雄性。当食物匮乏时,交配是随机进行的,且父母在子代出生时死亡。因此,在食物持续稀缺的条件下,pixo细菌群体最终将减少到只剩下一只细菌。若最初群体中有10只雄性和15只雌性,那么最终存活下来的那只细菌为雌性的概率是多少?

    本书特点

    1. 低门槛,高上限

    大多数谜题只需要算术或基础代数,但解答通常调用复杂概念(贝叶斯定理、鸽笼原理、介值定理、策略窃取)。高中生也能理解,也能激发继续深入学习的动力。

    2. 现实世界框架

    谜题置于相关场景中:

    • 黑暗中打包衣物(鞋子、袜子和手套)
    • 乘渡轮穿越大西洋(遇见渡轮)
    • 分蛋糕带糖霜(简单蛋糕分割)
    • 从坏掉的 ATM 取款(坏掉的 ATM)

    读者可以很快代入场景。

    3. 多种解法途径

    4. 文化特定性

    一些谜题依赖特定领域知识。如美国时区和夏令时规;框住山城假设熟悉西弗吉尼亚州的地理;温布尔登获胜假设了解网球计分规则。

    目标读者

    说下目标读者:

    读者类型 适合度
    高中生 优秀——建立问题解决直觉
    本科数学专业 良好——通过谜题强化概念
    一般谜题爱好者 很好——几乎不需要先决条件
    数学教育者 优秀——现成的课堂材料
    专业数学家 中等——一些谜题是众所周知的经典

    网络资源

    我做了一个Wiki站点,不定期地更新这本书的内容。网址是:https://rsywx.com/math_puzzles。有兴趣的读者,可以收藏一下