生活在远方

Tag: 逻辑

让我来康康AI可以有多“靠谱”？

Google沉寂了好一段时间，前两天放出了一个重要的模型升级：Gemma 4。我下载了、运行了。

我用的测试工具比较多，包括：Visual Studio Code（VSC）中的Github Copilot（自动选择模型），Ollama（Gemma 4 31b），还有国产的豆包。

其中，本地跑Ollama的桌面机配了一块5060 Ti 32G的显卡。

我一直有收藏文档做站点的习惯，所以这次我就从我的维基站点中的两个专栏里随手拉了一些题目：

第一题

爱丽丝来到遗忘林的时候，她不是所有的事情都忘记了，她只是忘记了某些事情。她经常忘记自己的名字，最容易忘的是星期几。狮子和独角兽可是林中的常客。他们都是很奇怪的动物。狮子在周一、周二和周三撒谎，其它日子说实话。而独角兽呢，正好相反，它周四、周五、周六撒谎，而其它日子说实话。这天，爱丽丝遇见狮子和独角兽在树下休息。他们做了如下的陈述：狮子：昨天是我说谎话的日子。独角兽：昨天也是我说谎话的日子。爱丽丝是个非常聪明的女孩，她从这两个陈述就可以知道今天是星期几了。那么今天是星期几？

这是一道入门题。所有的AI都可以得到正确答案。但Gemma的推理过程比较突出：它检查了周一的情形后，总结出：无论是狮子还是独角兽，能说出这句话的日子和前一日必须是处于不同的说真话还是说假话的日子。所以，很快，它推理出狮子只有周一、周四，独角兽只有周四、周日，才能做出如题的陈述。所以，当天只能是周四。这个推理过程非常有意义。

第二题

莎士比亚的《威尼斯商人》中，鲍西娅有三个首饰盒：金的、银的和铅的。其中的一个盒子中放着鲍西娅的肖像。求婚者要在其中选一个盒子，如果他足够幸运（或者足够聪明）选到了有肖像的那个盒子，他就可以娶鲍西娅为妻。每个盒子的盖子上都有一段铭文来帮助求婚者做出聪明的选择。现在，假定鲍西娅希望选择她的夫君时，不是基于他的品德，而只是基于他的聪颖。她在盒子上刻下了如下的铭文：

金银铅

肖像在这个盒子里。肖像不在这个盒子里。肖像不在金盒子里。

鲍西娅对求婚者说明，这三句话中，最多只有一句是真的。求婚者该选择哪个盒子？

这道题也不难。所有AI都可以得到正确答案：求婚者应该选择银盒子。

Gemma和Copilot的推理过程相似。它们都敏锐地判定出：由于金盒子和铅盒子上的陈述互相矛盾，那么这两个陈述肯定有一个为真。而题目中说“最多只有一句为真”，那么银盒子的陈述就是假的。既然如此，肖像必然在银盒子里。

（以上两题来自我最喜欢的逻辑书《这本书叫什么？》。我选了其中最入门的两个章节中的两题。）

第三题

Life Isn’t a Bowl of Cherries 你和朋友Amit面前有4只樱桃碗，里面分别装着5,6,7,8颗樱桃。你们轮流行动；每次可以任选一只碗，并从中取走至少1颗樱桃。如果你先手，并且想确保最后一颗樱桃是Amit取走的，那么你的第一步应该从哪只碗里取走几颗樱桃？

所有AI都知道这是一道有关NIM sum游戏的策略题，并给出了第一步操作：从8颗的碗里拿走4颗，并解释了其中的数学原理：各个碗的樱桃数量的异或值为零是本题的关键。

但只有Gemma明确指出：这个所谓misere Nim（确保对手赢）游戏，策略和常规的Nim（确保自己赢）游戏，策略是一样的，直到最后一步。

第四题

Spaghetti Loops 把50根煮熟的意大利面看作50段线段，它们一共有100个端点。现在把这100个端点随机两两配对并打结。问：最终形成的闭合面条环（loop）个数的期望是多少？

三个AI表现正常。但豆包只有第一步推理是对的：它知道在第一次挑面条的一头，并和任意另一头打结的时候，成环的概率是$\frac{1}{99}$。但它太早进行一般化，简单地将这个概率乘以了50。经过一次提示，它正确地得出，最终形成闭环的期望是$\frac{1}{99}+\frac{1}{97}+\frac{1}{95}+\cdots+\frac{1}{3}+1$。但在计算这个公式的时候出错。经过再次提示，得到了2.937…的正确结果。

（以上两题来自我最近开始整理的《数学谜题》。）

====

我觉得吧，AI能帮我总结东西、帮我做PPT都是极好的。但要是能帮我学习逻辑、学习数学，从而可以真正地与它开展严肃的讨论，那才是更好的。

April 4, 2026
Argumentum ex silentio
今天看看第三种、最后一种有缺陷的论证方式：Argumentum ex silentio（Argument from silence，默证）。

（前两种的链接：Argumentum ad ignorantiam，Argumentum ab auctoriatate）

Argumentum ex silentio指的是，根据文献中没有记载一样东西、一件事情，而不是根据明确记载了一样东西、一件事情而得出了结论。

在历史分析中，大部分时候我们依靠作者告诉了我们什么并由此进行分析和判断，但默证正好相反，它假定作者“应该”知道并说出一件事情——而且这件事情本身足够重要，但作者没有这么做。既然如此，那么这件事情就应该是不存在的。

例如，西塞罗对卡托（Cato）演讲作品的“沉默”。由此的论证——卡托没有说我们认为他要说的东西——就很有力，因为卡托这个人物在西塞罗的《布鲁图》中太重要了，西塞罗只要有可能，就一定会引用卡托的谚语。这是一个成功的例子。但同样，西塞罗对卡里乌斯（Caelius）当任财务官（questor）保持沉默就不具有同样的论证力度。

用类比三段论的形式来描述就是：
1. 某份现存的文件D中，没有提到事件E的发生。
2. 已知D的作者有意列出属于E类型的所有事件。
3. 那么E被认为是一类如果发生，则作者不会忽视的事件。
应用到现实生活中的时候，有这么一个很好的示例：

A（问B）：B，我的车钥匙放哪里了？ B：（保持沉默） A：我就知道是你拿走了！

显然，B很可能并没有拿走车钥匙，也根本不知道车钥匙在哪里。B的沉默不代表他应该知道钥匙何在，更不能表明他拿了钥匙。拒绝分享证据不一定能表明对论点的支持或反对。B只是不想分享而已。

再看一个例子。

A：哦，B，你知道我有多么爱你！ B：我怎么能够知道？ A：（不说话，深情地看着B） B：（感动）哦，是的。我知道你爱我。、

这种方法之所以有效，是因为“假想中的理由”通常比真正的理由更加有说服力。这个技巧非常有用。但沉默不能替代论证或证据。一般来说，缺乏证据本身不能成为证据。但是，有很多时候，不讲出证据的理由本身可能可以被视作证据。在这个例子中，要求B/A给出一个理由说明他为什么保持沉默，是可能成为证据的。

另外，“积极地保持沉默”——主动地选择对某事表示沉默（比如表明不应对某事进行批评），则可以被认为是对该市表示了一种沉默地支持。国际事务中，此类事件不少。我们可以举一个假想的例子：某国存在严重的恐怖主义活动，但却没有做出任何有效的措施来抵制、消灭此类活动。这种“不进行惩罚”的举动事实上“鼓励”了此类活动。

说实话，在我讨论过的三个论证方式中，这个论证方式是最让我感到捉摸不透的。仔细想想，也许我也曾经犯过此类错误。在不知不觉间，就进行了Argumentum ex silentio。
March 10, 2020
Argumentum ab auctoritate
今天我继续来讲一种有缺陷的辩论方式：Argumentum ab auctoritate（Argument from authority，诉诸权威）。

（前文“诉诸无知”的链接。）

诉诸权威指代两种论证方式：
1. 诉诸权威的非谬误性论证，基于对一个或多个权威来源其权威性的主张。这些来源对相关问题的观点可能是正确的。特别地，就问题所涉及的权威而言，他们确实是所讨论问题的专家，他们的意见为结论得出了有力的归纳性支持，使得结论可能是正确的，但不一定就是正确的。因此，权威人士的观点只能强烈表明什么是对的，但不是证明它是对的。
2. 逻辑上谬误的诉诸权威将主张建立在非权威的来源。来源之所以不是权威，可能有多个原因：比如他们不同意对某问题的共识，在相关问题上不具备专业知识或者其他。
非谬误性论证基于如下的三段论：
1. 某一个专业的专家通常都是对的；
2. 该专业的专家一致认为Q是对的；
3. 所以，Q很可能是对的。
最常见的一种诉诸权威的谬误形式是：
1. E是某主题T的专家；
2. E说一个有关另一个不相关主题T’的问题Q是对的；
3. 所以，Q很可能是对的。
具体我们来看几种例子：
- 诉诸自我权威。
如果某人诉诸自我权威，被称为ipse dixit（“他自己说如此”）。比如，一位母亲不相信她的儿子会犯下滔天大罪，这样说道：“我还不知道我儿子吗？他不会做出这种事情来的！”
- 诉诸尊重。
我们经常会引用名人名言来增加自己论点的力度。但问题在于，这些名人只是因为他们被尊重才有了权威。比如，很多人会引用爱因斯坦关于政治和宗教方面的文字，但我们不该忘记，爱因斯坦是个物理学家。很多蹭热点的公号，在文章中总不会忘记引上一个某某博士的言论，也是如此。
- 诉诸非权威。
政治中这样的做法很常见，即认为普通大众应该更比那些具有尖端知识的学者有“常识”；或者出现在阴谋论中。

这种诉诸方式，比我们之前讨论过的更难反驳，也更具迷惑性。

首先，我们没有足够的资源去认定某个专家是不是某个领域的专家。就像《绿野仙踪》里那位奥兹国的大法师对稻草人说的：

不用说，每个人都有自己的脑子。那是一种非常平庸的物件。……在我的家乡，我们有大学，一个学识渊博的地方，人们在那里成为了杰出的思想家。当他们毕业时，他们有着深刻的思想，但脑子不比你好使很多！但是，他们有一样东西是你没有的：文凭。

很多时候，我们凭借一个“文凭”就轻易地接受了对方的专业地位。但此人是不是在所讨论的问题上也有着同样的专业地位，我们不得而知，也无从判断。在此情境下，盲从权威是很危险的，更是不恰当的。

其次，虽然我反对动机论/目的论/阴谋论，但在当下，从动机论/目的论/阴谋论出发，可以帮我们过滤很多所谓的“专家言论”。我们也许永远无法判定他的目的，但可以从其过往的言论中找到脉络——一种元规则。如果此言论违背了此人之前的一贯元规则，那么该言论的置信度很低；如果此言论符合一贯元规则，但你已经知道这种元规则存在很大的问题（有着明显的动机/目的/阴谋），该言论的置信度同样很低。

无论哪种情形，“有另外一种声音”才是更好的。
March 4, 2020
Argumentum ad ignorantiam
Argumentum ad ignorantiam或者Argument from ignorance，通常翻译为“诉诸无知”，是一种常见的逻辑谬误（logical fallacy）。

“诉诸无知”在论证时的出发点是：某事是对的，因为它还没有被证明是错的；某事是错的，因为它还没有被证明是对的。

（以下引例等均来自维基百科相关页面，不再一一指出。）

我们来看几个例子：
1. “这种药一定很安全，因为还没有人发现其有任何毒性副作用。”
这只能表明对这种药进行的测试已经完成，但并不是说对这种药进行了完整的测试。
1. “A从来没有表示反对堕胎，所以我们可以很保险地说ta会赞成堕胎。”
这个很简单：A没有表示反对，并不一定说A是支持。
1. “新冠一定是美国人搞出来的。不然还能有谁？”
既然还没有别的解释出现并被证明，那么我说的就一定是对的。

这个逻辑谬误有两个重要的特点。

首先，它认为这个世界上的所有事情只有两个选项：非此即彼；要么对，要么错。但实际上，这样的选项有四个：对/错/未知/不可知。比如，在上述第二例中，A的态度是未知的。如果必要，我们自然可以要求A发表立场，但不能基于A没有表态而先验地为A预设立场。在上述第三例中，结果不仅现在是未知的，而且更可能是不可知的——或者说会保持未知很长很长一段时间。

其次，诉诸无知通常会将举证的责任转移给另一方。而逻辑规则表明，一般而言，“谁主张谁举证”。

这几天，我在各种场合见过很多这样的人。前段时间看书，正好看到一些我觉得很有意思的拉丁文短语，就随手记了下来。今天正好有点空，想起自己也好久没有写东西了，就写篇小文。既是普及一两个拉丁词/短语，也是将自己思考的一些东西记录下来。

（如果过两天还有空，我会继续介绍另外两种辩论中出现的问题：Argumentum ab auctoritate和Argumentum ex silientio 。）

对于这个谬误，有一个很好的短语说明：Absence of evidence is not evidence of absence. 我试图翻译一下： 手上没有证据，并不能说证据不存在。

与各位共勉。
March 1, 2020
海底捞罪不致死

最近朋友圈被“海底捞”事件刷了屏，朋友圈也很有意思地分成两个阵营：一部分“当然是选择原谅它了”，一部分认为海底捞不死不足以平忿。

好友pMq写了一篇《相比海底捞，我更希望华为倒闭》的文章，写的很深刻，非常值得一读。

我不惜狗尾续貂，接着写一点。

一、好的公关要好过不好的公关

人总是会犯错的，法人也是如此。犯了错，死不悔改、强行辩解、华丽（让临时工）背锅、的事情，我们见了不少。比如华为P10的闪存门到现在好像都没见华为官方出面来解释一下。

在我看来，衣食住行用的东西都在一个级别上。不会因为吃的东西因为要过你的肠胃在本质上就（比穿的东西、用的东西）更严重一些。

如果不能理解这一点，请停止阅读，因为后面要说的东西只会更复杂。

（我是分割线）

（我是分割线）

（我是分割线）

（我是分割线）

（我是分割线）

很好，让我们继续。知道犯了错，而且知道应该怎么改，而且让大家知道将要怎么做，而且欢迎大家监督爆料。这是好的公关。这是任何一个企业，在面临危机时的必然反应——差别只在于有人做得好，有人做得不好罢了。

二、更深的问责不在这一家店

海底捞已经在开始排查，从一方面来说，海底捞已经认识到了两点：

第一，可能有其他的店有类似的问题，所以要先开始内查；

第二，趁着你们记者、大佬还没有我其他店也可能同样乱七八糟的证据，我先做点工作，将这些证据永远地消灭掉。

这才是漂亮的做法。

对于我来说，我更关心的问题是：对于海底捞而言，这个食品卫生问题是系统性的问题，还是个别一两家门店的问题？

如果是一两家门店的问题，那么大家还是洗洗睡吧。

如果是系统性的问题，那么……我们也已经失去了进一步调查的机会和可能。

（也因此，我对爆料的这位记者和他的主编表示深深的失望。你们不会是海底捞的助攻队伍吧？）

让我来略微YY一下。如果我是一名记者，发现了一家店存在的问题，我应该怎么做？

为了让新闻更有价值，首先当然是保全证据，然后是想办法去这个城市里其他的海底捞店探访，看看是不是有同样的问题；不论有没有，我都会让我在别的省市的记者朋友，对海底捞进行同样的查访。

这样的过程也许要持续个6-12个月，收集不同城市海底捞的卫生情况，分析食物的卫生指标，这才是你们这些“一天到晚想搞大新闻”的记者应有的做派啊！现在像个什么样子？TYTSTN！看看别(guo)的(wai)获奖新闻工作者是怎么做的吧！

三、问题永远比答案多

我不是海底捞的五毛党。我也不会因为它卫生情况不好、危机公关做得比一般人好而对它有好感。我只是就事论事，这一两家店的问题还远远到不了让海底捞法人吃官司的地步，就算海底捞法人吃官司，也不等于海底捞就此在工商除名。要让海底捞垮台，还有很多很多的步骤要去做。各位监管部门、记者、受尽委屈现在有话不得不说的“前员工”、“前高管”请拿出更多的证据来。

pMq的帖子里说到监管缺位的问题。我只能部分同意，因为这是一个系统的问题。

如果最终发现，海底捞确实如此不堪——我接受我自己怀着最大的恶意去揣测，所以这样的结果不会让我surprise——那么这也是一个系统的问题。一个系统规则如斯，就只能孕育出如斯的结果。这是一个决定论的东西，但是很混沌。

但是要理解起来也很简单。

爱丽丝在森林中迷路的时候，遇见了大头玎（Tweedledee）和大头珰（Tweedledum），这两位兄弟给爱丽丝上了一堂绝妙的逻辑课（译文来自此处，略作修改）：

“我知道你正想什么呢。”大头珰说，“但不是那么回事，压根儿不是。”

“反之，”大头玎接着说，“如果是这样，就可能是；假设是这样，就可能会；但既然不是这样，就不是也不会。这就是逻辑。”

是的，这就是逻辑。

August 29, 2017
《数学与科技》出版及译者序

2016年5月的时候，我接受电子工业出版社郭景瑶编辑的邀请，担任《数学与科技》一书的第二翻译，负责其中的数学部分。

此书一年后终于出版，皆大欢喜。

一、我为什么愿意翻译数学部分？

从小到大，数学算是我学得比较好的学科。高考的时候数学拿了117/120，也是一个很高的成绩。到了大学后，各类数学扑面而来，虽说很多人“挂在了高树（数）”，但我没有这样的问题。

数学是很纯粹的学科，因为它基于少量的公理、严格的推理、对数字进行运算。这里没有任何花哨和投机取巧的可能。拼的是思维。

这和我喜欢编程一样。对我来说，编程（以及数学）是为数不多的一种过程，只要你自己能够从正确的地方出发，用正确的方法工作，就能得到正确的结果。

试问，这个世界上哪里还有如此直截了当的东西呢？

我们看过那么多的成功学作品，但是按照书里的东西去做，能成功的又有多少比率？

这么一想，数学实在是很纯粹。

这是我喜欢数学，喜欢翻译数学文章的道理。

我自己的维客上，就有我翻译的霍金的作品《上帝创造了整数》，是我闲来练笔的东西。

二、我为什么喜欢阅读数学？

我们不可能都成为数学家。正如我之前评论杨绛的《洗澡之后》的文章中写道：

对一个作者的喜爱，往往不一定要喜欢他/她的每部作品，到了一定时候，就是“收藏”——我们大多数人不会有机会与我们仰慕、喜爱的大家进行面对面的交流，或者书信上的交流，于是不免“得意”于说一句：他/她的作品我都看过。再不济也能说一句，他/她的作品我都有收藏。

所以，对于数学的喜爱，有点类似——也是在收藏人间的最接近真理的东西，不过还有更多：那是一种因为接触到真理以及真理背后蕴含的那种不可辩驳的美之后，带来的震撼和不同程度的共鸣。

试问，这个世界上又还有哪些东西能给我们带来这样的震撼和共鸣呢？

三、我对广大读者的建议

还是应该读一些纯理论的东西，比如数学。

如今有不少书，特别是社会类的，往往从似是而非的立论出发，经过貌似严谨（有些确实很严谨）的推理，得出一堆结论，拼命想在我们的脑子中占据一席之地。而有不少人就此中了招：自己本身的脑子里空无一物，也就没有了判断力，于是不加思索、不加判断地就将这些东西放了进来。从此之后，“铅球碗载，一团浆糊”，再能进入脑子的东西就有了定式。

我是追求元规则的人，一个理论是否自洽（既完备又一致）是我决定是否接受这个理论的前提。虽然哥德尔证明，希尔伯特的想法（证明所有的真数学命题可以被证明，即数学的完备性；证明只有真数学命题才可以被证明，即数学的一致性）不过是妄念，而图灵进一步证明不存在一种判定过程，来确定任意给定数学命题的真伪。所以，这也许会将我们带入不可知领域，但是别忘了，一个系统的自洽与否虽然不能在系统本身证明，但我们在一个更高的（包含待证明系统的）系统里还是可以做到这点的。

哥德尔和图灵从来就没有否认当今数学系统——乃至所有系统的价值，只是说它们一定不能又完备又一致。因此，我们完全可以从一个更高的角度去审视我们所看到的那些所谓系统的完备性和一致性。

试着从那些所谓系统的“公理”出发，按照最严谨的推理流程，来看看是否能得到有矛盾的两个结论或者得到一个在更大的、包容该系统的系统中显然荒谬的结论。

这样的过程，才是思考的过程。

July 26, 2017
《这本书叫什么》电子书ePub版

今天是国庆，放点东西给大家共享。 http://www.rsywx.net/download/bookname.epub[《这本书叫什么》](http://www.rsywx.net/books/01585.html)的ePub电子版本。

这个版本是基于我自己的粗略翻译，不敢和原来最初版康宏逵先生的翻译媲美，只是练笔同时方便做成我自己的电子版本。

本ePub版本按照cc-by-nc-sa发布。欢迎下载、分享。

2017.10.11更新：我原以为这个帖子会隐藏得很深、很深，不会有人能搜索到这里。但是，有。

上文的链接已经失效，我也不会再提供ePub的下载，但是我已经将我自己翻译的版本做成了Wiki，敬请移步此处浏览本书以及其他更多内容。

October 1, 2011
美哉，逻辑！

在我读大学那会——我清楚的记得是在大二之前——曾经清楚的记得我看过这本书，我对这本书印象实在是太深刻了。

从一些日常的小故事出发，作者自然而然的将我们导入著名的哥德尔不完备定理。作者对专业知识的掌握，对将专业知识转化到流畅、幽默的日常语言的掌握，实在令我敬佩。

从2001年开始，我就一直在找这本书当年的译本，但是所有的尝试都告失败。我甚至打电话给我大学的同学，我确认我当时看到的书是他买的。他在惊叹了我的记忆力并仔仔细细的搜索了一下他的藏书后，也只能遗憾的告诉我，这本书他也找不到了。

到了2009年底，我决定不再等待，委托我在美国的朋友在美国的亚马逊网站上买下了这本书的原版，花费了大约500元人民币。

当我在我的博客上欣喜的宣布这个消息时，也有人善意的问我：这本书值500吗？我的回答是：当然值！

确实，一本书的价值是无法估量的，如果一来它本身就是经典；二来它可以教给我很多东西；三来我会选择在一个适当的时期重新阅读它；四来我甚至会选择将它翻译为中文！

我买进这本书是在2010年1月14日，我花费了大约1个月的时间，在2月16日，农历庚寅年正月初三这天翻译完了这本书。全书约10万字，我平均每天码字3000。这是一个辛苦但是快乐的工作。

在我翻译过程中，借鉴了康宏逵先生当年的译本。他的翻译更加生动有趣，这些我实在是望尘莫及。

翻译这本书，是给我的儿子彼得。希望他能喜欢这本书。

February 17, 2010
《这本书叫什么？》原版书入手

What is the name of this book?，作者是美国的Raymond Smullyan。最早看到这本书的中译本是在我大学一、二年级的时候。一直想寻觅这本书，甚至联系上了当初拥有这本书的我的大学同班同学。他对我的惊人的记忆力表示orz之后，又很遗憾的告诉我，这本书他也找不到了……

于是，我只好请我国外的朋友在Amazon买。这本书初版价格是10美元，现在暴涨到了差不多80美元。我差不多花了500元人民币买下了这本书。一方面是怀旧、一方面是收藏、一方面是显摆……

January 14, 2010
千年文书好割药

“千年文书好割药”是我父亲经常讲的一句话，如今我对此有了更深的领悟。

最近有好多豆瓣上的人向我索取《这本书叫什么》的电子档。这本书我在读大学的时候看过，然后在2001年左右通过CSDN的朋友找到了电子版本，就一直保存在我的电脑里。现在又派上用场了。我还有不少电子书籍，看来更不应该删除了。为了方便大家下载，特给出下载地址：

http://www.rsywx.net/download/bookname.zip。

放在我自己的服务器上，应该很保险了。

2021年09月29日注：因为网站改版，所以我已经将这本书全部迁移到了我的维客站点，请有兴趣的读者移步。

September 29, 2008

生活在远方

是的，因为真正的生活是在远方

Twenty Twenty-Five

Designed with WordPress