AI在发展,我们怎么办?

(本文非常长,但结尾处有福利送上。)

限于条件,从22年底到现在,我其实并没能好好地用上最新的AI工具。不过,我总算也是通过各种方式,在还算“最近”的时间里,接触了不少最新的东西。

昨天,在现代传媒大厦22楼的星辰仕达举办了一场“AI+智慧医疗”的分享会,我和分享嘉宾之一的、微软昆山工业元宇宙应用中心的Nick聊了一会,有了点想法,就凑一篇文章,总结一下我一年多来,使用各类AI的体会和感想。

ChatGPT以及同类

(我没有ChatGPT 4,所以在下面提到的回答和截屏,如果没有特别说明,我都用微软的Copilot。)

ChatGPT是我们到目前为止最熟悉的AI应用,也有了很多变种。但是它们最基本的应用,都是:接受提问,提供回答。

仔细分析下来,其实我们在寻求三种不同的回答:

事实性的

这是最简单的,也应该是最“准确”的。这里,我给“准确”打了引号,因为对于一个事实性的问答来说,我们不去追究“原始事实”的准确性。换句话说,如果AI搜索到的所有资料都说“莫拉维拉共和国成立于1487年”的话,那么AI经过一定的算法后告诉我们这个共和国成立于1487年没有什么问题,是准确的。但这个信息不一定“正确”。

这里涉及的问题就非常根本了:

第一个问题就是:即便AI能给我们数据,我们可以对这些数据有多大的信心?

AI获取数据的来源、处理数据的“规则”中,有没有所谓的bias(偏见)?

我们对这种类型的偏见其实一点都不陌生。在人类历史上,曾经有过——甚至现在还有——基于种族、性别、肤色的种种偏见以及种种歧视,并引发了种种悲剧。到了较近的年代,网络时代的“地图炮”也是一种典型的偏见——当然还有种种根植在思想中的固有偏见(“男的没一个好东西”,“女人穿得暴露就是在勾引人”……),我就不一一列举了。

我们完全可以相信:一个在预设偏见的前提下训练出来的ChatGPT必然也只能给出充满了偏见的回答。所谓的rubbish in, rubbish out,说的也是这个道理。

第二个问题就是:我们有没有办法去判定一个回答的真实性?如何判定?

这个问题其实有点悖论的味道:如果我知道一个正确答案,我还去问AI干嘛?我之所以问AI,可不就是因为我不知道答案嘛?

从我目前使用的情况来看,AI对于纯事实性的回答,还是比较可信的。早期AI问答中出现的那种“一本正经的胡说八道”已经不多了。

在纯事实问答方面,AI的附加值在于:它博览群书,记忆超群,但它不能替代你的研究。

所以,我可以想象到的一种最合理的应用场景会是:

作为在某个领域有一定经验和积累的人,向AI询问针对领域的一些事实问题——这样的回答很容易得到验证。
同时,随着对话的深入,可以向AI询问一些尚未有定论的问题,AI应该可以基于它掌握的数据,给出一些判定。
这样的过程,是有助于此人在这个领域的学习和研究的。

推理性的

说老实话,我对AI的推理能力还是有点不放心的。我用了一个最基本的“君子小人岛”的问题来测试。

我先让Copilot进入角色:

我:你现在是一个逻辑学家了。我需要你帮助我进行一些逻辑推理。
Copilot:当然,我很乐意帮助你进行逻辑推理。请告诉我你需要帮助的具体问题或情况。😊

然后再引入前提:

我:有很多谜题是关于这样一个岛的:这个岛上的居民一些是“君子”,他们总是说实话,另一些是“小人”,他们总是说谎话。这个岛上的居民不是君子就是小人。
Copilot:我明白了,你提到的是一个经典的逻辑谜题类型,通常被称为“君子和小人”的问题。在这类问题中,"君子"总是说实话,而"小人"总是说谎。你的目标通常是通过提问来确定一个或多个居民是君子还是小人。
请告诉我具体的谜题,我会尽力帮助你解决。😊

(看得出来,Copilot心情不错,很会卖萌。而且,它似乎自信满满,用上了“经典”、“通常”等词。)

然后我提出了我的问题:

我遇见三个人A、B、C。每个人不是君子就是小人。A和B做出了如下的陈述:
A:我们都是小人。
B:我们中正好有一个君子。
A、B、C各是哪类人?

出乎我意料的是,Copilot完美地解决了这个问题!而且给出了推理过程:

我表示:答案对了,但推理过程还很模糊。于是Copilot进一步详细列出了过程:

对此我是很surprise的!

我不甘心,给了它一个更难的问题:

在这个岛上,我遇见两位当地人A和B。他们进行了如下的陈述:
A:B是君子而且这个岛是玛雅岛。
B:A是小人而且这个岛是玛雅岛。
这个岛是玛雅岛吗?

我们先看Copilot的回答:

很抱歉,Copilot的推理出现了严重的错误。正确的答案是:这个岛不是玛雅岛。但为了防止AI从我的回复中学到推理过程,我将这个推理过程留给各位读者去思考了。

创造性的

在昨天的演讲中,Nick分享了两张片子,是他分别用中文和英文“求助”Copilot,如何写当天要用的PPT——当然,我才不信他会用AI的提示来完成昨天的PPT!


(两个提示词的意思基本相同。回答的质量有很大的差别。另外,我昨天在现场,但我认为Nick根本就没有按照这个提纲,虽然可能用到了一些思路和数据。)

一个高度创新的东西是没有办法用现有的东西去验证其真伪的,我们只能说对提问者“有没有用”?所以,在这一类型的问答中,AI给出的答案可能有用:能帮你开拓思路,提供新的讨论点,给出基本的数据,做好最基本的框架,完成一个几乎“有着标准答案”的工作汇报……但更多情况下,可能毫无用处:如果你不能appreciate它的回答的话。

所以,对于Nick这样一位highly innovative的人来说,我相信他在提问前,脑子里已经有了一些想法(所以才能写出那么长的提示词),再根据回答(知道数据正确,发现新的讨论点),最终还是老老实实地回到电脑上写PPT去了(当然也会不断借助Copilot来辅助)。

衍生话题:更有创造性的”回答“

2月份的时候,Sora出世,那一段“A stylish woman walks down a Tokyo street…”的视频引爆了眼球。这是在图像、视频上的突破。

不久前,Suno出世。这次是音乐!

从文字到图形到视频到音乐,AI在越来越抽象的、也越来越专业的领域快步前进!

能比音乐更抽象的是什么?我很期待!

最后,送上我用Suno编写的一首歌曲,歌长约2分钟。你听出来是关于什么的曲子了吗?欢迎留言!

最最后,我说说我的判断:我从来不觉得AI是个挑战,或者会威胁“我”的工作,它不过是个会卖萌、偶尔会出bug的工具罢了。

(大家想想AI最有成就的领域是在哪里,就会同意我的判断了。)

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *