为什么说判断力是一种架构能力,以及为什么AI缺乏判断力

这一篇谈谈AI的局限性。

上一篇文章提到,判断力是人类在AI面前的优势之一,判断力也是一种架构能力,这个话题其实很有意思,值得展开谈谈。

判断力的来源

试想一下当我们听到一条新闻消息,我们会如何判断它的真假?

虽然通过消息来源可以区分出一大部分不靠谱的消息,但仅仅根据信息来源判断是明显不靠谱的,即使是所谓的官方消息,也免不了造假的可能性。在那些真正重要的事情上面,我们可以信任谁呢?除了自己以外,我们谁也不能信任。

判断力是我们依靠自己而非他人来判断信息真伪的能力。交叉验证可能是最容易想到的办法,当你的同事慌张的告诉你你家里着火了,你第一反应可能会给家人打个电话,或者赶紧亲自跑回家去看一眼。这些动作都是在搜集更多信息,以确认这个坏消息是不是真的发生了。在短时间内,如果多个消息源都显示出证明某个事实的证据,我们就能更加确信这件事情是真的。

交叉验证的理念,就是所谓调查研究。当我们想证明什么,就会想尽办法去搜集更多与这件事情相关的信息,从而为交叉验证提供素材。假若交叉验证都指向同一结果,那么自然没什么问题。但如果交叉验证的过程中各个事实指向的并非同一结果,甚至指向完全相反的事实,这时候问题就变得复杂了,就好像两块手表永远无法告诉你确切的时间。

在做判断时,人们常常犯的错误,是摒弃那些与预想不同的信息,仅仅保留那些直觉希望看到的信息。这种选择性接受信息的行为往往能让人的出一些令人匪夷所思的结论,就好像虽然明明窗外艳阳高照,但如果手上的两块手表都告诉你现在是深夜,仍然会有不少人选择相信手表,可能还会联想到时区或者是其他什么问题。凭直觉做出这种荒谬的结论,那活该被扣上“不理性”的帽子。

直觉是不可靠的,更理性的思考方式,是使用“逻辑”这个强大的工具,将我们获得的信息进行处理之后再下结论。比如手表1是一块机械表,手表2是一块能够通过互联网同步时钟的电子表,且手表2当前还处于有电的正常工作状况,我们也许还会去检查手表2的互联网连接是否正常,如果都一切正常,那么手表1因为各种原因走时出错的可能性就会大得多,我们就会自然更加相信手表2给出的信息。人脑天生有强大的逻辑能力,当我们从两块手表获得不同的时间时,我们的大脑会调用更多的信息来辅助判断。

因此,要判断一件事情是否为真,除了判断消息来源外,还有另外两个要素,一是逻辑推导能力,二是提供辅助信息。消息来源其实就是辅助信息的一种。

信息的拆分与合并

先来看逻辑推导这件事儿,基本逻辑运算很容易,无非是“与”、“或”、“非”三种,逻辑运算本身并不是什么问题。困难的地方在于如何将信息其拆分或者合并成用于计算的素材,也就是信息处理的过程。

还是上面的例子,假设我们获得了两条相互矛盾的信息,“手表1报时3:01am”,“手表2报时2:59am”。这两条信息并不能直接进行逻辑运算。或者说,光凭这两条信息,我们无法推导出任何结论。你可以试试把这两条信息输入到GPT中,让AI也来烧烧脑。

之所以我们能够继续推导而AI很难做到,就是因为我们会自然的对信息进行加工。首先,我们会自然的从提取一些信息合并进来,比如“手表1报时3:01am”就成了“一块在床头柜里放了1个月的机械表,它是5年前买的,在刚刚我拿起来看的时候显示时间是3:00am,另外它有黑色的表带,外壳有点裂纹”等等等等。在真正做判断时,我们大脑使用的信息远不止这一句话,大脑的信息储备放在那儿,所有信息储备都是做这个判断的辅助信息,它们会根据某种规则被提取,然后合并到原始信息中。这个例子里,我们甚至还会联想到购买那块机械表的那次旅程,机械表的品牌、价格等等。当然,不只人类是这样,AI其实也是这么做的。

合并进来大量信息后,下一步要做的就是对信息进行拆分,目的是让信息变得可以比较,能够被用于逻辑推导。我们经常把这部分说成“把书看薄”的过程,信息拆分是复杂的,因为信息是几乎可以被无限拆分和重组,这种拆分有无数种可能性,究竟拆分成什么样的粒度才可以用来进行逻辑推导呢?没有一个公式,也没有标准答案。

还是手表的例子,再经过一系列信息处理后。我大概获得这么两信息:“手表1是一块一个月没戴过的机械表”,“手表2是一块功能完好且连接着互联网的Apple Watch”。这样就好判断了,很明显手表2是准的更容易让人相信。既然如此,那就很容易推导出“手表2报时2:59am”这句话是真的的可能性就更大。

判断力的核心是架构能力

在刚刚提到的这个过程中,我只提到拆分信息的方法没有公式和标准答案,但如果继续追问究竟该怎么拆分信息呢,我其实没有给出过程,只能姑且理解成靠直觉。

还是这个例子,假设另一个人经过信息处理后也得到了两条信息“手表1是一块看很酷很新的机械表”,“手表2是一块成色很差的电子表”,那么他就很容易推断出手表1是准的,这就显然出错了。但是,我们再考虑一种情况,如果他得出的信息是“手表1是一块看很旧很破的机械表”,“手表2是一块成色还行的电子表”,然后判断手表2是准的,那他也可能“蒙对”。这有点像在完成中学试卷里的选择题,不管这个人是否能蒙对答案,他的过程看起来都是全错的。

一旦有新的问题出现在面前,比如又出现了“手表3报时3:02am”这样一条信息,同样的,我们仍然会组合与拆分出更新的信息来做判断,重要的是,前面的信息拆分方式可能并不适合新的判断场景,我们需要寻找新的信息处理方式。

这种处理信息,生成对信息进行拆分和重组方案的能力就是架构能力。从这个例子我们可以看出,其实架构能力才是区分判断力高下的核心要素。在这个判断手表准确与否的问题上,即使能够判断对一两次,如果用于判断真假的架构就是错误的,那么未来迟早会犯下重大的错误。架构是一种形而上的方法论,它起到指导人脑思考方向的作用,架构能力很重要,判断力的核心其实是架构能力。

AI是否也有架构能力呢?当然有,机器学习的训练过程,实质上正是为AI提供了一套信息处理的架构,使得AI能够按照某种对信息重组和拆分的方式处理信息。随着AI模型日益庞大,AI的能力也与日俱增,尤其是ChatGPT这类产品的出现,使得AI在语言文字信息这种特定模态的信息处理架构日益完善。

人脑在架构能力上的优势

老实说,在很多情况下,AI在信息处理上都能领先人脑。其中AI最大的优势之一便是它拥有庞大的数据库,面对同样的问题,AI就是一个博览群书、识古通今的天才,能够快速的从历史数据库中搜索出相应的辅助信息来生成答案。在一些创意类的工作中,AI甚至能通过对海量案例的排列组合,创新出人脑无法想象的内容,让人叹为观止。

回到判断力的问题上,AI就不如人类了,这其中最重要的原因恐怕还是数据的缺失。

AI是缺失多模态信息的。我们常说AI没有情绪而人类是有情绪的,我其实持保留意见。情绪是人类一种根据感受自然迸发出来的东西,情绪是一种会影响决策的上下文。我相信假若给AI足够的信息量,AI也完全有机会模拟出情绪,不过,问题就在于AI很难获得足够的信息量。

对于“手表1报时3:01am”这短短的一句话,人类处理消息时使用的信息,除了文字与大脑中的记忆(这些AI都有)以外,还包括眼睛看到的画面,耳朵听到的声音,闻到的味道,同时还包括在做判断那段时间里心脏的跳动、胃里翻腾的食物等等五脏六腑的感受。人会感受整个环境,文字仅仅是环境中的一小点内容而已。人的感受包括视觉、嗅觉、触觉可能还有痛觉,这些感受来自于人身上的每一寸皮肤甚至每一个细胞,要将这所有的感受数字化给AI是太不可能的。

这些人类对现实的感知能力,是AI不具备的。虽然AI也可以开始利用各类传感器尝试感受世界,但技术能力的限制使得AI距离人类感受世界的能力还差好多好多个数量级。

AI的自动驾驶能力是个很好的例子,从算法与计算能力上来说,AI实现完全自动驾驶似乎并非不能实现。但感知能力限制了AI能力的发挥,不仅仅是传感器,就算人们已经制造出能超过人眼能力的高清摄像头与雷达,数据传输能力也无法满足需求,AI难以在短时间内高效的处理如此大量的图像与雷达数据并做出决策。这也导致时至今日,人类依然在汽车自动驾驶这件事上具有明显优势。

更重要的是,由于感知能力的缺失,AI也很难在没有人类帮助的情况下实现自我学习进化。人类之所以能够形成判断“好”或者“坏”的直觉,很大程度上是因为人类从小就在不停的犯错中学习,当人类做出了一些事情并取得来自世界的负面反馈时,人就会把某些事情分类在“错误的事”那一列。这种负面反馈并非只是老师试卷上的红叉或者人工标注里的框框,它是一种来自包括耳朵听到的、眼睛看到的,身体感受到一切综合而成的东西。

对人类来说,这种来自现实的反馈并非一时产生,而是日积月累了几十年,伴随着人的一生。在潜移默化中,大脑学习成了现在的样子,这一切综合起来,构成了每一个人对信息的架构能力与判断力。AI在重新组合和拆分信息的过程中,虽然有庞大的数据库,但AI这些真正的感知信息的能力是极其有限的,这是AI力所不能及的地方。

我们得到的启示

说了那么多,总结一下我们从中可以得到的启示。

首先还是得认识到AI的长处,姑且把AI当成一个被灌满了专业知识老师傅,大事小事都可以问问AI,权当头脑风暴。尤其是在发散性创造性的工作中,我们应该习惯于AI总能给我们提供一些灵感,毕竟AI的数据库来自于全世界大脑的积累。

然后我们必须始终谨慎的对待每一条AI给我们的反馈,在接下来AI的时代中,对信息的判断力对每个人将显得如此重要,缺乏判断力的人会很迷茫和痛苦。

为了提升自己的判断力,我们要特别感谢造物主给了人类感知的能力,正是这些感知能力给了我们无与伦比的判断力。因此,如果AI真的能够帮我们完成大部分思考工作,我们对于我们获得的信息,更应该主动去寻求来自真实世界的反馈在简单的文字、图像、甚至视频的内容储备上,我们不可能比得过AI,但我们在大自然身历其境的感受中,在与别人一场场真实的谈话中,我们感受到的信息量远超AI所学习到的那些干巴巴的内容。AI可以负责帮我们思考,我们则可以把更多的时间花在与这个世界打交道上,这是人类最擅长也最有价值的地方。

有了这些感知能力,我们得以高效判断一件事情是好的还是坏的,判断是否要停止做某些事情或者鼓励做某些事情,我们可以判断一幅照片是否是美的,或者去判断一个公司未来是否有美好的前景然后买它的股票。在这些能力上,虽然AI能给出不错的建议,但最终的判断能力远不如人。

台积电老董事长张忠谋在聊到什么是一个好的管理者时曾经提到,“聆听是最基本的东西。我看一个人说话,从来不记笔记,就想他为什么讲这几个字,他的动机是什么,他要我做什么。”这种优秀CEO察言观色的能力,AI就是极难做到的。

如果AI真的会替代掉一些职业,律师,医生这些与人打交道的职业才是最不容易被取代的,在这些职业中,察言观色的能力才是核心竞争力,而不仅仅是脑袋中的那些法律或者医学知识。

2023.3

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注