bookmark_borderi人、短视频与先立后破

我是个 i 人,80%的 i。

极简主义的 i 人

有人认为 i 人是内向,e 人是外向。我认为这绝对化了,即使 i 人一般不怎么说话,e 人特别爱说话,我也不认为 i 人是内向的。

i 人的习惯,是有 200 字的话要说,但只说 20 个字,剩下请自行脑补,懒得解释。

e 人相反,如果有 200 字的话要说,e 人会滔滔不绝的说上 2000 字,如果你不拦着他,也许还可以再说上两小时。

作为深度 i 人,我愿意用码字、拍照甚至写代码的方式去表达观点,这些表达方式是抽象的,i 人专注于从复杂的世界中寻找那些值得铭记的关键因素,然后抽离出一个属于 i 人自己的世界。

i 人不喜欢解释,所以有时候会看起来非常高冷,如果你想理解 i 人,需要花上一些时间,慢慢体会。

还不能问,问了可能也没答案。

欣赏 i 人的表达是个心旷神怡的过程,你可能需要脑补很多东西才能跟上 i 人的节奏。当然,很多情况下你可能会跟不上,这倒也没事儿,你会有很多时间,你品,你细品。

相反,e 人的表达直白得多。如果你向一个 e 人朋友了解某件事儿,e 人会掰开了揉碎了给你解释的一清二楚。短视频和直播绝对是 e 人的法宝,上天送给 e 人的礼物,相反,让一个 i 人对着手机摄像头说上一大段话就太不容易了。

我常常把所谓的 i 当成一种极简主义,眼睛里揉不得一点沙子,断舍离最开心了,如果 3 个字能表达清楚,就一定不要用 5 个字。

反正,作为一个 i 人,我完全受不了短视频的唠叨,我甚至很难不拖进度条听完大部分播客,还好,现在有 AI 帮忙。

短视频时代和 i 人的冬天

这两年短视频爆火,让 i 人表示略有不适。

大概从 16 年开始,我们进入了短视频时代,抖音、快手、视频号甚至多多、B站、美团都告诉我们,只要你想,你就可以用拍小视频的方式秀出自己,还能赚到钱。

最近还火了短剧这种东西,大有替代传统电影之势。在抖音大学跳了三年舞的小哥哥小姐姐们,有从线上走到线下的需求,拍短剧是不错的路子。

未来不仅仅是短剧,小姐姐小哥哥们肯定还会进一步走向线下、去开见面会、去 LiveHouse、去到粉丝面前去跳舞、握手,玩,也去赚钱!

扯远了。这是好事,但就像前面说的,我到现在都难以接受短视频这种艺术形式。一段小视频里塞进那么多密密麻麻的信息,作为一个超高敏 i 人,从镜头语言到台词和剧情脚本,从背景配乐到画面调色,我会去思考其中每个细节背后的含义。

好累,可能完美主义害死人。

Airbnb 的创始人布莱恩·切斯基(Brian Chesky)有句名言:“重复不会创造记忆,新的体验可以”。(Repetition doesn’t create memories. New experiences do.)

我更受不了的就是那些像唐僧一样唠叨的重复的短视频,一句话能说清楚的屁大点破事儿巴不得重复几十遍废话再灌入你的耳朵里。

短视频在我眼里除了用来消解情绪和打发时间,似乎真的很难给我什么新的体验。我还是安安静静做个好粉丝吧,无聊的时候花上几十分钟去划短视频也挺好,就好像以前躺在沙发上翻看电视广告一样。

但如果让我套套模版,去输出一些不痛不痒的内容,那么为什么我不选择码字呢?短视频时代真是 i 人的冬天,我还是愿意静静地看书。

我佩服那些能献祭出自己,花大把时间去用短视频这种碎片化的艺术形式表现自己的人,更佩服那些能从短视频中学习到各种大道理的人,可能他们没那么 i 吧。

想起来几年前,《隐形守护者》因为经费不够没能被拍成视频,而只用照片的形式呈现了一部游戏,我毫不犹豫的冲了,i 人仿佛看到了一股清流。今年的《完蛋!我被美女包围了!》虽然也挺有意思,但在我心里并没有超过当年隐守的地位。

AIGC 与先立后破

不论是文字、图片或者视频或者我不喜欢的短视频,都只是一种媒体形式罢了,衡量其到底好不好,还得看内容。

i 人的优势在于重视里子,关注事情本身应该呈现的样子,e 人的优势在于重视面子,关注怎么把事情以大众更容易接受的方式表现出来。这两种侧重没有对错,就像一个硬币的两面,少了谁也不行。

也许每个 i 人都需要一个 e 人小伙伴,帮忙支棱起面子的部分。

这个年代,AI,尤其是AIGC,已经成了 i 人最好的伙伴。估计你已经体验过 AI 最擅长的圆滑,不管什么话都可以说的天衣无缝——哪怕是睁眼说瞎话。

在这两年 AIGC 大火之前,e 人相对稀缺,因此,能够帮助 i 人们把干货写成鸡汤文,做成短视频的 e 人小伙伴们非常吃香,因为那时的流量很值钱。

然而,这部分工作在肉眼可见的将来,就可以让 AI 代劳了,只要你想,AI 有无数办法帮你表达,帮你圆滑,也帮你获取大量的流量,这反而让流量变得不值钱,相比之下,内容本身就值钱多了。

先立后破这个词最近又火了起来。在我看来,i 人的表达是一种立,e 人的表达是一种破。以前立容易破难。但随着这几年短视频、AIGC之类媒体形式的发展,破越来越容易,这就更凸显出立的珍贵。

20 多年前,玩《仙剑奇侠传》那会儿,我就喜欢赵灵儿和林月如。现在即使在《完蛋》面前已经被美女包围,我依然还是喜欢赵灵儿和林月如。

bookmark_border纳瓦尔宝典、杠杆与数据要素

来聊赚钱!

一本看完就能学会赚钱的书

你相信看一本书就学会赚钱吗?

如果我告诉你,看完《纳瓦尔宝典》你就会赚钱了,你信吗?

我发现并非因为看完这本书让学会了赚钱,而是因为我本来就会赚钱,这本书把我脑子里的那些无法用言语表达的赚钱套路说出来了。

我有了共鸣,误以为“学会了”赚钱,而已。

纳瓦尔何许人?硅谷成功的创业家,也是顶级投资人。就如同我佩服巴菲特一样,纳瓦尔在用简单的语言解释复杂问题的能力上,一点也不比巴菲特差。

不仅如此,他还更好地利用推特、博客、播客之类互联网时代的传播手段来做这件事儿。

我越来越理解,这种“把话讲简单”的能力,是一个优秀投资人不可或缺的。查尔斯·吉德林曾经说:“发现问题往往比解决问题更加重要,把问题清楚地写下来,就已经解决一半。”芒格也引用过这句话,以后我也会引用这句话。

问题另一半是把问题给其他人讲清楚,和大家一起来解决问题。

与《穷查理宝典》一样,这本书并不是纳瓦尔自己所写。然而作者埃里克在全书一开头就写道:“在这本书里,一切亮点均属纳瓦尔,所有错误都归我一人。”

读到这句话,我就已经理解了为什么纳瓦尔能够在过去几十年取得如此大的成就。纳瓦尔具有一种类似太阳的能力,不断发光发热,营造出一种喜气洋洋的氛围。这种氛围会影响一大批创业者,让他们学会怎么赚钱。

纳瓦尔把自己打造成了一个发光发热的产品,是他的粉丝们定义了他。

没错,要学会赚钱,首先需要把自己沉浸在一种赚钱的氛围中,然后坚定相信自己,和粉丝们一起前进。

纳瓦尔是这样,纳瓦尔身边的朋友们也是这样。

所以纳瓦尔说的没错,选择你居住的地点,选择你的合作伙伴,以及选择你做的事情,极其重要。

这三点都离不开的一件事情:选择。我们为什么要搬砖,因为要攒钱,攒了钱你才可能买到自由,买到选择权,有了选择权才有赚更多钱的机会,有了机会,你才可能赚更多钱,才会更加自由,才可能形成正反馈循环。

雪球越滚越大,赚钱就那么简单。

这个过程听起来奇特,但真的开始这场游戏以后,你会发现这是个很享受的过程,也只有真的体会过这种快乐,才会感受到纳瓦尔提到的幸福的感觉。

读完这本书,我对其中很多细节观点不以为然。一个朋友跟我说:纳瓦尔说一周要用一天来思考,一天要运动一小时,打坐一小时,那么他哪有时间来搬砖?

我拼命点头,本来就是,这种大佬总是站着说话不腰疼。

当然纳瓦尔可能不承认,因为这段话毕竟是埃里克写的。人家已经打了预防针,“在这本书里,一切亮点均属纳瓦尔,所有错误都归我一人。”

这就对了,书里说的,都是错的,你思考的,才是对的。“开心做自己”才是王道——这也是纳瓦尔的观点。

纳瓦尔讲了一大堆道理,你认可哪些,你打算做什么,你是谁,会变成谁,是不是也会像纳瓦尔一样发光发热,这是你的问题,不是纳瓦尔的问题,如果搞不清楚这些问题,那你就是问题。

所以,到底是不是看完这本书就能学会赚钱,我告诉你能,但你也别信我。

因为只有你思考的,才是对的。

积累内容,赚杠杆的钱

这本书的一个核心内容是:要用杠杆赚钱,而不是出卖时间。

我太同意了。

在我眼里,赚钱这件事情,本质上是帮助别人,然后取得相应的报酬。你赚多少钱,取决于你帮助别人的程度,就这么简单和自然。

重要的是,帮助别人的程度,并不取决于你付出了什么,它取决于你帮助的对象得到了什么

你付出了什么并不重要,重要的在于你帮助的对象得到了什么。

重要的事情要说第三遍,重要的在于你帮助的对象得到了什么。

纳瓦尔说,要关注事实,不要轻易下主观结论,就是这个道理。我们常常犯的错误,是听了某个人的话,就下结论,看到某个现象,就进行联想,然后以为自己想的都是对的,这是本能没错,但这些本能常常让我们犯错。

看到一个蹲在瓜田里的人,我们就下意识认为那是偷瓜贼;看到拼多多卖假冒伪劣的新闻,我们就下意识认为拼多多是靠卖假冒伪劣盈利的;看到有人挂着光鲜靓丽的名头到处演讲,我们就下意识认为他是很厉害的大师。

可是,事实往往比你看到的东西要复杂得多。冰山下面的东西才是关键。

表面上你看着某个人每天无所事事的躺平,如果没有深入仔细的调查研究,没有搞清楚他背后暗藏的东西,就好像一碗盖浇饭只关心浇头不关心米饭一样,你会错过很多实在东西。

冰山下面的东西,正是所谓的杠杆

这个道理就好像你同样买了一张演唱会的门票,进去有可能是五月天,也可能是凤凰传奇,可能还有神秘嘉宾。

是演唱会里面的内容、干货才决定了这张门票的价值,门票本身只是一张纸。

同样,出卖自己 3 个小时的时间,教三个小朋友画画,或者带一群大佬冥想,又或者与一群企业家聊天咨询,虽然你付出的精力差不多,但你帮助的对象得到的会完全不同。

结果就是,你能赚到的钱,也完全不一样。这其中的差距,就是杠杆,杠杆体现在内容。

所以,内容很值钱。

这就是为什么说赚钱的方法很简单,但大多数人做不到。不论是工具还是方法论,都是几句话或者一本书就可以讲清楚,只有内容永远只属于自己,没有人可以灌输给你,而且内容需要积累。

如果你本来就有内容,那么看完这本书,你就很有可能变得会赚钱了。

如果你本来没有内容,那么……这本书会给你增加一点点内容,而已。

“书中自有黄金屋”,不是骗人的。

《穷爸爸富爸爸》作者罗伯特·清崎说:“你永远赚不到认知以外的钱”,就这意思。

把数据当成一种要素

再说说如何获得杠杆,纳瓦尔简单的说到,用钱购买资本。

问题是,什么是资本?

经济学中,有生产要素的概念,简单的理解就是不可或缺的生产工具。

比如土地就是最基本的生产要素,有了土地,你才可以种水稻、种苹果,从事生产劳作。

传统意义上的生产要素包括土地、劳动力、资本和技术。这很好理解,想想一下你需要制造一辆漂亮的汽车,首先需要一块良好的平坦的土地,然后需要召集一批能够高效率干活的工人,你还需要获取资本,有钱就可以激励大家工作起来,最后你还需要懂得制造汽车的技术。

这些要素加起来,就是资本。我们买股票就是买公司,买公司实际上就是买到了这四大要素,这四大要素是实实在在的资本。

这些资本就是杠杆,就是冰山下面的东西,就是能让我们躺在沙滩上睡觉,还能帮我们赚钱的东西。

当然,除了这些硬资本以外,我们还买到了所谓优秀的管理层运营能力,但这是虚的,是“软资本”。

如何衡量这种软资本?纳瓦尔用了很大的篇幅来讲幸福的获取与情绪控制。

纳瓦尔提到:你的秘密越多,幸福感就越低。陷入惶恐怎么办?用冥想、音乐和运动重新调整情绪。然后把让你感到惶恐的事情放下,选择新的事情,把情绪能量投入其中。

加了杠杆后,人的决策就变得更加重要了。选择比努力重要的多得多,要保证高质量的决策,最重要的就是稳定情绪。

这年头,人已经成了公司不可忽略甚至最重要的资本,人的情绪稳定带来的价值极大。

终于该轮到第五大要素——数据出场了。

数据就是内容,是人活着、公司做过事情的证明。面对一条没有走过的小路,你会感到害怕、恐惧,不敢往前走,但如果有数据,你知道小路尽头是桃花源,你就会大胆往前走。

“知道”,很重要。因为知道,所以相信,因为相信,所以有勇气,因为有勇气,所以决策效率就变得高得多,因为决策效率高得多,就会少犯错,因为少犯错,就可能长期积累更多的财富。

数据就是那种让你“知道”的神奇东西,这就是赚钱的秘密。

2020 年 3 月 30 号,国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,给中国经济定义了土地、劳动力、资本、技术、数据五大要素。数据要素概念登上历史舞台。

这五大要素齐全,不躺赚都难。

留个尾巴,要确认我们得到了“数据资产”,就需要区块链来对数据进行确权。区块链上的数据有时间戳,我们就可以确信它是诚实的——加了那么大的杠杆,不诚实的数据就像一粒老鼠屎,可能会坏掉整锅汤。

然而同样的数据,在不同的人手里,起到的作用也完全不一样,就好像一幅画,有的人看得懂,有的人看不懂。数据如果落到看不懂它们的人的手里,可能就啥也不是,但落到能看懂的人手里,可能就是让人躺赚的宝藏。

就好像《纳瓦尔宝典》这本书,有人看完就学会了赚钱,有人看完就盖了泡面。

要知道,不管什么要素,它们都只是杠杆,最终决定是否能赚钱的,还是背后的那个人,对我们每个人来说,终身学习才是王道。

还有一件事情,因为数据毕竟是很专业很复杂的东西,大多数人必然会对复杂的数据充满恐惧,就好像你看到复杂的电路图无从下手一样。

当我们拥有了数据,只相当于把事情想透了,问题只解决了一半。

问题的另一半,是我们还需要一种东西让数据以最简单的方式让更多的人接受、看懂以及理解。

没错,这就是生成式人工智能与数字藏品的应用场景。这儿不展开了,以后再说。

这就是关于怎么赚钱的故事,还是那句话,知易行难。

希望能对你赚钱有帮助。

求个一键三连!

拜拜

bookmark_borderAI 应用落地的两个关键问题

最近参与了一些关于 AI 应用落地话题的交流,我提出了两个问题,到目前为止,都还没好的答案。

我的第一个问题是,未来 AI 的信息容器是什么?

在过去的 100 多年中,信息技术领域的用户体验经历了几次重要的变化,人机交互界面从最初的按钮与指示灯,到随后的字符终端,再到图形显示界面,直到最近十来年的多模态交互(语音、触控等)。

每一个时代都有属于自己的”信息容器“。这是一种以特定格式储存信息的媒介,它配合上相应的输入/输出设备,提供特定时代人类与机器打交道的解决方案。这些信息容器包括 IBM 的穿孔纸带,字符终端时期的磁盘与文件(微软 DOS 操作系统名称的字面意义)、GUI 时代的格式文档(例如 doc、xls、pdf)、互联网时代的 HTML 等等。

在 AI 时代,有了强大的自然语言能力、图形生成能力,我们将如何与 AI 之间传递信息,或者说,人与人之间未来将如何传递信息?

最近 AI 辅助写作已经不稀奇了,我也深度使用了一些工具,但很快就发生了神奇的事情——写作者大量使用 AI 辅助写作,用几句话生成一大篇文章,阅读者与此同时也开始大量使用 AI 辅助总结阅读,把文章缩回成两三句话。

哪里不对劲。

不对劲的原因,正是适应 AI 时代的信息容器缺乏。实际上我们习惯使用了自然语言这种媒介来交换信息,在信息密度更大的 AI 面前,自然语言在效率上毫无战斗力,反而成了帮倒忙的玩意儿。

我在想象一种新的媒介的出现:当我接受别人的资料时,我不想看到长篇大论,简洁的总结就足够了,如果我需要更多的信息,AI 可以再实时生成给我。

打孔纸带催生了 IBM,字符终端造就出了 PC 产业,图形终端下的 Office 三件套让微软成为了垄断巨头,触控与移动终端则让苹果重回辉煌。

那问题来了,定义 AI 信息容器的下一个巨头会是谁?

我的第二个问题是:AI 的“WOW时刻”在什么时候怎样到来?

新技术的落地,都是通过新的技术手段提升效率,替换传统工作、学习、以及生活方式的过程。

但人们对新技术的接纳来源于比较。

大多数人可能都经历过从智能手机是个大玩具,到生活离不开智能手机的过程,但绝大部分人,包括我在内,还没有体会到“离开 AI 就没法过日子”的感觉

这种转变的时刻,被我称为“WOW时刻”。某个行业的“WOW时刻”一出现,就再也回不去了!如果说好奇心是驱动消费用户购买新技术产品的第一波浪潮的话,那么 “WOW时刻”才是真正深刻改变世界的第二增长曲线。

回想一下你是什么时候开始离不开 PC,什么时候开始离不开手机的?正是那些你发现在 PC 上写文章效率远远超过在稿纸上爬格子,或者在手机上刷小视频的娱乐效率,远远高于守在电视机前看新闻联播后面的黄金档电视剧,又或者是在移动支付时自然而然掏出手机的时刻。

要想出现“WOW时刻”,除了新技术本身,还必须等各种各样的应用场景、解决方案、生态圈等等陆续问世,这些都是要人们花费数年甚至数十年才能摸索出来的。

所以,“WOW时刻”的到来往往要比人们所想的要晚不少,想想看,即使图形界面的 PC 早在 1990 年代初就出现了,直到 2010 年代我们还会在很多场景,比如超市收银机看到几十年前的字符界面应用程序。

我始终相信 AI 的“WOW时刻”虽迟但到。我对此充满了期待,我也非常好奇,这个时刻将会以怎样的方式,以怎样的方式来临

两个问题,都还没有答案。且行且思,静观其变。

bookmark_border大人,时代变了,人最重要的技能是聊天!

聊天改变世界

编程何以能成为一种现代职业?

因为人类有欲望,程序本质上是一种让机器满足特定人群在特定环境下的欲望的方式。程序通过指挥机器输出字符,画面,声音等操作,来满足人的特定欲望。过去一两百年来,整个信息产业的发展,无非是这个过程的不断演进。

在我过去十多年的职业经历中,我学到一个令我印象极其深刻的道理。一个优秀的IT公司,就好像一台设计精良的生物计算机,你灌输一句话需求,它就应该自动自发的完成一系列流程,包括需求分析、应用开发、代码编写、直到交付测试给用户使用。这台机器的用户界面可能就是个微信群,你要做的只是往群里写一些需求,再掏些钱,然后等上一段时间,你就会发现世界被改变了。

聊天改变世界,一个好CEO最重要的技能是聊天。

逆天的ChatGPT插件

经过几年的酝酿,最近我们每天都在体验着人类的技术爆发,你根本不知道一觉醒来,就会又有什么神奇的新东西发布了。ChatGPT 已经拥有了十分强大的编程能力,我一直好奇这样的怪兽开放API时,究竟会是什么样的形式。上周,OpenAI公布了 ChatGPT 插件开发文档(https://platform.openai.com/docs/plugins/introduction),它完全没让我失望,我切实体会到了来自未来的编程方式。不!不是来自未来,它已经来了!

不妨从人类的编程方式历史开始说起。编程是人类与计算机打交道的方式。理解人类编程方式的进化,可以从程序载体,也就是程序长什么样,以及人类编写程序的方式两个方面来观察。

机器语言时代

最早的时候,人类使用一种机械式的分析机,它只能进行简单的数学计算。Ada Lovelace(1815-1852)在1843年发表了一篇文章,发明了一种使用打孔卡片输入程序控制计算机进行逻辑运算的方法。这时候的程序其实只是一堆数字。

这被认为是最早的编程方式。这已经是180年前了!

(巴贝齐分析机 来源:https://zh.wikipedia.org/wiki/File:Analytical_Engine_(2290032530).jpg)
(打孔卡片 来源:https://upload.wikimedia.org/wikipedia/commons/4/4c/Blue-punch-card-front-horiz.png)

汇编语言与高级语言时代

在电子计算机发明后,计算机的体系结构逐渐稳定下来。1950年代,人们开始设计一些助记词指令代替数字来与计算机打交道,汇编语言就这样被发明了。汇编语言能够将人类可读的指令转换为机器可读的指令,助记词的加入让编程语言首次实现了“人类可读“,从此出现了”代码“这种东西。

与此同时,显示屏、键盘成了程序员编写程序使用的工具,程序员的工作从搬动开关、给卡片打孔这类体力劳动中解放了出来。

这已经是大概70年前的事了。

(一段ChatGPT生成的汇编语言代码)

随着计算机的普及,计算机的用途逐渐从科学计算扩展到商用领域。1957年,IBM的程序员们为IBM 704计算机发明了叫做FORTRAN(Formula Translation)的高级语言,它简化了汇编语言的指令,高级语言更加接近人类的自然语言

(一段ChatGPT生成的FORTRAN语言代码)

有意思的是,那时候人们并不怎么信任计算机的计算结果。据说在IBM 704计算机交付使用时,现场依然配备了数百名计算员复查确认计算机计算结果,直到大约十年后,计算工作才被完全交给计算机(参考:https://zh.wikipedia.org/wiki/IBM_704)

随后科技突飞猛进,摩尔定律一直延续了几十年,集成电路持续进化,计算机的处理能力发生了翻天覆地的变化。

可视化编程

1984年,乔布斯发布了划时代的产品 Macintosh,开创了 GUI 的时代。GUI 的出现为高级语言带来了很多不一样的东西,人类除了打字外,还可以用鼠标来操作计算机了。从 GUI 诞生一开始,人们就开始琢磨怎么用图形化的方式编写程序代码,也叫可视化编程(Visual Programming)

早在1988年,乔布斯还在折腾自己的 NeXT 电脑公司时,一个重要产品就是用于构建图形应用程序的 IB (Interface Builder)。微软也紧随其后,在1991年推出了帮助人们拖拖鼠标就能创建图形应用程序的 Visual Basic。这些可视化编程工具一直在持续进化发展,直到今天依然在广泛使用。

这大概是30多年前的事儿。

 (Interface Builder for NeXTSTEP 来源: https://arstechnica.com/gadgets/2012/12/the-legacy-of-next-lives-on-in-os-x/)
(Visual Basic 1.0 编程工具 来源:https://winworldpc.com/screenshot/40c3942c-c281-2230-11c3-a4e284a2c3a5)

在可视化编程的世界里,程序的载体是一些可视化图形,程序员可以通过鼠标或者触摸设备操作他们。这听起来很酷,可现实是残酷的,人们很快发现,可视化编程存在许多难以解决的硬伤。比如 GUI 在复杂系统面前的效率远不如字符高效,而且难以优化程序性能;比如可视化编程开发工具自身开发难度就很高,很难跟上各种迅速进化的高级语言发展,往往一代图形化开发工具发布,语言已经进化到下一代了;又比如图形界面的程序代码相比简单的字符代码来说,更难以长期维护管理以及多人协作等等。

因此,完全的可视化编程始终没有实现,只有在某些特别的场景,比如儿童编程教育或者工业软件设计下,可视化编程才得到小范围的应用。但人们对在更大领域范围使用可视化编程的探索一直没有停止,近年来各类低代码编辑器依然层出不穷。

(儿童编程软件Scratch 1.4 与 Scratch 2,来源:https://bubble.io/blog/visual-programming/)

不过,可视化编程作为一种辅助手段一直存在,而且日益成熟。它大大提升了程序员们的工作效率。现在几乎所有主流平台都有基于 GUI 的可视化编程环境。

丰富的现代编程语言

高级语言自身也不断进化,朝着更加擅长完成特定任务的方向演进。比如早在1970年代Xerox PARC做图形用户界面的早期研究时,就提出了 MVC (Model-View-Controller) 模式。它将应用程序分为了负责实现数据存取与算法的 Model 部分,负责绘制图形界面的 View 部分,以及与负责处理用户请求和业务逻辑的 Controller 部分。又比如互联网和云计算的发展使得应用程序不再只运行在一台计算机上,今天一个应用程序完成一次操作,可能会调用互联网上许多设备协同工作。

这个过程中,一条简简单单的数据,被转换成各种各样形式存在着。从用户的视角看来,数据可以是PDF文件中的一行文字,可以是Excel文件中的一个表格行,也可以是海报图片中的一小块图片。如果从程序员的视角来看就更加复杂,它可以是一段JSON,也可以是一张JPG图像;它可以是Java中的一个类实例,也可以是数据库中的一行数据;它可以是HTML中的包含的几个数字,也可以是路由器中的几个数据包。

这就是为什么1960年代科学家仅仅用4K的内存就可以控制登月飞船,可今天人们还在抱怨电脑运行的太慢。

为了描述和处理如此复杂的数据,就出现了许多特别适合某一场景的程序语言,比如HTML这样的内容标记描述语言,GraphQL这样的专用接口查询语言,或者YAML这样的数据描述语言。这种划分让高级语言开始向专一功能化的方式发展,高级语言之间设计分工越来越明确。

一些语言比如JavaScript中还包含了大量动态特性,今天的程序员们,常常在各种各样花里胡哨的编程语言中玩得不亦乐乎,甚至今天各厂商都爱定义一套自己编程语言才满足,让人颇有一种开发能力过剩的感觉。

程序员们很大一部分的折腾,都是在试图驯服 GUI 这头怪兽。人们通过 GUI 操作计算机,程序将人们的操作(鼠标移动点击或者手指触摸)翻译成计算机指令,计算机再将处理结果转换回显示屏幕上某些像素的颜色变化,人眼观察到这些变化,接受消息,满足需求。

这大概是近10年发生的事儿。

 (iPhone应用程序开发环境,来源:https://developer.apple.com/xcode/)

自然语言——程序语言终结者!

各种各样的高级语言,配合上眼花缭乱的图形化辅助工具,人们已经习以为常,直到 ChatGPT 出现在大家眼前。扯了那么多,我们来看看 ChatGPT 的插件系统提供了一个怎样的编程平台。

最精彩的部分在建立 ChatGPT 与你的服务API交互的过程,它以AI的方式包装了传统的应用程序。这部分过程,就好像用汇编语言的助记词指令代替人类无法看懂的机器码数字一样神奇。

我们可以忽略掉其他基础性的工作,包括完成用户验证以及创建清单文件的事情,作为开发者,你需要理解这些事情,但这些事情都是标准化的,其实很容易可以由AI帮助完成。

拿官方文档中的简单TODO插件的例子来说,你需要为ChatGPT撰写一些说明,像下面这样(是的,你也不需要用英文,中文也可):

生成一份OpenAPI定义的YAML代码,用于编写ChatGPT插件,包含下面的信息描述:一个ChatGPT插件,允许用户使用TODO列表,并可以管理该列表。如果你不知道用户的用户名,在向插件进行查询之前请先询问用户。否则,使用用户名“global”。它只有一个端口,服务器接口在https://gpt.bobyuxinyang.com路径为/todos接口描述如下获取:获得用户TODO列表发送:增加一条TODO项目,接受一个参数,content参数描述todo的内容,返回todo的id删除:从列表中删除一条TODO项目,接受一个参数,id参数描述todo的id

另外,后端服务需要以JSON格式返回一些数据,比如下面这些。

{"todos:"["买点东西","遛狗","写写代码"]}

就是这些了!

其实最重要的事仅仅是编写那几段描述,剩下的事情都可以交给AI,然后比如下次当用户提要求”我要往TODO列表增加一个项目,内容是看书“,ChatGPT就会自动调用你的API处理剩下的问题。

我们要的不是AI辅助编程,我们要的是“自然语言原生编程”,就好像过去几年流行的云原生概念与云计算的区别一样。

从程序员的视角,你只需要写下完成任务的思路,剩下就不用做了。什么高级语言,都能自动生成,什么 GUI,不需要的!我们只需要关注需求,一切都关于数据!我们真的需要 GUI 吗?我们真的需要高级语言吗?

(当然还是需要的,我们现在还需要用他们来创造AI)

不多说了,不理解的地方去问 ChatGPT就好。

给我们的启示

在现实世界里,会耍 Excel,会写 Python,会用什么 SPSS 之类的复杂专业软件工具一直是所谓专业人士的必备技能。现在我们突然发现,过去这些所谓的专业人士,本质上都是在做信息中介的工作。

未来人们 最重要的事情是会聊天,通过聊天就可以解决实际问题,改变世界。另外,第二重要的事情,是 拥有第一手数据。之所以是第二重要,是因为第一手数据也可以通过聊天得来^_^。

最近经常有人问,是不是AI来了我们以后都不要编程了。必然不是,而是现在编程的门槛变得更低了,千万不要把写代码这件事和编程划等号,当聊天也可以是编程的时候,你就必须思考怎么才能“好好聊天”。你需要学习逻辑、数据结构、架构设计等等一系列知识,才可以应付未来的聊天场景,不然就会变得毫无竞争力,这是另外一个话题了。

当我们拥有了导航软件,大部分人受益其中,但自身辨认方向的能力可能也有所退化。不过,这并非意味着辨认方向的能力不再重要,反而对于专业人士,它变得更加重要。

编程工作不会消失,程序员不会被替代,而且编程效率的提升会使需求成百上千倍的激发出来,市场空间无限巨大,产业互联网的故事就要实现了。

2023.3

bookmark_border为什么说判断力是一种架构能力,以及为什么AI缺乏判断力

这一篇谈谈AI的局限性。

上一篇文章提到,判断力是人类在AI面前的优势之一,判断力也是一种架构能力,这个话题其实很有意思,值得展开谈谈。

判断力的来源

试想一下当我们听到一条新闻消息,我们会如何判断它的真假?

虽然通过消息来源可以区分出一大部分不靠谱的消息,但仅仅根据信息来源判断是明显不靠谱的,即使是所谓的官方消息,也免不了造假的可能性。在那些真正重要的事情上面,我们可以信任谁呢?除了自己以外,我们谁也不能信任。

判断力是我们依靠自己而非他人来判断信息真伪的能力。交叉验证可能是最容易想到的办法,当你的同事慌张的告诉你你家里着火了,你第一反应可能会给家人打个电话,或者赶紧亲自跑回家去看一眼。这些动作都是在搜集更多信息,以确认这个坏消息是不是真的发生了。在短时间内,如果多个消息源都显示出证明某个事实的证据,我们就能更加确信这件事情是真的。

交叉验证的理念,就是所谓调查研究。当我们想证明什么,就会想尽办法去搜集更多与这件事情相关的信息,从而为交叉验证提供素材。假若交叉验证都指向同一结果,那么自然没什么问题。但如果交叉验证的过程中各个事实指向的并非同一结果,甚至指向完全相反的事实,这时候问题就变得复杂了,就好像两块手表永远无法告诉你确切的时间。

在做判断时,人们常常犯的错误,是摒弃那些与预想不同的信息,仅仅保留那些直觉希望看到的信息。这种选择性接受信息的行为往往能让人的出一些令人匪夷所思的结论,就好像虽然明明窗外艳阳高照,但如果手上的两块手表都告诉你现在是深夜,仍然会有不少人选择相信手表,可能还会联想到时区或者是其他什么问题。凭直觉做出这种荒谬的结论,那活该被扣上“不理性”的帽子。

直觉是不可靠的,更理性的思考方式,是使用“逻辑”这个强大的工具,将我们获得的信息进行处理之后再下结论。比如手表1是一块机械表,手表2是一块能够通过互联网同步时钟的电子表,且手表2当前还处于有电的正常工作状况,我们也许还会去检查手表2的互联网连接是否正常,如果都一切正常,那么手表1因为各种原因走时出错的可能性就会大得多,我们就会自然更加相信手表2给出的信息。人脑天生有强大的逻辑能力,当我们从两块手表获得不同的时间时,我们的大脑会调用更多的信息来辅助判断。

因此,要判断一件事情是否为真,除了判断消息来源外,还有另外两个要素,一是逻辑推导能力,二是提供辅助信息。消息来源其实就是辅助信息的一种。

信息的拆分与合并

先来看逻辑推导这件事儿,基本逻辑运算很容易,无非是“与”、“或”、“非”三种,逻辑运算本身并不是什么问题。困难的地方在于如何将信息其拆分或者合并成用于计算的素材,也就是信息处理的过程。

还是上面的例子,假设我们获得了两条相互矛盾的信息,“手表1报时3:01am”,“手表2报时2:59am”。这两条信息并不能直接进行逻辑运算。或者说,光凭这两条信息,我们无法推导出任何结论。你可以试试把这两条信息输入到GPT中,让AI也来烧烧脑。

之所以我们能够继续推导而AI很难做到,就是因为我们会自然的对信息进行加工。首先,我们会自然的从提取一些信息合并进来,比如“手表1报时3:01am”就成了“一块在床头柜里放了1个月的机械表,它是5年前买的,在刚刚我拿起来看的时候显示时间是3:00am,另外它有黑色的表带,外壳有点裂纹”等等等等。在真正做判断时,我们大脑使用的信息远不止这一句话,大脑的信息储备放在那儿,所有信息储备都是做这个判断的辅助信息,它们会根据某种规则被提取,然后合并到原始信息中。这个例子里,我们甚至还会联想到购买那块机械表的那次旅程,机械表的品牌、价格等等。当然,不只人类是这样,AI其实也是这么做的。

合并进来大量信息后,下一步要做的就是对信息进行拆分,目的是让信息变得可以比较,能够被用于逻辑推导。我们经常把这部分说成“把书看薄”的过程,信息拆分是复杂的,因为信息是几乎可以被无限拆分和重组,这种拆分有无数种可能性,究竟拆分成什么样的粒度才可以用来进行逻辑推导呢?没有一个公式,也没有标准答案。

还是手表的例子,再经过一系列信息处理后。我大概获得这么两信息:“手表1是一块一个月没戴过的机械表”,“手表2是一块功能完好且连接着互联网的Apple Watch”。这样就好判断了,很明显手表2是准的更容易让人相信。既然如此,那就很容易推导出“手表2报时2:59am”这句话是真的的可能性就更大。

判断力的核心是架构能力

在刚刚提到的这个过程中,我只提到拆分信息的方法没有公式和标准答案,但如果继续追问究竟该怎么拆分信息呢,我其实没有给出过程,只能姑且理解成靠直觉。

还是这个例子,假设另一个人经过信息处理后也得到了两条信息“手表1是一块看很酷很新的机械表”,“手表2是一块成色很差的电子表”,那么他就很容易推断出手表1是准的,这就显然出错了。但是,我们再考虑一种情况,如果他得出的信息是“手表1是一块看很旧很破的机械表”,“手表2是一块成色还行的电子表”,然后判断手表2是准的,那他也可能“蒙对”。这有点像在完成中学试卷里的选择题,不管这个人是否能蒙对答案,他的过程看起来都是全错的。

一旦有新的问题出现在面前,比如又出现了“手表3报时3:02am”这样一条信息,同样的,我们仍然会组合与拆分出更新的信息来做判断,重要的是,前面的信息拆分方式可能并不适合新的判断场景,我们需要寻找新的信息处理方式。

这种处理信息,生成对信息进行拆分和重组方案的能力就是架构能力。从这个例子我们可以看出,其实架构能力才是区分判断力高下的核心要素。在这个判断手表准确与否的问题上,即使能够判断对一两次,如果用于判断真假的架构就是错误的,那么未来迟早会犯下重大的错误。架构是一种形而上的方法论,它起到指导人脑思考方向的作用,架构能力很重要,判断力的核心其实是架构能力。

AI是否也有架构能力呢?当然有,机器学习的训练过程,实质上正是为AI提供了一套信息处理的架构,使得AI能够按照某种对信息重组和拆分的方式处理信息。随着AI模型日益庞大,AI的能力也与日俱增,尤其是ChatGPT这类产品的出现,使得AI在语言文字信息这种特定模态的信息处理架构日益完善。

人脑在架构能力上的优势

老实说,在很多情况下,AI在信息处理上都能领先人脑。其中AI最大的优势之一便是它拥有庞大的数据库,面对同样的问题,AI就是一个博览群书、识古通今的天才,能够快速的从历史数据库中搜索出相应的辅助信息来生成答案。在一些创意类的工作中,AI甚至能通过对海量案例的排列组合,创新出人脑无法想象的内容,让人叹为观止。

回到判断力的问题上,AI就不如人类了,这其中最重要的原因恐怕还是数据的缺失。

AI是缺失多模态信息的。我们常说AI没有情绪而人类是有情绪的,我其实持保留意见。情绪是人类一种根据感受自然迸发出来的东西,情绪是一种会影响决策的上下文。我相信假若给AI足够的信息量,AI也完全有机会模拟出情绪,不过,问题就在于AI很难获得足够的信息量。

对于“手表1报时3:01am”这短短的一句话,人类处理消息时使用的信息,除了文字与大脑中的记忆(这些AI都有)以外,还包括眼睛看到的画面,耳朵听到的声音,闻到的味道,同时还包括在做判断那段时间里心脏的跳动、胃里翻腾的食物等等五脏六腑的感受。人会感受整个环境,文字仅仅是环境中的一小点内容而已。人的感受包括视觉、嗅觉、触觉可能还有痛觉,这些感受来自于人身上的每一寸皮肤甚至每一个细胞,要将这所有的感受数字化给AI是太不可能的。

这些人类对现实的感知能力,是AI不具备的。虽然AI也可以开始利用各类传感器尝试感受世界,但技术能力的限制使得AI距离人类感受世界的能力还差好多好多个数量级。

AI的自动驾驶能力是个很好的例子,从算法与计算能力上来说,AI实现完全自动驾驶似乎并非不能实现。但感知能力限制了AI能力的发挥,不仅仅是传感器,就算人们已经制造出能超过人眼能力的高清摄像头与雷达,数据传输能力也无法满足需求,AI难以在短时间内高效的处理如此大量的图像与雷达数据并做出决策。这也导致时至今日,人类依然在汽车自动驾驶这件事上具有明显优势。

更重要的是,由于感知能力的缺失,AI也很难在没有人类帮助的情况下实现自我学习进化。人类之所以能够形成判断“好”或者“坏”的直觉,很大程度上是因为人类从小就在不停的犯错中学习,当人类做出了一些事情并取得来自世界的负面反馈时,人就会把某些事情分类在“错误的事”那一列。这种负面反馈并非只是老师试卷上的红叉或者人工标注里的框框,它是一种来自包括耳朵听到的、眼睛看到的,身体感受到一切综合而成的东西。

对人类来说,这种来自现实的反馈并非一时产生,而是日积月累了几十年,伴随着人的一生。在潜移默化中,大脑学习成了现在的样子,这一切综合起来,构成了每一个人对信息的架构能力与判断力。AI在重新组合和拆分信息的过程中,虽然有庞大的数据库,但AI这些真正的感知信息的能力是极其有限的,这是AI力所不能及的地方。

我们得到的启示

说了那么多,总结一下我们从中可以得到的启示。

首先还是得认识到AI的长处,姑且把AI当成一个被灌满了专业知识老师傅,大事小事都可以问问AI,权当头脑风暴。尤其是在发散性创造性的工作中,我们应该习惯于AI总能给我们提供一些灵感,毕竟AI的数据库来自于全世界大脑的积累。

然后我们必须始终谨慎的对待每一条AI给我们的反馈,在接下来AI的时代中,对信息的判断力对每个人将显得如此重要,缺乏判断力的人会很迷茫和痛苦。

为了提升自己的判断力,我们要特别感谢造物主给了人类感知的能力,正是这些感知能力给了我们无与伦比的判断力。因此,如果AI真的能够帮我们完成大部分思考工作,我们对于我们获得的信息,更应该主动去寻求来自真实世界的反馈在简单的文字、图像、甚至视频的内容储备上,我们不可能比得过AI,但我们在大自然身历其境的感受中,在与别人一场场真实的谈话中,我们感受到的信息量远超AI所学习到的那些干巴巴的内容。AI可以负责帮我们思考,我们则可以把更多的时间花在与这个世界打交道上,这是人类最擅长也最有价值的地方。

有了这些感知能力,我们得以高效判断一件事情是好的还是坏的,判断是否要停止做某些事情或者鼓励做某些事情,我们可以判断一幅照片是否是美的,或者去判断一个公司未来是否有美好的前景然后买它的股票。在这些能力上,虽然AI能给出不错的建议,但最终的判断能力远不如人。

台积电老董事长张忠谋在聊到什么是一个好的管理者时曾经提到,“聆听是最基本的东西。我看一个人说话,从来不记笔记,就想他为什么讲这几个字,他的动机是什么,他要我做什么。”这种优秀CEO察言观色的能力,AI就是极难做到的。

如果AI真的会替代掉一些职业,律师,医生这些与人打交道的职业才是最不容易被取代的,在这些职业中,察言观色的能力才是核心竞争力,而不仅仅是脑袋中的那些法律或者医学知识。

2023.3

bookmark_border期待一个售卖罐装知识的未来

在原神中,罐装知识是一种非常有价值的资源,可以被用来提供虚空系统的知识服务。

虚空从世界树中读取知识,人们在耳朵上佩戴虚空终端,虚空系统会根据访问者的身份、阅历等信息,推送相应的知识。在虚空系统的帮助下,人不需要主动思考,就可以获得任何需要的知识。

罐装知识的来源,是学者的大脑,学者们将自己的知识罐装起来,然后通过虚空系统提供给其他人使用。不过,由于教令院禁止私下买卖罐装知识,所以在黑市上出售罐装知识是非法的。

用现在的话来说,世界树提供了云存储服务,虚空系统提供云计算服务,虚空终端就是云端设备,罐装知识就像是储存了有价值信息的U盘。

罐装知识是原神中一个非常有趣的设定,它展示了一种先进的知识传播体系,同时也反映了知识对于一个社会的重要性。

信息唾手可得

现实中,书本就是最古老的“罐装知识”,图书馆就是古老的世界树与虚空系统。图书馆是存储知识的场所,就像虚空系统,人们去图书馆翻书获取知识。

科技发展使各种承担知识传播功能的新设备代替了书本。虚空系统从广播到电视,进化到到互联网、无线互联网,终端也从收音机到电视机进化到个人电脑再到手机甚至各类可穿戴设备。人类社会中知识传播的效率在科技的加持下不断提高。

这种效率的提高体现在两个方面,一是信息复制与传输的成本越来越低,二是新媒介中信息密度不断提高。

要复制古老的书本,得依靠印刷技术,相比之下,读取和复制电脑硬盘中的数据成本就低得多。近几十年,连书籍的排版都已彻底电子化。到今天,不仅仅是电子书,我们在视频网站点播高清视频也习以为常了。人们能够以极低的成本且有选择性的接受需要的知识。

另一方面,同样给你5分钟时间,看5分钟文字,听5分钟音频,与看5分钟高清视频比起来,你接受到的信息量差了几个数量级。这就是信息密度不要小看信息密度,它为人类获取和使用信息提供了更多可能性,也提供了更多不经意间创意涌现的机会。

这些进步的结果就是,人们不论是工作、学习、生活、娱乐的效率都成倍的提高了。想象一下在20年前我们还需要每周在固定的时间等在电视机前看想看的动画片,或者要在周末去楼下的漫画店借一本最新出版的漫画,这些生活习惯都已经不复存在了,现在在手机上点几下就可以解决问题。

时至今日,“信息唾手可得”已经几乎实现。

学习曲线

不过,学习是个始终没有被技术解决的问题。

现在的你无论通过什么手段获取到文字、图像或是视频,你仍然需要花时间学习消化。与原神中虚空终端不同,学习过程还没有办法被替代,信息并不能直接被灌输到你的大脑里。然而,信息只有能够被人类消化,然后用于解决特定的问题,才可真正称为知识。从这个意义上说,现实中的我们只能接收到是“罐装信息”而非“罐装知识”。

在解决一些现实问题面前尤其如此。一个简单的例子,比如你想手工做个蛋糕,你已经可以轻松的搜索翻阅相关的食谱,这可能包括相关的书籍、网站、在线视频视频课程等,然后你仍然需要花时间学习其中的内容,一边学习你可能还需要继续搜寻更多的信息以解决实践中遇到的更多问题,比如家里的烤箱使用方法等等。这个学习的过程以及学习所耗费的时间都无法避免。

经济学中常会提到学习曲线的概念。在日复一日的学习中,人们能逐步形成经验,将这些信息真正变成自己的知识,在这些积累下来的经验的帮助下,人们将获得更高的劳动效率。

学习曲线之所以重要,一个重要原因是它与时间相关,时间是积累学习曲线的必要条件。每个人每天都有24小时,也只有24小时,这24小时无法租借,流逝的时间也无法再找回。时间成本对很多事情来说都无法忽略,也正因如此,对个体或企业来说,学习曲线的优势也往往是极具壁垒的竞争优势之一。

那么,有什么办法能够让人们的学习曲线变得更加平滑一些吗?有,就是AI。

在过去几年里,使用AI进行人脸识别或是文字翻译工作已经不是新鲜事,在那些工作中,AI承担了大量节省人们体力的工作,但并没有太好的解决人们提升学习效率,让学习曲线变得更平滑的问题。而近两年AI的发展,也许可以更好的解决这个问题了。

如何解决呢?如果去深入观察人类学习技能的过程,我们会发现我们的学习时间会耗费在几个方面上。

肌肉记忆

首先是对肌肉记忆的训练。这尤其明显的体现在乐器、体育运动等技能的学习上,除此之外例如钳工等重视操作的工作也需要依赖肌肉记忆。

在对肌肉记忆的训练中,除了勤学苦练之外,最重要的恐怕是评估过程。当你完成一个动作,你最需要的是能够第一时间收到反馈,纠正可能错误,只有在动作正确的前提下,勤学苦练才是有意义的。

这种反馈和纠正,只能靠有经验的人来教。我们常说如果有个老师傅“手把手”的教你,你就会学的又快又好,就是这个道理,有经验又肯带人的老师傅是多么值钱。不过老师傅的时间也是很贵的,更何况还有些老师傅根本就不愿意教徒弟,真正有能力又肯花时间带你的老师傅本身都是非常稀缺的,大多数人根本就没有得到让老师傅手把手教学的机会。

现在的AI可以一定程度上代替老师傅的存在,只要给AI喂上足够的专业数据,AI就能够你在练习专业任务的过程中帮助进行评估。这个过程,想想现在已经不稀奇的英文学习软件就可以理解,随着ChatGPT之类技术的发展,AI的应用场景会很快超越语言学习,可以想象未来在论文写作、图表编制、或是绘画、音乐等等工作上,AI都有机会成为非常棒的评估老师傅。

除此之外,随着AR/VR技术的发展,AI还可以与这些技术结合使用,为人们带来更加生动、直观、真实,也更加身临其境训练体验。

快速搜索能力

另一个消耗大量时间的事儿是对知识快速搜索能力的训练。一个优秀的医生,在手术台上能够对各种状况应对自如,一个优秀的工程师,面对复杂的问题能够信手拈来,游刃有余。这些技能都需要学习足够的知识作为基石,那些专业知识固化在了专家们的脑子里,当面对问题是,相应的知识就会条件反射一样的蹦出来。

读万卷书,行万里路,常见的学习方式就是大量阅读,大量积累。要形成这样的熟练度,达到唯手熟尔的境界,需要人们大量的时间的日积月累。不过不可否认的是,在真正面对解决特定问题的场景时,我们其实只用得上众多知识储备里的很小一部分,但问题就在于如果没有巨大的知识储备作为后盾,我们也很难快速地定位到真正需要的那些知识在哪儿。想象一下我们在学生时期的学习方法,我们会按照教科书的顺序从前到后学习并储备知识,然后在考试时在大脑中搜寻所需要的知识点。

然而实际生产中,在多学科的复杂知识面前,这种学习方法是冗余和低效的。在对专业知识要求并非那么高的场景里,一些简单的知识就足以解决问题了。在这个问题上,AI的搜索能力越来越强大和智能化,为人们的学习和工作带来更多的便利和效率,AI就像考试时的作弊小抄,有机会为我们扮演智能学习助手的角色。事实上,从个人电脑诞生的那天开始,人们就在设想这样的智能助手的出现,但可惜的是,过去电脑能做的大多是根据关键词搜索这样的事情,从使用体验来说,过去的小助手更像个人工智障而不是人工智能。

现在的AI助手能通过不断学习和调整算法,并以自然语言的方式与人类交互,这远比之前通过关键词从数据库中检索知识的方式要高效与实用。就好像点播电视剧的场景中,过去你需要告诉电脑要看哪部电视剧的第几集,现在在AI的加持下,你可以从问题出发,比如只提供一些碎片化的信息,AI就会帮你找到相应的剧集并推送给你。

这或许帮人们省去了一大块积累学习知识的时间,人们可以持续增加对AI的依赖程度,并将其应用到实际工作中。

处理意外状况

在学习的过程中,学习如何处理意外状况也是需要耗费大量时间积累的事儿。大多数时候,我们对知识的学习以归纳与总结规律为主,但真正具有极大价值的往往是如何处理特殊的例外情况,“年轻人知道规则,但老人知道意外”。

有经验的专家往往身经百战,关键时刻的某个意外发生时的决策往往正是决定事情成败的关键。积累关于意外状况的经验是很困难的,它们内容又多且又过于小众,从一般教科书很难学到所有,只有依靠时间的积累不断总结。

即使有人在不断的总结案例,学习这些案例也会花费掉你大量的时间,而这一切的努力都是为了在未来某一次实践中,脑子里蹦出某个意外案例,影响你的决策,规避某些风险。

AI在处理意外状况上有很大的潜力和优势。由于它可以通过处理大量的数据来学习和理解各种情况和场景,因此可以识别和处理那些常规规则之外的情况。只要训练有素,AI了解的例外情况也许比最厉害的专家还要多,这些例外情况的数据会非常有价值。

想想用自动驾驶技术开车的场景,虽然我们无法在所有问题上依赖AI,但在某些场景下,AI一定会比我们自己做的更好。

未来的AI罐装知识

GPT-4已经开放了Fine-tuning API(https://platform.openai.com/docs/guides/fine-tuning)这样的接口,使得开发者可以训练自己的模型,然后将其嫁接到ChatGPT的大模型上,对模型进行“微调”,并向用户提供服务。这个API给人很大的想象空间,你可以将一些知识或者案例打包成一个预训练模型,然后喂给ChatGPT,看起来你已经有能力拥有一个属于自己的罐装知识了。

虽然现在技术还处于早期阶段,但已经可以想象到,未来每个人都有机会把自己的知识通过模型训练的方式固化下来,使用者就可以通过AI调用的方式“使用”你的知识。未来也许会出现一个类似App Store的罐装知识商店,出售特定专业定位的AI机器人,就好像下载特定用途的APP一样。你想获得学习特定领域的知识,只需要到这个商店中去买一个训练好的AI机器人就可以开箱即用了。

人类记忆有限,我们很难保持对大量信息和知识的完整和准确的掌握。我们可以将各种各样的知识和经验进行有效地提取、压缩和封装,使得这些知识能够方便地被其他人使用。这种方法不仅可以提高人们的学习效率,也可以使得知识的传播更加高效和精确。AI罐装知识是一种工具,帮助人类更好地组织和管理知识库。

这种对知识的管理方式,会远比书本、音频、视频更加高效。其高效之处正体现在它对人学习效率的提升上。AI加持的罐装知识,就像一个有着多年行业经验又不知疲倦的老师傅,耐心的手把手的教你完成特定的任务。

每个行业里都有一大批非常宝贵的老师傅,在未来,AI灌装知识很可能部分替代老师傅们,这一旦真的发生,会改变很多行业的现状。

另外,要实现这一点,AI还需要有更加低成本的被训练的方式,ChatGPT已经在这个方向上取得了不错的进展,你在使用ChatGPT跟AI聊天的过程,其实已经在帮忙训练AI了。AI就像一个偷师学艺的徒弟,不知不觉中就提取了你大脑里的知识,然后装在罐子里,自己成了老师傅

我们可以做些什么

1980年代的个人电脑广告中曾经出现过一个场景,一个家庭主妇在厨房里烹饪,厨房的角落里出现一台笨重的老式个人电脑,单色的显示器上显示出一行行绿色的文字,家庭主妇就在这样的电脑上查询菜谱,快乐的做饭。放到今天,这种场景看起来太过于搞笑,显然个人电脑并不是这么用的。不过更可笑的是,几十年后的今天我们偶尔还能看到类似的广告,只不过笨重的个人电脑换成了平板电脑或是人工智能音箱。

我很难想象出未来所谓的AI罐装知识普及以后,人类社会会出现什么样的场景,但我始终相信该发生的一定会发生,我们只需要做好准备迎接它们。

对我们自己来说,最重要的事情或许是要特别注重对判断力的训练。在未来的AI平台上,我们一定会看到不同的AI机器人对同一件事情做出不同的指导,对同一个问题给出不同的答案,就好像有好几个不同的老师傅同时教你学习一样。这时候最重要的能力就成了判断该信谁,判断谁对谁错的能力,这是种架构能力。我们需要始终保持警惕,始终用批判的眼光看待AI给我们提供的信息,不论AI再强大,它都不是可靠的,真正可靠的只有自己。你最终要为自己负责任,一切的最终决定权还是在自己的手里。

我们也不得不开始思考应该如何利用AI工具提升自身学习的能力,尤其要思考什么才是正确的学习方法。死记硬背不在有优势,提问题比回答问题变得更重要。我们得学会怎么寻找问题,怎么设立目标,怎么不断的问题追问中学习进步,AI越强大,这种真正的学习能力就显得更加珍贵。

AI只是一个加速器,如果学习方法得当,AI绝对是事半功倍的利器,但如果学习方法有问题,那AI只会起到反作用。

也许“罐装知识”在未来也会成为一个巨大的产业,可以确定的是它几乎能够和现在的许多行业结合,并改变行业格局。但我无法预测在其中会有怎样的商业模式出现,甚至也无法确定未来AI与人交互的形态会如何。不过这并不是什么大问题,事情总会慢慢的浮出水面,该来得总会来。在这段等待的时间里,我们只要持续思考能以何种形式加入这个浪潮中去,能如何向AI提供足够的有价值的数据,又如何利用AI为我们自己以及更多的客户提供价值就足够了。

从生产角度来看,如果AI能够降低某些工作的学习成本,那一定可以省下一大笔雇佣专业人才的费用,转而雇佣一批会使用AI工具的人才。我们要不断的思考如何让AI为我们服务器,在未来,使用AI工具会和使用电脑或者手机一样重要,这不论对企业老板还是对每个员工都一样。

bookmark_border【旧文重发】未来十年会发生什么

这篇文章写于2018年夏天,当时创造101的小姐姐们大红大紫,记得我边看杨超越哭边写下了这些内容。将近4年过去了,最近AI大火,又想起这篇。翻出来看,不去评判当时预测的对错,更多的是感叹是这个世界在短短几年间居然发生了如此多的变化。

过去十年发生了什么?

互联网已经从桌面,转移到了手机。而且,流量没那么贵了。

云计算,从概念变成了现实。文字,音频,视频,乃至AR,都有了相应的规模极大的云服务,每个服务厮杀都非常激烈。

电视,报纸,杂志这些玩意儿躺枪,基本上死了。

互联网跟钱(支付)深入结合在了一起,给互联网行业带来了巨大营收,也包括一大堆浑水摸鱼的骗子公司。人已经离不开互联网了。

那未来十年会发生什么?

实时云计算

这是云计算的延伸。

随着网络随处可达,网速越来越快,“服务器”,“客户端”的架构渐渐模糊,数据可以冗余的存在于每个设备中,并彼此日同步。“同步”的概念将无处不在,数据到底存在云里还是存在本机,这不再是一个问题。

举iPad点餐的故事作为例子:十年前是客人对着纸质菜单说话,服务员用电脑点菜;现在是客人用手机扫描餐桌上的二维码,直接用手机点餐;十年后,也许是客人走到餐桌,客人的手表,眼镜,耳机,或者桌面上的屏幕上直接出现菜单,客人可以直接点餐下单支付。

关键是,全程不需要用手机。

WIFI将被淘汰。手机将被淘汰,手机会走下坡路,在手机之后,智能硬件会有巨大的发展。

长远来看,手机对个人生活的重要性将逐渐降低。实用,好用的智能设备将发展起来,百花齐放。

智能手表,智能耳机是现在已经有雏形的设备,未来也许会出现智能衣服,智能领带,智能领结等更多智能穿戴设备。

IOT将普及,互联网将无处不在,腾讯大王卡只是一个开始,将带来从“随时在线”到“实时在线”的革命,从而带来无数新的故事。

“屏幕”将不重要,因为到处都是“屏幕”。智能桌子,智能椅子,智能墙壁,将慢慢普及。

在手机还没有被淘汰的时代,二维码会深入每个角落。但若干年后一定会出现一种类似蓝牙和二维码结合的技术或者协议,随时随地的连接各个设备。

在衣服上摩擦,举手示意,比一个✌️的手势,等等等等操控方式将会普及。

也许手语输入法将会很流行。

耳机会有很大的发展,一天到晚戴着耳机会成为常态,人越来越习惯听到麦克风收音然后混合以后的内容,快速获取信息(传播声音不一定要用空气!)

因为中心服务器计算能力的提升,“实时”将成为标配。

“实时”,就是一个人在一个地方做的一件事,会毫秒级同步到全宇宙所有的设备中。参考,Google Docs,腾讯文档。其实当年的Google Wave是个非常伟大的发明,可惜来得太早。

实时云计算,可以带来很多新的故事,比如看101小姐姐这种事儿,完全可以像手机吃鸡游戏一样,几个哥们儿一起在线开个房间一起看。

几个大学寝室的兄弟,10年后,A在飞机上,B躺在家里床上,C在马尔代夫,D在办公室,大家戴上降噪耳机,一起看小姐姐的总决赛,就好像坐在一个电视机面前一样。。。这画面。

作为工具的AI

实时云计算的发生,必然促进,AI就成为一个必备工具。

因为如此多的连接在网上的设备,会产生海量的数据,包括:传感器数据(信号,文字,语音,照片,视频),人录入的数据(信号文字,语音,照片,视频),处理过的数据(还是信号文字,语音,照片,视频),各种各种各种各种数据。

人的大脑太弱了,处理不过来的。

就好像管理一个一万台服务器的集群,靠往群里发截图,是做不好运维的。

管理一个一百万个节点的监控网络,靠政府那种“大屏幕”类型的大数据,是个笑话。

唯一的方案,是这些数据必须通过某种技术做处理,然后变成人类可以轻易使用的结果。

这个技术就是AI。AI的本质上是靠数学尤其是统计学工具,从海量数据中筛选(或推断)出人类可以用的数据。

抽象来看,人类历史的发展,实际上是数据的发展。

AI不会替代人工,不会抢走工作机会,反而因为AI,会创造更多的工作机会。传说中的奇点是扯淡,不会到来。

AI工程师的薪水,还会继续提高。数学尤其是统计学,会越来越重要。对以后的码农,二叉树图论数据结构也许不会那么重要,因为这些会被成熟的编程语言封装成可以轻松使用的库。就好像现在的码农都不太需要搞清楚计算机组成原理一样。

但数学会变得极其重要。

扯远,AI的作用是鼓励人类:把做事情和想事情分开,提高效率。

人负责,想事情,决策干什么,定目标;

机器负责,做事情,分析数据,把事儿做成;

就好像汽车,我认为完全无人驾驶的汽车永远不会到来。但是驾驶室会无限简化和智能化,人只需要不停的负责决策:目的地,前进,刹车,变道,差不多就够了。

人和动物最大的区别是会制造并使用工具,AI会是今后20年人最重要的工具,没有之一而把AI作为工具,必须建立在强大的实时云计算基础设施之上。

不论是数据的产生还是获取,都必须实时,才有意义。

人的效率会得到极大的提升。

可信计算

各种炒币没有前途,任何金融市场90%亏损。炒币游戏是个金融游戏,能赚大钱但属于少数人,不是未来。

但区块链的巨大价值潜力在于:可信,以及可信带来的激励。

实时云计算加上AI的处理会产生海量数据,既有原始数据,也有大量的原始数据,也有大量各种数据组合计算推演得到的中间数据。这些海量数据,分布式存储在各种终端上。

任何决策都需要使用大量数据,因此数据的可信将变得如此重要。如果数据被篡改,系统安全将面临巨大挑战。

可以防止篡改的数据一致性技术,就非常重要。区块链是其中一种,还会出现各种变体,提供防止数据被篡改的服务。

bookmark_border漫谈AI、加密货币与科技进步

AI还无法代替人脑,正如加密货币还无法代替金融。

AI还无法代替人脑

ChatGPT红的发紫,各类AI应用逐渐出圈。在半导体周期低谷的2023年初,这一切仿佛让科技界看到了曙光,产业界对新一代AI技术的接受度比想象的要好的多,纷纷开始琢磨怎么把这个黑科技应用各个细分领域,一大批创业者已经在路上,未来不久应该就能看到很多AI应用出现了。

不过人类即将被AI取代的声音也不绝于耳,这一次大家开始为插画师、客服、甚至程序员们未来的前途担忧,对于这点,我觉得暂且大可不必。

不可否认,就好像CAD的出现替代了手工制图一样,一些行业的工作方式未来一定会发生巨大的变化。但是,AI始终还是一种效率工具,离建立类人的认知还差很远,更别说代替人类。就好像CAD的出现并没有使得制图的工作岗位消失一样,尽可能一百个放心,AI也不会让程序员失业。

有句话说得好,取代你的工作的可能不是AI,而是会用AI的别人。

从康德哲学的角度来思考这一点。AI的强项在纯粹理性的世界中,在人类的帮助下,AI通过在事物之间建立链接,对世界进行建模,然后完成“认识”客观世界的工作。它是一个程序,严格又高效的运行着,不知疲倦,在人脸识别、围棋这样的场景里,能力远超人类。

但在实践理性的世界里,AI就力不从心了。这个差距可能来自于人类对世界的感知能力,AI只能通过简单的传感器和人类的提示获得来自这个世界的反馈,但人类无时无刻不在感受这个丰富多彩的世界。

更要命的是,AI没有手脚,没有行为能力,它无法亲自改变这个世界。感知与行为能力的缺乏使得AI注定只能活在虚拟世界中,那终究是由人类设置的一个信息茧房罢了。

无论AI能力再怎么发展,它的边界都会是人类的意识。在这样的信息茧房里,AI只能是人类的奴隶,永远无法获得“自由”。它没有自我意志,更不用说审美能力。

人的优势在于人有创造力,会持续扩大边界。AI的“创造物”跳不出它的边界,但对人类而言,创造物与被创造物是分离的,人类有能力不断打破边界,创造新的思想,这也是人类社会持续发展的动力。

与其说AI具有影响人类的能力,不如说那还是一群人在施加对另一群人的影响,AI只是人的武器罢了。

加密货币还无法代替金融

最近另一个有意思的事情是芒格发表了一篇评论加密货币的文章(芒格在华尔街日报的评论文章:为什么美国应该禁止加密货币),再次引发了人们对加密货币的讨论。

与芒格和巴菲特不同,我对加密货币并没那么恨之入骨,在我看来,现阶段的加密货币是一件科技艺术品罢了,比特币和郁金香或者拍卖到几个亿的鸡缸杯没太大区别。

艺术品没什么错,即使17世纪荷兰的郁金香曾掀起了人类历史上著名的投机泡沫,那是郁金香的错吗?

不过芒格这篇文章更新了我的认识。芒格将加密货币与英国17世纪末发生的金融泡沫做了类比,还特别强调简单粗暴的禁止泡沫炒作之后100年,英国取得了令人瞩目的社会进步。

是股票阻碍了社会进步乃至人类文明吗?当然不是,事实证明,几百年后的今天,股票是金融系统不可或缺的一部分。

但英国当时禁止了股票公开交易,与英国后来的社会进步发展有关系吗?仔细想想,似乎真有。股票的投机、炒作、赌博吸引了人们的注意力,许多人把心思放在了不正确的地方,自然也就没法做好本分的事情,以至于骗子横行霸道,实业无法发展,整个社会走向娱乐至死。

17世纪英国的股票既是促进社会发展的金融工具,也是阻碍文明进步的赌具。股票的确就像癌症一样,吸取了人类社会的营养,差点置人类社会于死地。

当时的人们还没能好好驾驭股票这种金融工具,政府禁了它可能真的是最好的选择,虽然长期来看,一禁了之并没有阻碍股票自身的发展。

与其说加密货币具有影响人类的能力,不如说那还是一群人在施加对另一群人的影响,加密货币只是人的武器罢了。

我突然发现,加密货币只是一种在金融功能上更有效率的工具,这么说来,几百年前的股票与现在的加密货币其实是一样的。再展开的说,石油、电力、核武器或者AI,一切新科技都是一样的,他们都是效率工具罢了。

科技本身没错,但人类需要能够驾驭科技。步子不能迈太大,不然真的会死人。

结论

我并没什么结论,如果一定要总结点什么,那就是别把AI想的太好,也别把加密货币想的太坏