学生突然问我:老师,宿命论可信吗?
我问怎么说。
他发来了一个视频,说里面有一个特别成功赚了很多钱的大学霸,说「所有事物的发展在宇宙爆炸那一刻就定好了,都是必然结果,早就预设好了。」 他说,如果分子原子的运动能被精确计算,下一步的发展确实是可以预料的。
我说我还没来得及看这个视频,但从话语风格和讨论视角推测,说这话的人大概一直都是计算机相关专业的。
他说对,搞大模型的。
我说那就正常了。如果学计算机相关专业的人成就特别出色,同时有可能缺乏对自然科学的基础认知和底层敬畏,对自己的技术又极有信心,就可能会这样。
他问,难道也是缺乏通识知识?
我说也不见得是缺乏,毕竟再厉害的人,都可能存在不擅长的领域。
这个对话让我想了很久。
不是宿命论本身——那东西从拉普拉斯妖开始就被讨论了无数轮,热力学第二定律和量子力学的不确定性原理早就把机械决定论锤烂了。
我想的是另一个问题:计算机专业如果缺乏自然科学的知识学习,同时万一还缺乏人文学科的素养培养,就可能因为自己学科领域的出色而过于有信心,乃至到自负的程度——缺乏对自然的敬畏,也缺乏人文的关怀。
然后在这个基础上,为什么优秀甚至杰出的工程人,尤其是搞计算机的人,特别容易陷入一种"我这条路径能解释一切"的幻觉?
蒸汽机师傅的终极奥义
假设你是一个十九世纪的蒸汽机师傅。你一辈子都在优化热效率、改进活塞气密性、调校飞球调速器。你造出了当时最高效的蒸汽机,力大无穷,驱动工厂、火车、轮船。你可能真心觉得,蒸汽机就是解决一切动力问题的终极答案。
过了些年,内燃机把汽车送上了公路,燃气轮机把飞机送上了天。
再过些年,核反应堆把原子核的能量释放了出来。
回头看那个蒸汽机师傅的"终极奥义",是不是觉得太早了?
这不是蒸汽机师傅水平不行。他可能在他那个范式里已经做到了极致。他缺乏的不是聪明和努力,是认知的维度和角度。他原来的工作场景可以不知道电动力学,也未必知道链式反应,更不用说什么高温超导。这些东西不在他的知识坐标系里,所以他无法想象能量的来源除了烧开水还能有别的方式。
就像一个一辈子只吃过采摘的水果的人,不知道食物还能煮着吃。他不是固执,是真没见过。
从投石机到核武器
古代的工程发展也遵循类似的轨迹。从简单的抛石,到床弩,到连发弩,到利用重力势能的重型投石机——工程优化一直在推进,射程越来越远,威力越来越大。如果没有能源革命,迟早会出现机械动力的连发弩箭,或者其他形式的动能武器。
但炸药的出现不是靠工程优化投石机得来的。核武器的出现不是靠把炸药做得更大更纯得来的。这些是范式跃迁,是换了一条赛道,用完全不同的物理原理实现了几何级数的能量释放。
工程优化能让你在同一条赛道上跑到极致,但它给不了你新赛道。
成功的案例不能证明路径的普适
回到搞大模型的那群赚了很多钱的出色人士。或许有些人真心觉得 Transformer 就是终极架构,Scaling Law 能一路通向 AGI,数据和算力能解决一切。
但到目前为止,似乎并不是如此。
拿蛋白质结构预测来说。AlphaFold 确实在这个问题上做到了惊艳的程度,但它用的 Evoformer 架构本身就融合了演化生物学的信息和结构生物学里的不变性约束,不只是一个通用 Transformer 灌数据就能跑出来的东西。换句话说,问题本身的特性决定了这个解法能走多远,而不是解法的通用性决定了它能覆盖多少问题。 一个特定问题上的成功,不等于这个技术路线在所有问题上都能复制。
搞研究的人对此应该体会更深——一个实验室同时探索好几个方向,十个里能跑出来一两个就很不错了。那些没跑出来的项目,外人可能根本也看不到,新闻报道里也不会写。所以我们看到的"成功案例"本身就存在严重的幸存者偏差。
把工具当信仰,把路径当终点,忽略了问题本身的结构差异,这是所谓杰出工程师最容易犯的错。
更需要通识的计算机专业
说回开头的判断,为什么计算机专业的杰出人士尤其容易踩这个坑。
一个是学科本身的特性。搞计算机,你自己定义问题,自己解决问题。语言是你设计的,编译器是你写的,跑起来不对你就改,改完再跑。这跟物理化学那些实验科学完全不一样——人家是去猜自然规律,猜错了没办法改规律,只能改自己的猜想。但计算机里,规则就是你定的,边界不够就加内存、不够就加显卡,实在不行换个架构重来。待久了你就容易忘一件事:出了这个屏幕,到了真实世界,大多数问题的规则不是你定义的,也不是你改几行代码就能推平的。
另一个是历史积累的效用不同。物理学家面对的宇宙,几百年来牛顿、麦克斯韦、爱因斯坦这帮天才都没穷尽,从业者天然就有种敬畏——自己不过是漫长链条上的一环。生物学家面对的是进化了几十亿年的系统,越研究越觉得复杂。但计算机这行节奏太快,快到三年前的框架就有人叫"上古遗产",五年前的论文可能就没太多人引了。这种节奏会给人一种错觉,觉得过去的东西不重要,我手上这套才是最新的、最能打的。可物理学的牛顿定律三百年了还在用,你敢说三年前的框架过时了,但不敢说三百年前的力学被淘汰了——这本身就是一种学科差异带来的认知偏差。
自然科学告诉你的世界很硬核:能量守恒、熵增、测不准关系,这些是宇宙层面的约束,不是你多买几张 H100 能突破的。人文社科告诉你的东西很复杂:历史上多少帝国因为傲慢崩了,多少决策因为只看一个维度搞砸了。这两类知识恰恰是计算机培养方案里最容易被挤掉的——工程相关的课表太满了,操作系统、编译原理、算法、机器学习,哪个不重要?挤来挤去,通识课的比例就有限了。
一个人如果这三样凑齐了——习惯了自己定规则、习惯了快速迭代觉得旧的都不值一提、又恰好缺了自然科学和人文的底子,然后他又在自己的领域做得很出色赚了很多钱取得了世俗眼里的「巨大成功」——那很自然,他的自信心就容易漫出自己学科的实际边界。看什么都像一个待优化的系统,什么问题都觉得加数据加算力能搞定。宿命论也好,AGI 必然到来也好,说到底都是同一个思维习惯换了个话题而已。
谦逊是一种认知能力
或许有一个规律:真正厉害的人,往往相当谦逊。 如果一个人不谦逊,他可能也很有能力,但未必能到最顶尖那个层次。
为什么谦逊和水平有相关性?因为谦逊不是道德品质,是认知能力。你能意识到自己不知道什么,你才可能去学。你能意识到自己当前的方法有边界,你才可能去突破边界。一个人如果觉得自己已经掌握了终极真理,他的认知容器就满了,再也没有空间装新东西。
那种一个劲儿吹嘘某一个技术、某一个框架、某一个理论的人,要么是能从吹嘘中获得利益,要么就是真的——用北方话说——山炮。
不过"山炮"这个词可能太重了。也许只是偏执。偏执一段时间之后,也许能改变。真正的山炮是不认为自己需要进步或者改变的。所以重点不在于一个人当下的观点对不对,在于他有没有给自己留接受信息发散的空间。
保持开放心态
我的几个学生现在持续看新东西,对自己学过的内容持审慎态度,持续更新,反复反思。这就是进步的节奏。我希望他们千万不要突然松了劲头,也不要崩得太紧,只要持续保持开放心态持续进步就好。
哪怕有一天人类真的达到了 AGI,也不一定只有一条道路。就像肉可以煮着吃,也可以烤着吃。最怕的不是走得慢,是走着走着你觉得自己行了,哪怕还没达到目的地,就突然信心爆棚,然后把地图一扔,说其他的路都是错误的。
回到宿命论那个问题。说实话,这种哲学层面的终极问题不是我所擅长的领域。虽然我内心并不认同机械决定论,但你要我给出一个无懈可击的论证来驳倒它,我也做不到。量子力学的不确定性、复杂系统的混沌效应、自由意志的神经科学讨论——每个角度都有各自的解释力,也可能有各自的局限。我唯一比较确定的是:如果你因为相信一切都是注定的,就不再努力、不再探索、不再反思了,那这个信或者不信的结论对你而言就不太划算。
真正值得琢磨的或许是:当你发现自己正在用你熟悉的那个锤子去砸所有钉子的时候,能不能停下来问一句——有没有可能,有些东西根本不是钉子?
CycleUser