我读小学的时候数学课还有“珠算”的项目,就是教我们用算盘做加减法。每到学珠算课的时候,我们就得背着一把算盘去学校,一些珠算口诀我现在还记得,比如“一上一、二上二、三下五去二”。当时我们的电视里经常会出现两类节目,一种是讲述我们灿烂的五千年文明的,另一种是痛诉我们落后经济的,讲前一种的时候肯定会扯出来四大发明以及算盘,讲后一种的时候就会沉痛告诫大家,我们太落后了,要被开除地球球籍。每到讲算盘的时候,就有打算盘的高手出来和一群人PK,大家用计算器,她用算盘,比加减法谁更快。主持人一个字一个字报完算题,往往打算盘的人就喊出答案了,而按计算器的人还在埋头按,主持人满面激动高声重复答案,观众掌声啪啪响。
我当时隐隐约约觉得这种比赛有点问题,但又说不出问题在哪里,今天我知道了,用这种方式比简单的加减法,时间都花在输入上了,真正的计算时间完全忽略不计,所以完全不能说明算盘比计算器快,计算器里面虽然是最简单的芯片,但是芯片就是芯片,计算就是比人快。
今天早就没人用算盘了,不管当初电视节目吹算盘有多方便多快捷,真实生活里,在十块钱一个的计算器面前算盘输得毫无还手之力。等我们这代人没了,应该也就没人会打算盘了。没人会就没人会吧,现在也没人直接嚼生谷子吃生肉了,总不至于还给茹毛饮血申请个文化遗产。历史的车轮滚滚向前,无数当年敝帚自珍的技艺在新技术的面前就这么被碾压了。
智慧到底是什么,目前我们还找不到答案,在计算机发明之前研究智慧是个很不靠谱的事情,所以我们得出了“神创论”:人类是上帝的复制品,我们的智慧来自于伊甸园里的智慧果。电子计算机发明后,我们忽然发现人类可以掌控如此强大的计算力量,探究智慧就成了可以尝试的事情。
人们首先尝试的是挖掘蛮力计算的方向,比如让计算机来和人类比下棋。斗兽棋、西洋棋、黑白棋、五子棋之类可以穷举所有可能的棋很轻松就被计算机解决了,国际象棋无法穷举所有可能,但只要有合理剪枝,计算机还是可以比人类多考虑很多步,到1996年也战胜了人类。很多人对深蓝战胜卡斯帕罗夫不服气,认为这只是几个计算机科学家战胜了卡斯帕罗夫,而不是计算机,因为计算机下棋的时候使用了人类的棋库,算法也没有逃脱穷举法,所以只是几个会下棋的计算机科学家借助一台计算机破了卡斯帕罗夫的天才智慧。当时有个说法:看计算机有多聪明,还是让它下一局围棋吧!因为围棋有19x19个格子,一局棋的可能性是个天文数字,完全无法穷举,每落一子对棋局的形势改变也非常不直观,只有懂棋才能看出个大概,而“懂棋”就意味着要对图形有个大致判断,这又卡在了计算机科学当时的弱点上,于是,对人工智能的研究又回到了对生物神经系统的研究上。
人类的大脑非常复杂,900亿个神经元细胞形成错综复杂的神经网络,复杂度堪比宇宙星系,我们连它们工作原理的头绪都没找到。法国有个44岁的公务员,因为左下肢乏力去医院检查身体,医生给他做了个MRI,结果非常震惊:这位公务员有先天性的脑积水,而且非常严重,整个大脑的实体组织只有薄薄的一层,中间都是空洞。医生对他做了IQ测试,发现他的综合智商75,语言智商84,操作智商70,虽然属于笨人,但是生活可以自理。这个案例发表在顶级期刊《柳叶刀》上,除了让世界感慨重度脑积水患者也可以在法国担任公务员,更让人震惊的还是人类大脑的复杂程度和超级容错机制。
虽然我们无法对人脑建模,但是今天的计算机完整地模拟一只1000个细胞组成的蠕虫还是没有问题的,这就是Open Worm项目。这个项目的发起人认为,了解蠕虫这种简单生物的神经系统,是我们认识人类大脑的第一步。该项目公开了全部源代码,在计算机里模拟了整只蠕虫的体细胞,尤其是构建了完整的神经系统,对神经元发出刺激,看信号的传递和反馈,可以初步了解神经系统的工作原理。把这套神经网络灌入一个乐高玩具车,这辆车就有了撞墙后折返的简单神经反射功能。
用这种方式模拟一只蠕虫是可行的,但是模拟人脑则完全不可行。人类的智慧也是高度模式化的数值计算,既然不能了解,就应该把大脑当做一个黑盒子,不用去解剖大脑,只要我们能够不断寻找新的算法和数据处理的方式,让计算机展示出类似于人类智慧的数据处理表现即可。如果一个东西长得像鸭子,走着像鸭子,叫起来嘎嘎嘎,那么它就是鸭子。
我们可以从人类的行为学上来对人脑的学习过程有个简单的了解,一个婴儿出生,他的本能部分是天生固化在神经网络中的,比如强光照射会让他的瞳孔迅速变小;触碰他的脸颊,他就会迅速扭过头去张嘴吮吸;竖着抱起,让他的脚接触一个平面,他就会双脚做出迈步的动作……这些反射都不需要大脑决策,是固化在底层神经网络中的,比如脊髓、脑干等等。而语言等功能必须要经过学习才行,对语言的学习过程就是大脑的神经网络对外界数据建立数据处理固定模式的过程。
婴儿学习语言的过程中,“要”和“不要”是婴儿最早学会的表达,然后就是各种名词概念,接下来是动词、代词、复合词,直到句子。在学习名词的过程中,父母会指着这个物体反复向婴儿重复这个名词,婴儿的大脑中不断对这个物体做图像识别,并形成对该名词的固化。这个过程中会不断纠错,婴儿认识了“猫”,但是把邻居的西施犬和画册上的虎也认成猫,这是很正常的,这个时候父母就会纠正他:这是狗,这是虎。婴儿可能会对此感到疑惑,但是经过反复更正和学习,他就会把“猫”的图像识别和定义做得更清楚。
人类在出生时近1000亿个大脑神经元就已经产生和分化好,并且处在它们该存在的位置,等着建立神经网络。这时候的神经元还没有多少触突,相互之间也没有多少链接,新生儿的神经触突数不到成年人的三分之一。在婴幼儿的成长发育过程中,神经元迅速伸出触突,彼此建立起非常复杂的链接,相连的神经元可以传递电和化学信号,接近三岁的时候,触突的数量达到顶峰,此时的数量是成人的二倍,这段时间也正是人类学习和认知最快的时期,我们基本的生存技能,比如语言、图像识别和分类、运动都要在这个时候建立起来。此后的时间里,大脑不断优化和修剪神经元的链接,让信息的处理更加高效。在神经网络的建立过程中,链接的建立是随机的,但是修剪不是随机的,大脑不断根据外界信息和反馈来完成。最终形成的神经网络复杂且能高效处理数据,即便是相同环境里成长起来的同卵双胞胎也会有完全不同的两个大脑。
模仿生物神经系统建立的神经计算网络,基本原理就是一层一层处理和过滤信息,每一层的基本运算都很简单,无非是用加法和乘法来完成矩阵运算,但是运算中的各种参数因子是个未知数,只能让神经网络通过大量的数据来自己学习,这个学习的过程和孩子学习识图是一样的,大量各种形态的图像数据输入,对最终输出做出纠正,一旦发现输出错误就回退尝试新的参数设定,直到找到复合要求的输出。所以神经网络只关注于问题“可解”,并不强调“最优解”,每次解决和处理问题,都可以进一步优化网络参数,让网络适应更复杂的数据输入。
我只需要扫一眼就知道墙角那边蹲着的动物是一只猫,这是因为我在婴幼儿时期经过学习,已经在大脑皮层里形成了对猫的图像特征处理模式,大脑在接收到图像后会迅速整理数据,经过神经网络的层层筛选,最终形成一个“猫”的结论。大脑在做图形处理时非常高效,这意味着大脑在图像处理时做了运算精度的裁剪,并且能够并行处理数据,而我们传统的CPU恰好是为了高精度计算而设计的,在并行处理上功能也非常弱。在用计算机建立人工神经网络的过程中,我们需要的不是强悍的CPU,而是能够对大量数据做并行化低精度运算的处理单元。早在1943年的时候,美国神经学和控制学专家沃伦·麦卡洛克就发表论文提出了人工神经网络的设想,1969年马文·明斯基和西摩·帕尔特又进一步提出了机器学习概念,但是受限于当时的计算能力,这些都无法实施。到2000年以后,随着GPU问世,计算机具备了大规模并行处理能力,人工神经网络开始活跃起来。
一直到2016年,Google Deepmind团队的AlphaGo战胜了职业九段李世石,才在世界范围内掀起了对人工神经网络的关注。这是一场彻底的胜利,AlphaGo的研发者并不懂围棋,打开AlphaGo程序也没人读得懂里面天书一样的各种参数,AlphaGo完全是靠自己学习围棋来达到了战胜人类的能力。最初的AlphaGo以CPU+GPU为运算单元,随着运算量的增加,GPU毕竟不是专为神经网络计算而设计,Google为了提升效率而自行设计了计算单元TPU。TPU是专为深度学习框架TensorFlow而定制的,改用TPU的AlphaGo提升更快,仅靠单机4个TPU就在随后的比赛里碾压了所有人类顶级棋手。
如果你手上有华为的Mate 10或Mate 10 Pro,你可以试试看打开照相机,如果你把相机对准一个人,那么预览画面的左下角就会出现一个“人”的小图标;如果你对准植物,就会出现一个植物的小图标。这是因为华为这一代的手机芯片麒麟970已经内置了人工智能的运算单元NPU,让手机有了对图像场景的识别能力。手机上的NPU和Google的TPU在原理上是类似的,但是更强调功耗控制。华为的工程师在实验室里使用机器学习训练电脑识别图形图像,然后把训练好的参数灌入手机系统,当手机打开照相机时,照相系统就会实时调用NPU来分析图像场景。如果没有NPU参与,仅靠手机的CPU或GPU,这个过程的耗时是无法忍受的,借助这个专为卷积算法而设计的NPU,Mate 10系列手机可以近乎于实时地感知到当前拍照的场景,以便对拍照进行优化。Mate 10现在已经可以认识十多个场景,比如拍人、拍蓝天、拍植物、拍食物……新的智能识别功能还可以在今后的软件升级中加入。
Mate 10是第一次把人工神经网络计算引入手机,目前能够实现的功能还主要集中在图像识别和处理上,相对于对人工智能的巨大想象空间,目前的这一步无比微小。如果把2016年AlphaGo的胜利算作人工智能纪元的元年,麒麟970带给Mate 10的这一步只是在手机这种便携式设备上的第一次实用性的尝试,未来可以承载的想象空间无比巨大。1969年阿姆斯特朗在月球的表面留下了人类的第一个清晰的脚步,也正是在那一年,机器学习的构思在人类的头脑中初步成型。月球上的一小步看起来是那么不起眼,但为了实现这一步,从1961年5月25日启动阿波罗计划到1972年12月计划结束,除美国航空航天宇航中心外,一共有120所高等学校、20000家工厂、400万人投入到这个行动中,累积花费250亿美元,考虑通货膨胀,这笔投入在今天超过千亿美元。但是这些投入不是白白花掉的,阿波罗计划结束,为这项计划而诞生的各项发明和技术推开了人类信息时代的大门。人工智能时代是信息化时代的延续和新生,今天在这个领域的每个微小的进步都会累积起来,直到再为我们推开一扇伟大时代的大门。
作者:Mr. AI
雷锋网原创文章,未经授权禁止转载。详情见转载须知。