吴恩达

在人工智能学的初期,业界最流行的观点是由麻省理工学院人工智能实验室的创始人Marvin Minsky提出的“Society of Mind”理论,这个理论的核心思想是:

“人类的思维是由成千上万个单元共同协作产生,当这些单元组成一个整体时,他们就会产生无限复杂的,我们称之为思想和感情的东西。”

所以如果依照Marvin Minsky的思路去组建人工智能,就需要建立并组合成千上万个独立的计算模块,这些模块分别发挥不同的作用,例如控制语音、控制视觉等,然后需要通过复杂算法将这些模块全部连接起来去模拟大脑产生思维。这看上去像是一个不可逾越的技术鸿沟。

Andrew Ng说,正因为在“Society of Mind”理论下的人工智能学难度极高,所以导致他在大学时就放弃了从小树立的“建造一个具有人类思维的机器人“的梦想,他甚至作为斯坦福的教授劝阻自己的学生去探寻这条不归路。然而,在接触到“one algorithm”假设后,他又再度起航了。

与“Society of Mind”不同的是,“one algorithm”假设中并不认为人脑中的单元是有明确分工的,而是一块领域有多元化功能的,例如处理听觉的部位同时也控制着视觉,虽然这种行为可能只存在于大脑的发育阶段,但它证明了大脑在本质上是一个通用处理器,通过调整,大脑可以处理不同类型的任务。 

正是这样思想引发了深度学习(Deep Leaning)技术的兴起。在深度学习理论下,科学家们希望建立一个模拟大脑处理信息(数据)的机器,用传感器去模仿神经元感知、采集数据,并对它们进行分层、聚类,建立模型逐步学习。这种思路让“机器学习”第一次拥有了“自我学习”的能力,即人们不需要再为计算机提供数据模型和定义,而是完全由电脑自己去理解事物,它在很大程度上更接近人工智能的概念。

在深度学习热潮的指引下,Andrew Ng于2011年加入了Google的深度学习项目,然后我们便看到了那个著名的“猫脸识别”系统的诞生——1000台计算机、16000个芯片组成的系统在“学习了”数百万张猫脸图片,将线条、亮度、边界、色彩等多个特征分类,最后它在看到猫的图片后,就能将它识别出来,与学习过的图片归为一类,虽然计算机系统内本身并没有“猫”和“猫长得是什么样子”这些概念数据。这就像人类大脑的记忆过程——当神经元接收到各种感官信号时,它们会把信号传递给海马体,并逐步形成持久的网络。

谷歌开挂

不过Andrew Ng说目前深度学习的效果还远远未达到大脑那般准确,其中很重要的一个原因是他们仍然不能完全理解大脑是如何工作的,所以如今有意于发展深度学习的微软、高通等大型科技公司都在争相雇佣神经科学方面的计算机科学家。

同时,在“猫脸识别”试验中,传感器、芯片的规模巨大、负载压力也不小,如何设计元器件尺寸,降低能耗并大幅提高运行效率也是Andrew Ng等科学家需要解决的问题。

不止是科技公司,这项科学项目也收到了美国政府的重视,在美国总体奥巴马宣布启动的BRAIN项目中就希望能够绘制出大脑神经网络连接图,如果能弄清楚成千上万的神经元如何相互连接以及信息如何在神经网络中被存储和处理,那么工程师们就能够更好地构造人工大脑。

可能读到这里,你仍然无法想象这项技术对我们日程生活的变革。那么做个简单的说明:如果计算机有了感知学习的能力,那么通过各种设备的各类传感器(摄像头、陀螺仪、平衡仪等),你的任何状态数据都会被电脑获取,并且能够像人脑一样进行处理判断,会将“大数据”的精度提升到一个全新的高度。到那时,搜索、电子商务、翻译等无数行业将被改变,说不定到那时,我们也可以方向的把记忆和思维存储到计算机上,实现某种意义上的“永生”。

当然,这并不是一朝一夕的事情,就像Andrew Ng说的那样,理解大脑、构建正确的算法、搭建完美的系统……这都仍需要数十年的探索,但在深度学习理论的指引下,我们看到了它实现的希望。

附注:Andrew Ng 的 Deep Learning 教程已经被一些中国的志愿者翻译成中文。

文中配图来自网络

最后修改:2022 年 12 月 05 日
如果觉得我的文章对你有用,请随意赞赏