Richard Socher说,“AI帮助我们认清自己”。
一次机缘巧合,让他从计算机语言转投AI研究,此后并沉迷在“深度学习”世界里。
拜师吴恩达,投身深度学习探索
Socher在德国主修计算机语言学,获得了莱比锡大学理科学士和萨尔兰大学理科硕士学位。此后,他在斯坦福大学读博士时,曾作为交换生前往美国普林斯顿大学,在那组建了AI实验室。
他组队参加2007年语义机器人视觉挑战赛( semantic robot vision challenge),其团队荣获大赛冠军。此外,Socher还加入普林斯顿大学的研究团队,开发设计ImageNet—即由标有注释的图像构成的可用于计算机视觉研究的大型数据库。
Socher称:“深度学习的魔力在于它不仅能够提取出传统机器学习的结构特征,而且其模型可提取和呈现原始图像或原始词表,最终在同一个端对端的训练模型中作出预测。”
换言之,过去传统的机器学习需要深层次专业知识,且需投入大量时间和精力研发模型和算法。为提高预测的准确性,计算机的“学习”多借助模型的优化调整,而深度学习则聚焦于模型设计,使用海量训练数据,建立多层次的深层次结构。
自此开始,ImageNet项目负责人每年都举办一次ImageNet大规模图像识别挑战赛(ILSVRC),推动了深度学习的快速发展,使其成为图像识别研究中的新兴工具。(2012年该大赛的一支深度学习团队将图像识别的错误率从25%降低到16%,深度学习领域自此进入全盛时代)
也是这个时候,Socher开启了从事深度学习的职业生涯。当然,还少不了他的导师。
Socher在斯坦福大学求学时,有幸拜Andrew Ng(吴恩达)和Chris Manning为师。Andrew Ng与谷歌合力开展计算机视觉研究时,首次引入了深度学习,并为2012年正式推广深度学习作出了巨大贡献,而他的另一个导师Chris Manning也堪称“著名的自然语言处理研究员”。
Socher借助循环神经网络(深度学习的变体),使自然语言处理程序能更好地“理解”文本的语境和情感。之前的研究员多建立情感分类模型(即体现积极或消极的词表)对文本进行分类,并假设词语的顺序不重要。然而,基于循环神经网络分析文本情感,无需预先建立模型,而是分析词间的联系,从邻近词,逐个依次向后分析,建立一个多层关系网,便于精准理解句子的含义。
Socher的博士论文被评为斯坦福大学计算机科学专业的优秀毕业论文。论文中提到:深度学习不是成功处理自然语言的唯一工具。他提出了新方法,无需针对各任务建立不同的机器学习模型,就可同时完成大批不同的自然语言处理任务。他学术生涯的重心不在此,但他的职业生涯却一直致力于实现“多任务同时处理功能”。
学术生涯之后的另一种人生,开创MetaMind
Socher的职业生涯和宏伟志向也是众多AI领袖的鲜明写照:他们可能还是博士生时,已投身于AI领域的研究,但并未继续进修深造,而是选择自己创业或加入其他企业。
在被问及放弃学术生涯的原因时,Socher回答道:“应用人工智能获取资源,对人们的影响空前巨大,远远超过对整个行业的影响。”因此,他放弃了普林斯顿大学助理教授的职位,于2014年开创了MetaMind公司。
短短四个月,Socher及其团队从Khosla创投公司与Salesforce公司的CEO Marc Benioff处筹集了八百万美金资金。与此同时,他们还推出了一个分析文本图像的深度学习平台,该平台在网络上运行,操作简单。多年来,MetaMind公司取得了诸多瞩目成就。2014年,该公司以92.4%的识别准确率完成了ImageNet大赛。准确率较大赛冠军谷歌低了 0.8%,但其运算量仅为谷歌公司的千分之一。
用Socher的话来说,“MetaMind是个用途广泛的通用引擎。现已应用于药物影像、放射学、情感分析以及卫星图像等领域。”
2016年的4月, MetaMind被Salesforce公司收购。Socher说:“作为一个小型科技初创企业,总是考虑如何将自己的影响力最大化,但无论是创建强大的销售团体,还是建立人力资源和市场都需要很长时间。Salesforce是我期盼的最好合作伙伴。”
Socher继续解释道,对于成功的人工智能公司来说,数据、算法以及工作流集成至关重要。Saleforce公司拥有海量数据, MetaMind与Saleforce的其他机器学习团队负责设计算法。工作流集成极其重要,关乎Socher的职业志向、研究的现实意义以及对世界产生的影响。
“你不能设计完一个人工智能算法,直接把它扔给其他团队,然后跟他们说,这个算法不错,用吧。应该尝试将这个算法融入工作流程中,它才能真正为人们所用并造福人们。Salesforce了解人们的工作方法,将算法与工作流结合,融合于现实产品,供世界范围内的客户使用。这样做可以获得额外好处:就是从真实的世界各地的用户那里得到反馈。融合方法得当,就能不断学习,在使用中优化机器学习模型”,Socher说。如此往复,实践性知识会融入研究工作中,逐渐形成良性循环。
进入Salesforce,以AI+CRM再战江湖
作为Salesforce的首席科学家,Socher不仅管理着一个研究团队,该团队还陆续发表了多篇重要论文。主题涉及自然语言处理、图像说明、问答系统及多任务共同学习(通过同一神经网络执行大量NLP任务)。这些研究开发了诸多实用型应用设计,比如最近推出的爱因斯坦视觉系统(Einstein Vision),该系统由一组API组成,帮助各技术级别的开发者为CRM添加图像识别功能,快速建立人工智能驱动的应用。
Salesforce不仅向Socher提供了一个将理论融入实践的完美环境,也使其有机会继续进修深造。每年他都会与Chris Manning联合开展一次“自然语言处理与深度学习”的课程。这门课有近700名学生参加,是斯坦福大学研究生课程中人数最多的课程。这门课几乎座无虚席,由此可见,深度学习正不断崛起并大跨越向实践应用发展,人们对人工智能的兴趣也与日俱增。
为实现“多任务同时处理”的功能,Socher一直致力于开发自动问答系统。虽然问题不同,但只要有相同输入,即可启用一套多任务共同运行模型。Socher非常自信的说:“未来五年,我们在问答系统方面将会取得巨大进步。”比如,他认为其团队将实现特定企业机构中汇集所有相关数据,投入使用“智能对话系统”。
Socher表示,人们最终一定会制造出来全能的(近乎真人的)人工智能,但他拒绝给出具体时间。与现今大多数科学家一样,他也处于一个唯物主义范式中:“我不认为任何哲学因素能妨碍我们的再造智慧,但是前路漫漫。”与此同时,他也致力于开发应用,无论是深度学习的试用功能,还是接着前人70年的研究,努力制造更加有用的电脑。
Socher在其博士论文中引用了语言学家J.R.Forth的著名言论“观其伴,知其意。”同样,你也能从开发者们的社交中,看到一个逐步完善的人工智能的未来。Socher不仅活跃于世界经济论坛及其他场合,还积极与该领域其他人士互动。一方面与团队成员、学术会议上的研究者和因讲座、论文展示以及论文发表等方面相关的研究者保持紧密联系,另一方面与Salesforce的员工和用户等实践者进行交流。
与他人互动、学习、探讨、合作是人类生活的重要方面,是我们独特的传递信息与语境的行为,也是人类创造性在社会层面上的体现。正因如此,人类智力永远无法被人工智能取代。但是有像Richard Socher这样坚持教计算机从数据中获取新知识的人,人工智能必将蓬勃快速发展。
<来源 :Forbes;编译:科技行者>