当前的位置:泉州网站建设 > 新闻中心 > 互联网 > 正文

达摩院重修“巴别塔”

来源:泉州网站建设   时间 : 2019-03-04 14:29  编辑 : 泉州网站建设

给你一分钟,闭上眼睛理解一下。

这个水渠,就是我们的语言。(这回你理解为啥说话又叫沟通了吧)然而,语言携带的信息量很少,就像水渠的宽度非常窄,很难把一个湖里的水瞬间全部灌进另一个湖里。

脑联网1.1:特定图灵测试级别的人机语音交互+互联网计算节点

这个压缩比率有多大呢?每秒人脑可以处理的信息是400部高清电影,而每秒语言的信息量只有几k大小,差距几十万倍。所以,如果你的语言是这颗豌豆,那么脑补出来的内容就是这个篮球。

传统意义上的语音识别,人工智能只有一个耳朵。但在一个真实的公共环境中,只靠一个耳朵是远远不够的。

2015年下半年,iDST 悍将漆远已经进入了蚂蚁金服,他和语音团队一起定义了一个巨大的新场景:让人工智能来代替部分客服,用语音回答用户的问题,从根本上减省人力成本。

按照惯例,先跟中哥开几个脑洞。

“建立一个有初中、高中知识图谱的通用人工智能,不仅是阿里巴巴面临的挑战,也是全世界面临的挑战。这个庞大知识图谱的定义和学习,需要很多代计算机科学家很多年的努力。”司罗说。

而鄢志杰想在这个耳朵旁边再安装上眼睛。正如人一样,我感觉到谁在对我说话,一定会把脸转向他,从而让耳朵获得最有针对性的声音。

你有没有想过这是为什么?因为你是“听”到的道理,而不是用一根电线直接怼到你大脑传输进去的完整信息,语言传递的不是全量信息。

自从人类发明计算机那天起,人机交互就踏上了艰难的长征路。

这,也许就是脑联网3.0。

阿里巴巴的同事帮我找了一张“英俄互译”的截图

达摩院重修“巴别塔”

脑洞二:为了更高效地沟通,语言实际上是把信息进行了极高的压缩。

达摩院重修“巴别塔”

在计算机出现之后,我们在人体之外复制了一套网络,那就是由每个计算机连接而成的“互联网”。

现在,很多快递都用到了“阿里 AI 助手“。快递投送之前,AI 会代替快递员给你打电话,问你是不是在家,包裹送到哪里。这大大减少了快递员的工作量。

你和身边的朋友们,又要怎样一点一点地学会和“说人话的机器人”相处?

实际上,达摩院成立,并没有改变语音实验室的研究内容。我问鄢志杰,那你感觉到最大的变化是什么?

语音科学家的终极目标是让机器通过语音交互的方式融入人类协作网络,但鄢志杰面前的现实过于骨感。用他的话说,阿里巴巴在这项技术上技术储备是“一张白纸”。而那个时候,百度的语音搜索已经成为标配,而微信的语音消息已经可以长按转成文字。

这就是为什么达摩院的预测中会强调:语音人工智能将在特定领域通过图灵测试。

接下来中哥还得用“语言”这种低效的模式,慢慢讲给你听。

这个魔幻的剧本一旦打开,就再也停不下来了。2018年底,一则预测击中了人们的神经:

这种和人类命运息息相关的科技研究,正是达摩院的菜。

其实跟着达摩院大神们的节奏,我们已经窥探到了“自然语言处理”中科学钻探的最深处。

我说语言和电线一样,都是“脑脑接口”。现在让我们顺着这个脑洞继续推演。

一个文明程度极高的外星文明观察地球,发出了惊叹:这种没有记忆遗传的生物,相互间用薄膜器官震动产生的声波进行交流,每秒只有1-10比特的速率,居然能够独立进化出 5B 级文明,这太不可思议了!

司罗

如果按照这个逻辑思考下去,我们可以推演未来一百年脑联网的后续版本:

达摩院下设机器智能、数据计算、机器人、金融科技、X实验室几大分支,几乎全部和人工智能相关。这样浓重的配比,和达摩院的传承不可分割。

于是,他成为了 iDST 语言技术实验室的领头人。

科学家不能贪杯,因为前路还有星辰大海。

司罗说,仅仅 NLP 基础技术平台,每天在阿里内部就会被四百多个部门调用两万亿次。可见它的职责之重。

看到这里,我心头一紧。。。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

2017年3月,阿里巴巴推出“NASA”计划,刻度为未来二十年,目标是从基础科学到应用科学的星辰大海。半年以后的10月11日,NASA 点燃了“一级火箭”——达摩院。iDST 的金身被重新熔铸,成为了达摩最坚硬的一部分。

脑洞三:巨幅压缩会伴随巨大的信息损失。由于每个人的感官和知识储备不同,在补全的过程中就会出现一定歧义。

3、如何像人一样“思考”。

当年,iDST 是阿里巴巴最为神秘的部门之一,如今,iDST 的班底反倒成为了曝光最多的人。“自然语言处理”,也从当年 iDST 皇冠上的明珠,变成了如今达摩院的硬核主战场。

脑洞一:语言和电线是一样的,他们从本质上来说都是“脑脑接口”。

《圣经·旧约》中记载,人类为了对抗上帝“洪水降临”的誓言,联合起来修筑通天大厦“巴别塔”。上帝为了阻止人们的计划,降临神迹,瞬间把人们的语言变成千种万种。于此,人们难以相互理解,四散流亡,巴别塔终成废墟。

这是啥意思?这意味着人工智能马上就成为世界上第二个会“说人话”的物种了。

脑洞四:机器理解人话的过程中,最重要的一个障碍就是:“歧义”。

王坚

脑联网1.5:通用人机多模交互+物联网计算节点

正是基于这个“多模态语音交互”的理念,他才为上海地铁购票机装上了摄像头,配备了可以定向收声定向降噪的一组麦克风。这一套系统可以感知它身处什么环境、谁在和我说话,在说什么,等等一系列精准地信息。

下图就是上海地铁购票机,亲测还挺好用的。

在鄢志杰眼里,技术是一只高速飞行的蝙蝠,而商业就是反馈和矫正方向的超声波雷达。他举了两个例子:

iDST 历史上著名的浴火重生由此开始。

半个世纪以来,所有自然语言处理技术的目的都可以归纳为:消除歧义。(在机器的精神空间中,一句话对应且只对应一个意思)

达摩院重修“巴别塔”

达摩院重修“巴别塔”

第二座技术金字塔,名叫机器翻译平台,有“帮土耳其人买中国辣条”的功能。

想想看,你和妹子煲了五分钟电话粥,可能都根本分辨不出她到底是个人还是机械。这将带来一场伦理革命:未来我们不仅把人工智能当做合作伙伴,也会把它们当做爱或恨的对象。人类稳固万年的情感边界将第一次松动。

上世纪末,MacOS 和 Windows 领导的图形界面出现,键鼠套装成为了人机交互的标配。

达摩院重修“巴别塔”

如此看来,今天达摩院正试图重修“巴别塔”。

直到这时,马云才有了组建达摩院的底气。

简单来说,这套系统有三大功能:把任何一段话拆分字句,提取其中的信息,理解其中的意义。

达摩院重修“巴别塔”

利用低效的语言文字,我们发现了牛顿定律,发现了相对论和量子论。

(3)从零开始

你不必告诉我前面是荆棘还是绿洲,我会自己去看。

周靖人一众则整合了诸多大数据引擎,为阿里万亿帝国装配了一台无人匹敌的精密发动机。

“决心。”他说。“阿里巴巴要做自主研发核心技术的决心。”

话说回来,谁让你叫“达摩院”,达摩院可是禅宗初祖菩提达摩面壁开悟的地方。如果不做这种挑战人类极限的事情,那就别叫达摩院,干脆叫幼稚园得了。。。

鄢志杰把它用在了咖啡点餐机上,在真实的嘈杂环境中,机器用49秒时间点了34杯咖啡,作为对比,人完成这些事情却用了2分37秒。

达摩院的大神们,究竟怎样一步一步攀登“人工智能”这座梦幻远山?

“学以致用”是司罗的信条,这恰好也和阿里巴巴的实用主义精神相契合。司罗团队用了五年时间,搭建起两座技术金字塔:

第二步,就得为人工智能安装一张嘴。

通常的研究者,经常会把一件事情抽象,再抽象。抽象到终于能解了,于是认为自己解决了问题。但他们往往忽略,抽象之后的逻辑和真实世界已经有很大的差距了。一个抽象中的算法,要解决最原初的实际问题,需要反过来走很多的路。

在文章的前半部分,其实中哥埋了一个伏笔。

2016年,阿里巴巴 CTO 行癫重新在集团层面举起 iDST 大旗,大神们重磅回归。这一次,他们一扫所有的质疑,手中握着荣光。王坚感慨:“iDST 又回来了!”诚然,理想不死,它只是需要重生。

在最开始中哥曾经提到,人在大脑里会“解压”语音,解压的过程中绝对性地依赖自己对于世界的“知识图谱”。

你在淘宝搜索一个关键词:“男士内裤骚粉”,NLP 系统就会把它拆分为“男士+内裤+骚粉”,从而找到适合你的商品,这就叫电商分词。

地铁站里面的售票机是并排放置的,每个人说话都会干扰到临近的售货机。你不可能让地铁站把售票机距离拉大,这件事只能靠算法来解决。

如果你像欣赏雕塑大卫那样欣赏达摩院,你就会发现达摩院的躯体很有意思。

TTS 是机器人通过图灵测试的关键一环。哪怕机器人对你所有的问题都对答如流,但是声音被你识破了,它还是会在图灵测试中失败。

这一次,他又盯上了客服。。。

说到这,中哥多补充一些背景知识。

钛媒体注:本文来自于公众号浅黑科技(qianheikeji),作者:史中,钛媒体经授权转载。

“手榴弹造得再厉害也造不出导弹。”马云的这句话,值得玩味。

快递行业,就是其中一个“特定领域”。

我们还扛着锄头进军人工智能领域最难开垦的土地——“自然语言处理技术”,想让人工智能反过来听懂我们说话。

要想让机器在大脑里像人一样理解人话,必须要对这个世界进行非常精准的建模,形成像百科全书一样的知识图谱。

在阿里云上,有一个小 Demo,你无论输入什么文字,萌妹子都能没羞没臊地给你读出来,而你丝毫感觉不出这是机器声。你可以去试试。

(5)重修“巴别塔”

2017年10月10日,你搜索“达摩院”,结果是少林寺。2017年10月11日,你搜索“达摩院”,结果是阿里巴巴。一瞬间,世界开始用新的标准审视达摩院的科学家。

而 TTS 是个深坑。各种最前沿的技术方向正在混战,谷歌、亚马逊,还有国内的 BAT 都在这篇混战的战场中。

2015年2月,鄢志杰从微软亚洲研究院加入阿里巴巴 iDST ,负责组建万众期待的语音团队。彼时正赶上轰轰烈烈的上山下乡运动,两个月后,他就进入了阿里云的编制。

这段话背后,涵盖了 iDST 三年间的命运转折。

漆远一众为蚂蚁金服的风控系统建立了一个绵延几千台服务器的大脑,成为了如今蚂蚁金服风控系统的定海神针;

阿西莫夫在《基地》系列小说里,描述了一个名叫盖娅的星球。

如果一个土耳其用户,想要在电商上购买中国的零食,需要和卖家聊天。但他是不可能看懂中文的。对于这种对话的翻译,不是简单地说明白就行,还要特别讲究“信达雅”。

2016年以后,智能音箱爆发,这才让酝酿已久的语音交互方式站在了历史的聚光灯下。

刘慈欣在小说《乡村教师》里,有这么一段描述:

iDST,全称是“数据科学与技术研究院”。当年马云高呼的“DT 时代”,其中的D和T,都被放进了 iDST 的名称里,可见它被给予了多重的期待。

金榕

虽然在未来脑机接口有可能实现超大的带宽,但是不可否认,语言仍然是人类千万年进化形成的最高效的“天然接口”,占据了无可替代的“技术生态位”。目前人工智能语音交互被公认为“下一代人机交互技术”。

而我们通篇在讨论的“人机交互”,从本质上来讲,就是把“互联网”融入“脑联网”的历史进程。

机器模拟人声,这就是非常著名的技术 TTS。

行癫

达摩院重修“巴别塔”

2018年,我们为上海地铁售票机研发的语音购票系统,你只需要说出想去哪儿,售票机就自动给你推荐最近的地铁站。看上去很简单,但放到真实的商业环境里,你会发现很多意想不到的困难。

语音实验室,就像鱼头和鱼尾,负责“听和说”。简单来说就是把人说的话精确转录为机器能处理的文字,把机器的文字输出用无限接近于真人的发音说出来。

第一步,起码先得给人工智能装一个耳朵。

(4)面壁者

不久之前,我见到了这一领域的两位大神——达摩院语音实验室的老大鄢志杰和达摩院语言技术实验室的老大司罗。

特别明显的一个例子就是:过年你和来串门的熊孩子讲不要乱动自己珍贵的手办,结果他完全理解不了你在说什么。直到他把模型弄碎一地,你抓着他的腿往树上一顿抡。有了这次完整的体验之后,他的知识结构里才会添加一项特别具体的禁忌。

如果你不知道哪家内裤的性能最好,可以询问阿里小蜜,人工智能就会查看很多商品介绍,然后给你推荐最适合的那款,这就是信息提取功能。

你可以诟病阿里巴巴心态过度自信,也可以吐槽阿里巴巴动作不够优雅,但你唯独不能说阿里巴巴不够勇猛。

图片来源@视觉中国 钛媒体注:本文来自于公众号浅黑科技(qianheikeji),作者:史中,钛媒体

图片来源@视觉中国

面对未来,好奇的孩子总是这样说。

在未来,很可能人类可以用脑电波设计“脑机接口”进行人机交流,但所有相关的技术都处在非常早期的阶段。

鄢志杰

达摩院重修“巴别塔”

姑且不论在大刘心中 5B 文明比 2B 文明强多少。重点在于:外星人说的有道理啊,我们不就是些只能靠超低带宽的语言交流的沙雕残疾生物么。。。人类这个创业团队一点点从古猿集团剥离,用了一百万年才“独立上市”。我们仰仗的全部家当:“听说”“读写”“思考”,全都和语言能力相关。

我们喜欢党同伐异顺便制造了世界大战,但我们没死反而在战争中发明了计算机,在此之上,我们还发明了人工智能。

发布这条预测的,不是民间科学家,而是大名鼎鼎的达摩院——阿里巴巴挑战前沿科学的骑士团。

听过那么多道理,却还是过不好这一生。

绝大多部分公司都是研而不发。我们要做一个跟微软不一样,跟贝尔实验室不一样,跟英特尔研究院不一样的,做一个最适合这个世纪的研究院,做一个阿里巴巴自己想清楚未来发展的研究院。

猜你喜欢

泉州网站建设 | 南安网站建设 | 泉州汽车网 | 南安汽车网 | 泉州房产网 | 南安房产网 | 南安购物网 | 南安人才网 | 分类信息网 | 网站发布网

公司简介 | 商业合作 | 广告中心 | 联系我们 | Copyright © 2019 www.qzwzjs.com Corporation, All Rights Reserved.

闽ICP备18011963号 邮箱:info@qzwzjs.com 公司地址:成功街水岸帝景A区

服务中心: 0595-86036039 联系QQ:2076448248

天辉网络服务有限公司 版权所有