威尼斯赌场施工-这家被收购的3人小团队 完成了百度“唤醒万物”的第一步

    发布时间:2020-01-09 09:59:38   

威尼斯赌场施工-这家被收购的3人小团队 完成了百度“唤醒万物”的第一步

威尼斯赌场施工,智东西(公众号:zhidxcom)

文 | 寓扬

7月5日,百度重磅发布了dueros语音交互平台、apollo自动驾驶平台,成为百度ai的两大核心落地平台。而在这天,百度还宣布收购一家专注唤醒和自然语言处理的ai创企——kitt.ai,与其“唤醒万物”的使命不谋而合。

随着“all in ai”和“从连接信息到唤醒万物”,百度的市值在7月份一个月就涨了约120亿美元,截止到北京时间8月2日,百度总市值已达782.30亿美元,仿佛突破千亿大关已在不远处。从移动互联的服务和应用到ai时代的底层技术,百度也在实现自身的转变,而无疑这种转变是被市场和资本所看好的。

近期,智东西恰好与kitt.ai创始人姚旭晨相遇,并和他就语音技术与百度语音入口的布局展开对话。

kitt.ai是一家来自美国西雅图的ai创业公司,主要专注于唤醒和自然语言理解技术。它目前有两款核心产品热词识别(hotword detector)和对话系统 chatflow。

热词识别是一款快速训练唤醒词的产品,开发者通过软件平台snowboy为硬件设备添加唤醒词功能,如亚马逊echo的“alexa”,叮咚音箱的“叮咚叮咚”。对话系统 chatflow带有基于其自身nlp(natural language processing,自然语言处理)技术打造的自然语言理解引擎nlu(natural language understanding),是一款给开发者用来开发对话系统的工具,帮助开发者解决基于上下文的多轮对话问题。

(kitt.ai创始人团队及成员)

kitt.ai最初是作为艾伦人工智能研究所(alleninstitute for artificial intelligence,简称ai2)的一个内部孵化项目于2014年9月诞生,但在2015年底才真正转做“热词”(即唤醒词)和对话引擎,相关产品也打磨了近一年半。目前,其热词技术可达到95%~98%的唤醒率。

它曾拿到了微软联合创始人paul allen和亚马逊alexa等5家机构的投资,并入选了cb insights人工智能创业一百强。令人吃惊的是,这样一个明星团队,到目前为止仍只有3名员工。

被百度收购后,kitt.ai保留原有品牌和产品,作为一个独立团队加入度秘事业部,并将继续在西雅图发展。

目前,kitt.ai的热词识别正在接入dueros,度秘下面的很多产品都会使用其热词技术。据姚旭晨透露,热词识别连同其对话系统chatflow(nlp技术)都将在今年内接入到dueros中,但具体收费情况还未确定。

唤醒词是人与语音设备交互的第一步,能否顺利实现唤醒并减少误唤醒,对于用户体验而言十分重要。

还记得kitt.ai联合创始人兼cto陈果果在今年百度ai开发者大会上的展示吗?即通过snowboy平台快速训练一个唤醒词,这正是kitt.ai的热词识别,也是dueros平台赋能人机交互体验的关键一环。

(kitt.ai联合创始人兼cto陈果果唤醒词训练展示)

具体来讲,热词识别的原理是:使用者念出的三遍唤醒词会形成3个音频文件传输到云端,这是一个端到端的深度学习分类器,它会对该文件进行音频建模,建立一个只针对这三个音频的分类器。它可以从能量、音调等方面提取参数进而构成特征,下次使用唤醒词时,这个分类器就会判断是否与这三个音频的特征相近,来决定是否唤醒。据姚旭晨介绍,kitt.ai的热词识别用到了几十万到上百万的特征提取。

唤醒设备很重要,但如何减少误唤醒同样重要。姚旭晨谈到,误唤醒的因素也很多,跟噪声、能量也有关。比如一些与唤醒词相似的音节,小鱼在家机器人曾用《小鱼儿与花无缺》这部电视剧进行测试,发现剧中很多“小鱼儿”的词语有时会带来误唤醒。

此外,他也谈到,毫无相关的一些声音有时也能够引发设备的误唤醒。原因在于机器并不像人一样有语境,它只能从众多特征参数中去判断,可能你的一个爆破音会导致分类器的每个权重都很大,进而造成误唤醒。

放眼当下火热的智能音箱,噪音环境下的唤醒和误唤醒仍然是各家亟待解决的问题。打磨好技术,做到高准确性、高容错,才能获得更好的用户体验。

kitt.ai的另一项核心技术正是nlp,应用到其产品对话系统chatflow中,从而帮助开发者开发对话系统,实现人机对话。而姚旭晨和首席科学家曹原则是美国约翰·霍普金斯大学clsp实验室(center for language and speech processing)的博士,主攻方向就是nlp。

近期,关于智能音箱的“智商”问题一直被大家吐槽,而智商背后的关键就在于nlp。尽管bat等互联网公司拥有海量的数据资源,能够将语音识别做到97%以上,但在nlp上进展却并不明显,各家的语音助手仍被吐槽。

(kitt.ai官网关于对话系统chatflow的介绍)

那么nlp在语音应用上到底进展如何呢?姚旭晨谈到,“凡事无法衡量的东西,都是难以改进的”,像语音识别和图像识别很容易measure(衡量),语音识别看看错别字就可以衡量识别率。但是自然语言不是,它是一种开放式的问题,你问它一句话,它可能有100种回答,所以你很难测量这个表现的结果。如果不能测量这个表现,则很难对其进行优化。

nlp是人工智能里最难的问题之一,在人机交互里,机器距离听懂人话还有很远的距离。以智能音箱中的多轮对话为例,目前通用语的多轮对话还难以实现,更多的是特定任务中的多轮对话能力,如打车、叫外卖、定电影票等。

目前nlp还没有太大的突破,它要像人一样会思考、会推理,还有很长的路要走。所以nlp在智能音箱、儿童玩具中做一个简单方便的小助手尚可,但其他的应用还难以做到。这另一方面也说明了,为什么当下的智能音箱大多是“one shot”(一次唤醒一次问答)模式。

dueros语音交互平台是百度“all in ai” 的重要一步,景鲲指出,dueros的核心理念是“唤醒万物”,而唤醒万物的三个基本要素是:听清、听懂、满足——可以理解为语音识别、语意理解、以及响应。

(图为度秘事业部总经理景鲲)

百度在语音识别和内容服务方面已有很多资源,此举收购kitt.ai,正是看中其在语音唤醒和自然语言处理上的优势,从而在“听懂”上更具优势,完善整个语音生态。

kitt.ai在被收购前就已经有近2万名免费开发者,还有来自四个大洲的许多付费客户,并且其公司在今年4、5月份已实现盈利。

在谈及选择百度的原因时,姚旭晨谈到,确实有许多公司想要收购kitt.ai,之所以选择百度,核心原因在于kitt本身的定位就在于平台,即成为一家成功的saas (software as a service,软件即服务)公司,而百度可以给他们提供一个更大的平台,更多的开发者。此外,百度对技术更加认可,并且也给予其团队很大的自由度,同意团队在西雅图独立发展。

百度需要唤醒和自然语言技术,来强化底层技术根基,而kitt.ai也需要更大的平台,二者可以说是一拍即合。

除了dueros和apollo两大平台产品以及语音领域的kitt.ai外,今年百度还在2月份收购人工智能创企渡鸦科技,4月份收购硅谷专注于机器视觉的ai公司xperception。在百度内部,搜索部门为ai提供知识库和文本的解决方案,地图团队为自动驾驶提供导航,百度云提供基础设施,百度医疗大脑提供人工智能诊断,可以说百度的“all in ai” 绝不是一句空话。

dueros的核心是唤醒万物,而人机交互的第一步则是唤醒词,可以说kitt.ai这个由3位高材生组成的明星团队完成了百度唤醒万物的第一步。

然而,姚旭晨也坦言,自然语言处理尚未实现突破性进展。如何让机器听懂人类、理解人类,仍会是我们很长一段时间内面临的难题。

点击下方了解更多关注我们,获取更多科技前沿资讯~

      随机推荐

      整站最新

    打造优美街区提升市容市貌 兰州城关区整治无证早餐摊点、不规范经营餐饮店和早市
      规范餐饮店铺经营行为为了规范餐饮店铺经营,助力全市精致兰州建设,该局联合相关部门对主次干道、背街小巷内餐饮店铺进行检查,重点规范门头牌匾、室内装饰、餐具和一次性用品等,彻底排查清理不规范经营行为。据介绍,今后该局将继续加强巡查监管,常态化管理辖区早市市容市貌,切实营造整洁有序的城市环境。

      最近新闻

      据哈萨克斯坦法律网10月15日报道,哈央行副行长斯莫利亚科夫接受采访时表示,近期有关央行通过提高存款利率,将哈银行体系的外汇存款转移到央行账户上的说法是不正确的。斯说,央行与本国银行在吸引流动性方面不存在竞争,也不存在关于存款利率的争议。自今年7月起,二级银行不仅可在央行开立外汇代理账户,还可以从代理账户向哈央行汇出部分资金作为存款并获得利息。
      9月19日,女神张柏芝再一次晒出了大儿子谢震轩的背影照片,lucas虽然是背对着镜头,但看得出他的身高已经随着年龄增长逐渐超过了母亲,尤其是戴着棒球帽的他帅气十足,双手插口袋很有绅士范,完全就如谢霆锋的翻版。此前,谢霆锋明明白白的告诉外界,自己是张柏芝大儿子和二儿子的父亲,并且还一直关心着两个孩子的成长。
      10月2日, 70位来自粤港澳的青年代表们沿着习近平总书记视察的路线感受岭南历史文化,体验西关民俗风情。广州彩瓷国家级非物质文化遗传承人现场展示如何绘制出五彩斑斓的广彩作品。荔湾老城一家面馆在原汁原味的西关旧街老巷内设席70桌“国庆宴”。
      百度创始人、董事长兼CEO李彦宏在人工智能分论坛上发表演讲。“不久前我们公布了AI音箱,有人说漂亮的不像百度的产品,但AI的对话能力,像百度”,李彦宏以调侃式的语气开场。李彦宏称,例如生鲜行业,通过AI技术,这一行业的利润可提升近20%,损毁率可降低30%。“昨天喝酒时,朋友给我提了个建议。你们应该做广告,大家坐在车里面喝酒,体验自动驾驶”,李彦宏说。
      5月28日,在广州市第十五届人民代表大会常务委员会第二十四次会议上,广州市生态环境局局长杨柳在作2018年度环境状况和环境保护目标完成情况的报告时说。杨柳表示,今年广州生态环境保护工作的主要目标是:广州市pm2.5平均浓度控制在35微克/立方米以下,二氧化氮进一步下降,空气质量达标天数比例达到85%以上。