汗布厂家
免费服务热线

Free service

hotline

010-00000000
汗布厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

剑桥语音博士俞凯智能语音走向人性化智能交互

发布时间:2020-02-10 17:43:16 阅读: 来源:汗布厂家

速途网上海5月8日消息(报道 朱帆)谈及智能语音,相信大家脑海中浮现的是科幻片中的智能管家、机器人的形象,虽然说科幻电影基本都由虚幻的色彩形成,但其中也包含了一些真实的技术,并且片中所呈现的技术一直以为是人们所研究的方向。

随着siri中文版以及其他语音的普及,智能语音已然走向国内人们日常生活,人们对于智能语音可以改变生活方式充满了期待。但智能语音发展的进程却不是所有人都所为知的,智能语音从纯粹的语音识别发展至今已经走向了识别、合成、语义理解、智能反馈等等。

虽然说科幻片中的智能语音令人憧憬,但智能语音一定是未来的一个方向。目前国内对于智能领域研究非常广泛,并且细分领域中成就非凡。本次速途网上海了解到一家专注智能语音交互研发的企业——思必驰,并且专访专注技术研发的创始合作人之一—俞凯博士。

(图为俞凯博士在英国)

俞凯博士在上海交通大学创建了智能语音实验室。拥有剑桥大学语音识别专业的学术背景,也是国内学术界“青年千人计划”里唯一一位来自智能语音技术行业领域的语音专家,曾多次获得美国国家标准局和美国国防部语音识别评测冠军,是国际最早的认知型人机口语对话系统原型的主要实现者。

siri与智能语音技术过程

提及siri与思必驰有何区别时,俞凯向笔者进行了详细的解析,并且分析了智能语音技术过程。智能语音技术发展过程可以理解为两个阶段,第一是输入和输出阶段,即识别与合成,第二是理解和思考阶段,即语义理解、对话系统、人工智能反馈。并且每一个细分领域均为单独研究,例如语音识别、自然语言处理、声纹处理,语义解析等等。

siri 目前最大的优势在于语义单项理解的算法,在一个限定的领域下,siri表现确实很好,但在整个语音领域内,尤其不限定领域和语音识别不稳定的情况下,显得有些后劲不足,这也与目前技术有关。而思必驰与siri不同的地方在与交互的理论,目前思必驰以任务型对话为目标,并专注于此。

智能语音产品应用范畴

谈及智能语音具体应用时,俞凯博士拿出手机,向笔者展示思必驰出品的“语音输入板”APP,以正常语速说话,APP界面中快速出现了说出的文字,并且错误率极低。但其不足之处在于说话人必须与麦克风保持相对较近的距离。

俞凯说道:最近比较关注的是在智能硬件上,手机可以以正常方式进行输入,而智能硬件上基本没有其他的方式,尤其在嘈杂的车载环境内,语音对于智能硬件入口的需求高于手机。而将手机作为入口,单纯的语音识别远远不足,没有任何人能保证百分之百的识别率,因此需要在深度理解技术的基础上需要做出反馈,可以与机器进行交流纠正错误。能够让人自由的使用语音进行交互的识别、理解和反馈技术称之人性化智能化语音交互,这也是目前我们正在做的。

一体化综合解决技术增强用户体验

目前的智能语音基本是单独模块定义单独的功能,例如语义理解、语音识别模块,彼此之间没有控制与调度,这也是造成目前语音延迟现象的部分原因,而造成延迟另外的原因是语音的处理、理解、交互系统设计方式。

当问及怎样的语音技术可以解决延迟问题并且加强用户体验时,俞凯表示:用户最希望的是智能语音界面能像人与人的交流一样,语音能够迅速反馈。但目前,虽然单独语音识别很多单位都能做的很快,但组装成交互系统之后就大都无法做到这一点了。目前思必驰推出的一体化解决方案,针对利于用户体验方面进行优化,达到端到端的用户体验,优化整个控制流程,在识别的基础上同时进行输出,达到一个快速智能反馈的效果。我们是面向终端用户体验去做语音交互优化,而不仅仅提供一个模块而已。

人性化交互的智能语音方向

提及智能语音未来方向时,俞凯说道:未来的智能语音交互发展方向一定为混合发展模式,将以用户为中心,综合应用全面的语音技术,而不仅仅是单纯的语音识别。第一,智能语音技术会与环境、语境自适应的结合;第二,语音的发展在自然场景下应用会越来越多,例如在高噪声环境中的处理是未来的一个方向;第三,结合上下文的语义理解以及端到端的语音交互解决。目前单独的识别以不能解决所有问题与满足用户需求,将识别、理解、对话的交互控制等融合,提供整套的解决方案才是最终的方向。

最后俞凯博士表示:人工智能层面的语音技术中,单纯的识别率是以科研指标为中心,而人工智能角度与工程科研指标在某些方面截然不同。而我们一直以用户为中心,面向指标是令人工智能语音真正人性化,在多类环境下准确识别并反馈,以个性化色彩进行交流。语音交互的未来应当是面向用户,人性化的智能交互,而非过去模块化的交互。

(图为思必驰参加CITE2015)

思必驰介绍:思必驰是剑桥大学团队创立、中国领先的智能语音公司,是国内唯一拥有人机对话技术,国际上极少数拥有自主产权、中英文综合语音技术的公司之一。自07年成立至今,先后获得联想、启迪、DCM等知名VC投资,并先后获得剑桥大学商业计划奖、剑桥大学Downing基金、英国政府研发基金、国家电子发展基金、重点科技支撑计划以及各类领军企业基金。

注册公司流程及费用

公司年检流程

广州注册公司范围

中山代理记账代理报税

广州工作签证流程

增值电信业务许可证

工商税务代理

深圳工商税务办理

相关阅读