车音网:语音识别尚且简单粗暴 智能驾驶梦只做到一半

2013-6-23 15:53:54 新闻来源:广东新闻网

比尔·盖茨曾表示:语音识别技术将完全取代键盘技术。但时至今日,如何攻破语音识别技术依旧是世界性难题。

“山寨”起家

中国IT企业的成功,大都建立在“山寨”的基础之上。QQ模仿ICO、搜狐模仿Yahoo,车托邦模仿Waze,车音网也也不例外。

作为车音网的创始人,1999年投身语音识别产业的沈康麒在2005年就将目光锁定在美国语音识别技术企业Tellme网络公司身上。Tellme不仅在语音识别领域有明显优势,也在美国的电话号码查询市场占有相当份额。2007年,Tellme被微软以8亿美元收购。

通过在Tellme身上取得的灵感,沈康麒创立了一声达公司,这个山寨版的Tellme网就是车音网的前身。沈康麒自掏腰包在中国电信里建了一个系统,让用户免费打电话,从而采集数据,完善语音库。这一年,一声达烧了1000多万元。

后来沈康麒远赴美国去Tellme公司取经,才发现其真正收入的来源是给通用Onstar系统做外包业务,这一点让沈康麒如梦初醒。2006年,一声达公司成功和上汽签署合作。2008年,车音网正式成立。

2000万条语音指令

车音网提供的是一种智能驾驶服务。通过内置于车内的蓝牙终端,驾驶员只要开口说话就会连接到语音云平台,可以实现拨打电话、点播音乐、收听新闻、查询天气和路况信息、寻求紧急救援等功能。

“我们的产品拥有2000多万条语音指令储备,这是我们的财富。”在接受车云网专访时,车音网副总经理陆凌涛表示,“对同一句话,我们会分别找各种不同口音、语言习惯的人说出来,再把它录入到数据库。”这一繁琐的过程,车音网的团队成员坚持了十年。车音网试图实现在自然的语言状态的人机交互,而不是只能对指定指令进行识别。

作为一个完全基于商用级语音识别人机交互平台服务商,除了语音库储备外,语音识别率也至关重要。面对车辆使用场景中风噪和胎噪较大的情况,车音网做了有针对性的产品研发。

车音网终端解决方案事业部总经理李广韬对车云网表示:对于在车载环境中产生的各种杂音,车音网在服务器端都建立了相应的噪音处理模型,这是通过长时间的数据积累实现的,可以保障用户在开车窗的情况下也能实现精准的语音交互。

在中国做语音识别,“方言”也是绕不过的一环。但这里的方言并不是纯粹意义上的方言,按照陆凌涛的说法,应该叫做“带口音的普通话”。举个例子,上海人说上海话,车音网的产品不能识别,但是上海人说带口音的上海版普通话,车音网的产品就可以识别。就产品研发的本身来说,换一种方言就等于换了一种语音引擎,数据的搜集需要从头再来,这是巨大的工程。

伴随着车音网一路走来的,除了沈康麒之外,还有一个亦敌亦友的竞争对手:科大讯飞。沈康麒和科大讯飞创始人刘庆峰师出同门,都曾在美国学习语言识别技术,所以科大讯飞和车音网产品的底层算法其实是一样的。但是,车音网的步子慢了些。

2008年初,在沈康麒四处奔波着推销自己的产品时,科大讯飞已经在深交所上市,股价也由开盘时的30元一路冲高至90元。也正是在这一年,上汽联合科大讯飞和安瑞索思,开始秘密研发Inkenet车联网系统。

面对强大的竞争对手,陆凌涛笑称:我们比他们的优势,就是干得了脏活累活。2011年一汽奔腾成为车音网前装市场的第一个客户,奔腾B70、莲花L3、斯巴鲁全系、一汽丰田卡罗拉等车型也在使用车音网的服务。

如何摆脱“简单粗暴” ?

车音网始终希望把智能手机跟车结合起来,让用户像用手机一样使用汽车,这其中遇到的问题不小。车音网现阶段提供的解决方案叫做“映射模式”,通过USB或蓝牙等方式将手机的功能“投射”到车机上。

按照车音网的介绍,这样的方式有“双向操控、共享应用、超大屏幕”三个优势。但“双向操控”并不能实现真正意义上的车机手机数据协同,“共享应用”也难以解决手机应用在车辆场景下的不匹配问题,前两者不能解决,“超大屏幕”就显得噱头意义大于实际。可以说,“映射模式”只是现阶段车企和互联网研发节奏不匹配下的“无奈化产品”,不仅包含着“退而求其次”的悲凉,也显得过于“简单粗暴”了。

这样解决方案只是过渡,车载系统的最终目标是实现“多屏互动”,或者称为“多屏统一”。陆凌涛介绍了这种模式的构想:“多屏互动”是真正意义上的手机和车机的协同。车机不仅仅是“映射模式”下充当的一块显示屏,而是一个完整的系统。当连接手机时,手机和车机只做ID健全上的操作,车机对手机的信息库和用户使用习惯进行甄别。

例如,用户将手机连接上车机之后,便可以在不需要再次输入密码的情况下从车机上登录微博应用,而车机上的微博程序可能是语音提示的,这又涉及到车厂向开发者提供标准接口的问题。但多屏互动将是大势所趋,就像苹果icloud一样,在用户使用习惯和空间会发生变化的前提下,大大改善用户体验。

不过,要想真正实现这一构想,整车厂改变固有开发思路是重中之重。就目前情况来看,不论何种产品,要想进入车辆的前装市场,必须经历严密的可行性验证和测试,并且这样的测试时间可能超过两年。两年时间对互联网产品意味着什么?

这次车云网对陆凌涛的专访正巧赶在“T圈车联网论坛”的茶歇之际,期间,不断有整车厂的相关人员向他打招呼。陆凌涛也饶有兴致的现场拿出了手机,演示起其手机APP产品“语驾”。可能因为受到周围环境影响,在他说的三次语音指令中,“语驾”只成功识别了一次。

本站所刊登的各种新闻﹑信息和各种专题专栏资料,均为广东新闻版权所有,未经协议授权禁止下载使用。
Copyright © 2000-2013 All Rights Reserved
编辑QQ:1398651442