新闻产经轻工日化电器通讯仪器机械冶金矿产建筑建材石油化工食品医药电子电工能源电力交通运输农业环保图片手机版
当前位置:中国市场调查网>产业>科技>  正文

Siri开发商Nuance推出普通话应用Dragon

中国市场调查网  时间:03/22/2012 16:01:56   来源:搜狐IT

  【搜狐IT消息】北京时间3月22日消息,《移动新发现》今日报道,苹果语音助手Siri开发商Nuance Communications近期推出了一款智能机语音应用Dragon,该软件支持多种语言,包括普通话。但由于中国的普通话存在声调等问题,Dragon的语音识别准确率还是存在一定难度。

Nuance Dragon

  以下是文章主要内容:

  中文版Dragon和其它多数语音识别软件一样,不能达到百分之百的识别率。因为首先对于语音识别来说,中文一直是一个极具挑战性的语种,普通话虽然只有400个单音节声音,但他们却仅仅能通过声调予以区分。

  比如,妈妈的“妈”这个字读一声“妈”,四声是“骂”,三声是“马”,所有这些字读起来都跟“ma”大同小异,所以说开发出一款能够识别不同声调句子的软件的确不易。

  除此之外,尽管普通话是中国的国语,但是中国拥有很多种方言和数不尽的地方口音。Dragon研发副总裁吉姆·吴(Jim Wu)就表示:“在中国大陆,每个人都有不同的口音,我们面临的其中一项挑战就是确保系统能够识别口音较轻的普通话用户。”

  Nuance总部位于美国马萨诸塞州伯灵顿市(Burlington),2011财年的营收为14亿美元。2011年3月,Nuance在推出Dragon英文版应用之后相继推出了两款免费中国普通话版Dragon应用。2011年6月,Nuance还推出了广东话和台湾话版应用。 Dragon口述(Dragon Dictation)应用可以用于转录文本、电子邮件、Facebook及Twitter信息。Dragon搜索(Dragon Search)则可用于互联网搜索。但同Siri的不同之处在于,Dragon无法对用户的问题给出反馈。

  在实际使用Dragon时,用户只需要点击虚拟按钮便可以开始和停止录音。所有过程都在服务器端进行。Nuance首席营销官皮特·马宏(Peter Mahoney)表示,Dragon口述过程将上传至服务器,由服务器进行分析、录制,然后将文本发回至设备上。

  尽管目前Dragon还不是完全准确,但马宏表示Dragon应用可以自主学习并提高准确率。由于所有语音处理都发生在服务器端,因此Dragon收集用户语音数据来学习语言,找到合适的词汇进行组合。而且,Dragon还可以适应每一位用户的地方口音,适应的越好准确率越高。马宏还表示:

  “将这些录音将保存下来,我们就可以使用自动化工具来分析结果。有时,人们需要使用录音来看看自己怎样才能做的更好”马宏最后说道。(凯文)