新闻产经轻工日化电器通讯仪器机械冶金矿产建筑建材石油化工食品医药电子电工能源电力交通运输农业环保图片手机版
当前位置:中国市场调查网>产业>科技>  正文

解码谷歌即时语音翻译:做产品如调校高级跑车

中国市场调查网  时间:02/28/2012 16:00:59   来源:新浪科技

谷歌研发经理陈雍昇

谷歌研发经理陈雍昇

  我们想知道,一个念头是如何破茧而出,最终发展成为优秀的产品。在这背后又有着怎样的技术与思考?我们想知道,成长道路上的合作、碰撞与收获。为此新浪科技推出《科技开讲》系列访谈,希望能远离喧闹纷繁的商战,寻找IT企业的灵魂。

  访谈主题:

  语言不互通,是否还能交流?谷歌即时语音翻译,就打开了这样的一扇门。借助谷歌的翻译技术,语言将不再是聆听演讲、查看文档的主要障碍。究竟冰冷的机器翻译,怎样向信达雅的目标前进?本期《科技开讲》将对这一产品进行解码。

  做客嘉宾:

  谷歌研发经理陈雍昇

  互动交流:

  更多关于谷歌翻译的问题可与@大牛的Baba陈雍昇直接互动。

  跟踪Google动态请关注官方微博@Google黑板报。

  本期精彩看点:

  - 手机即时语音翻译功能主要有三个模块。一是语音识别,把音频内容转换成文字代码;二是进行机器翻译;三是把翻译好的文字转换成语音。

  - 网页翻译流程:解构网页——机器翻译——还原重组。这一拆分再重新拼接的过程,实际耗时在一秒之内,期间同样是海量计算支撑。有一部分计算机在拆网页结构,另一部分则把获取的文字分散发布给上百台计算机进行翻译。

  - 谷歌三大产品开发理念:方便、速度和质量。就像调校高级跑车一样,复杂的内容都放到引擎盖之下,同时跑车能够调高1%的时速已属不易,挑战性很大。

  - 翻译质量背后其实是海量的数据,需要非常多的平行语料(即对同一内容的不同语言版本)。而平行语料的常用来源是联合国官方文件,但仍需找到更多口语化、普通的平行语料,机器翻译才能不断的接近信达雅的标准。

  - 产品开发出现异议,崇尚“动手不动口”。即先把产品雏形做出来,甚至再通过部分用户测试后,以实际结果代替理论之争。

  以下是本期《科技开讲》的文字实录:

  新浪科技孟鸿:大家好,今天我们来主要讲讲有关翻译的故事。坐在我旁边的这位,他是Google的研发经理陈雍昇,但是我们现在假装不认识他,同时他也不会讲中文,我们应该怎么跟他交流呢,这时候我们可以用一部手机试试,我们这里装了Google翻译,看看是怎么用这个交流的,我就直接用这个和他讲话。

  新浪科技(对手机):欢迎您来新浪。

  手机语音翻译:Welcome to Sina。

  陈雍昇(对手机):Thank you very much。

  手机语音翻译:非常感谢您。

  新浪科技:我们看到这就是我们刚才用手机做的交流,可以听到我们不同的声音,然后换上我们各自懂的语言,方便我们之间做一些沟通,这也是一个非常有意思的功能。大家都叫您Peter,刚才通过手机端完成的Google翻译功能是怎么实现的,给我们讲一下?

  三个模块组成手机翻译功能

  陈雍昇:手机即时语音翻译(即手机翻译对话模式)、对话模式主要有三个模块。第一个需要把人说的语音翻译成电脑可以识别的文字代码,这方面是叫做语音识别。第二个当有了文字代码以后,机器翻译需要把这个语言从原语言翻译成目标语言,这是叫做机器翻译。第三个翻译好了,还是以电脑的文字来呈现,我们要把这个文字转换成语音。这三个模块搭建在一起,就可以实现刚刚看起来非常炫的功能了。

  新浪科技:这样一个功能对我们来说容易实现吗?

  陈雍昇:从机器的角度,我们毕竟也是实现出来了,它的背后代表着一大堆海量的运算还有统计模型。从语音识别来讲,也需要庞大的数据模型,才能非常精确的识别出你说的字,同时机器翻译也是,需要输入很多平行语料,构建成海量的语言模型,最后文字转换成语音也是一样的。这三个模型都非常适合我们说的云计算,他们背后都是庞大的计算机、运算、储存构成的。

  新浪科技:除了对话之外,我们在手机端上Google翻译还有哪些功能?

  陈雍昇:既然是手机它是一个移动的平台,既然已经拿在用户的手上地我们要让它跟日常生活有非常密切的连接。所以我们现在手机方面的功能,都是在想怎么样让用户更方便。如果我在国外,有一些话我要跟计程车司机或者是服务员说,我不可能说完以后把手机给他看,如果给他看的话,如果我转成横的就变成大字体,手机就不用交给其他人。

   < 1 2 3 4 >