登录 / 注册
IT168网络通信频道
IT168首页 > 网络通信 > 网络通信资讯 > 正文

Skype开启中英实时语音翻译对话新时代

2015-04-09 11:36    it168网站原创  作者: 自牧 编辑: 陈毅东

  【IT168 资讯】2015年4月9日,Skype宣布在中国市场推出Skype Translator实时语音翻译技术的中文预览版,正式开启中英实时语音翻译对话新时代。Skype Translator预览版适用于Windows 8.1或Windows 10技术预览版的客户端或平板电脑客户端。除了英文和中文普通话的语音翻译之外,还支持四十多种语言的即时文本翻译。

  新的里程碑

  在2014年12月,Skype Translator支持了英文和西班牙文之间的实时语音翻译,这个记录很快被刷新。

  微软认为,这一新时代的开启得益于深层神经网络与微软成熟的统计机器翻译技术的结合,语音识别能力被进一步提高,随之得到的更准确的翻译结果,使得一对一的语音交谈成为现实。

  中文是一门极具挑战性的语言,大约一万个常用汉字以及多种多样的语音、语调,这对于母语为英语的学习者来说是最大的困难之一,有类似困难的语言还有阿拉伯语、日语和韩语。

  微软是语音翻译领域的先驱,在2012年首次演示了英文和中文普通话之间的实时语音翻译技术原型。此后的数年中,微软在北京的研究团队与位于美国雷蒙德的同事们密切合作,经过多年的研究和专注投入,完成了普通话的语言模型,使Skype Translator的中文语音翻译在终于变为现实。

  Skype Translator中文预览版的推出无疑将微软语音翻译技术能力和Skype的未来应用前景推升到新的里程碑。

  解读Skype Translator工作原理

  机器学习是指软件学习训练数据的能力。Skype Translator构建于机器学习平台之上。通过在预览版阶段获取的训练数据,加之其中的细微差别,软件就能够针对真实使用者的不同话题、口音与语言转换进行学习,实现更好的识别和翻译。

Skype开启中英实时语音翻译对话新时代
Skype Translator工作原理信息图

  Skype Translator的机器学习协议训练并优化语音识别和机器翻译任务,就像黏住这些元素的胶水一样,该协议促进对被识别的文本进行更好的翻译。这个过程包括去除造成不流利的字词(例如“啊”“嗯”以及重复措辞)、将文本分解成句子、添加标点符号和大小写识别。

  语音识别和机器翻译的训练数据来源多种多样,包括翻译的网页、配有字幕的视频,以及预先翻译且转录成文字的一对一谈话。Skype Translator通过记录这些对话来分析对话文本并训练系统更好地“学习”各种语言。

  据悉,已经有很多人与Skype Translator分享了他们过去的对话记录,Skype Translator对其进行了分析并为统计模型创造训练数据,该统计模型教会语音识别和机器翻译引擎如何将收集到的语音转换为文本信息,然后将文本信息转换为另一种语言。使用Skype Translator的用户都会在对话开始前得到清晰的系统提示,即对话将被录制并用于提高微软翻译和语音识别服务的质量。

  在准备好的数据被录入机器学习系统后,机器学习软件会在这些对话和环境涉及到的单词中搭建一个统计模型。当用户说话时,软件会在该统计模型中寻找相似的内容,之后应用到预先“学到”的转化程序中,使得音频转换为文本再从文本转换成另一种语言。

  语音识别的发展一直受到错误率高、对麦克风敏感度差异、噪音环境等因素阻碍。为此,微软研究院率先将深层神经网络(DNNs)技术引入语音识别,从而极大程度地降低了错误率,提高了可靠性,最终使这项语音翻译技术得以更广泛地应用,包括Skype Translator。

  Skype Translator的机器翻译部分负责将文本从一种语言翻译成另一种语言。它采用了和必应在线翻译同样的技术:开创性地结合了句法和统计模型,此外更加有针对性地训练对话性语言。这点非常有挑战性,因为现在用来搭建文本翻译系统的典型训练数据都是优化过的清晰、结构严谨的书面语言。Skype Translator的系统在包含必应翻译的丰富语言知识的同时,还额外加入了口语对话中出现的单词及短语。

  另外,Skype Translator创造了一个定制化的机器人程序来协调整个产品体验。如电话中的第三方一样,它负责建立电话连接、发送音频流至语音引擎获取翻译文本,并分别在双方结束说话时翻译其所说的内容。

  在技术实现上,Skype Translator主要克服了语气词、俚语翻译、语言翻译用户挑战(主要是用户对Skype Translator的自动翻译器的适应)等多方面的挑战。

  Skype Translator主要功能

  1.语音读取文字信息。用户可以通过语音收听到对话方发送给自己的即时消息,语音的语言可以自选。

  2.持续性识别。在对方发送语音信息期间可持续性的进行文字翻译。

  3.自动声量控制。您的对话方可以在实时语音翻译期间不间断地说话。同时,您可收听到较高音量的语音翻译,对话方本身的语音信息呈现出较低音量,所以您只要将注意力集中在语音翻译上即可,这可以保证翻译信息的收听流畅。

  4.语言翻译静音功能。您可以任意开启或关闭语音翻译的声音,并直接读取文字翻译。除了语音翻译现有的四种语言(英语,西班牙语,中文普通话,意大利语), Skype Translator的即时通讯文本翻译更是在原有40多种语言的基础上加入了塞尔维亚语,波斯尼亚语,克罗地亚语,玛雅语和奥托米语。

  通过Skype Translator预览版网页注册试用

标签: 统一通信 , Skype
相关文章
  • IT168企业级IT168企业级
  • IT168文库IT168文库

扫码送文库金币

编辑推荐
系统架构师大会
系统架构师大会
点击或扫描关注
IT168企业级微信关注送礼
IT168企业级微信关注送礼
扫描关注
首页 评论 返回顶部