张平:
非常感谢武内信博先生的精彩演讲,将日本目前的一些动向很快速的告诉我们大家了。我们下一位,是来自日本情报研究机构(NICT)声音语音交流研究所所长中村哲先生,下面有请中村哲先生。
中村 哲:
我就是刚才介绍的日本这个通信研究所的中村哲,那么借此机会我想给各位介绍一下日本的基础翻译的系统,那么刚才介绍了,我是日本的NICT声音语言交流研究所的所长,那么声音语言交流系统各位可能都已经知道,比如说SFA等各种机构都有所闻,那么就是将各个国家不同的语言通过这个系统翻译成自己的语言,这是我们现在目前研究的一个基本方向。这个系统如果可以成功的话,那么在将来的世界博览会,以及各种大型的国际会议上都可以达到无障碍的交流。
并且我们可以把英文变成像中文的这种标准语言,我们也在开发这种系统,就是说将英文变成一个统一的标准语言,使大家都能够听得很清楚,将对方的语言全部变成观众或者听众,都能明白的一种语言。那么我现在研究的这些内容在这个资料上有一些,在1987年我们开始了系统的研究,这就是20年前了,当时在日本各种声音的系统,或者是游戏的系统都是在刚开发的初级阶段,所以当时技术还是不完善的情况下,我们的系统是注重语法和发音的标准性,当时的系统并不能达到将所有的东西都能够准确的翻译出去,只是做到一个国际会议最简单的翻译,那么这个项目,我们研究项目通过7年之后,也就是说1992年的时候,我们通过卫星系统在日本的全国进行即时的语音翻译实验,那么当时我们也介绍了一下我们研究的主要内容,那么从92年开始之后,我们开始了真正的系统研究,从那个时候也开始制定了许多标准,比方说有一个平台,然后把语言也统一化,成为标准语言化,这些系统现在已经在用于,比方说酒店的预定酒店,以及预定饭店,或者预定汽车这些旅游方面系统已经在使用了。
那么从92年开始,将截止2000年为止就开发出来这些技术,我们已经在原来的系统上又晋升一步对系统进行了开发,我们不仅注重于日常的会话,而且我们将从日常会话的涉及的社会领域的各个方面的翻译,也就是说将它的范围扩大的更广了,不仅用于旅游,用于平时的会议,平时的生活,而这个系统的开发也开始进行了研究。那么一般就是说在语音翻译系统,一般都是在人很多的地方会使用这个系统,那么我们也考虑到对这个环境的保护问题,这个噪音问题,比方说在一个展览会或者是国际会议上面,如果声音非常大的话会对隔壁的会场,或者隔壁的会议室有影响,那么在这方面我们对环境保护这方面也进行了一些研究,减少噪音。
那么我们主要集中,原来主要集中在英语和日语之间的翻译,从02年开始之后,我们把重心又放到日语和中文之间的服务,因为中国话现在在全世界都是非常的重视,但是当时我们进入这个研究之后,我们就发现中文是非常的难,而且研究起来它的文法跟日本完全不一样,所以在这方面我们也下了很大的精力。从2000年开始我们引进了一个新的系统,各位能看到手上写的这个系统,就是说我们通过这个系统,通过语言的专门加工,把日文的文法变成中国的文法,因为中文和日文的文法是完全相仿的文法,所以通过这个软件可以把这个文法变过来,从2000年开始之后,进行了各种各样的测试,我们测试收集来的数据对这个系统的软件又进行了进一步改进,那么对这些收集来的数据进行管理,并且也进行处理之后,也就是说将所有收集来的数据进行一个集中处理,集中管理,然后再用处理之后的数据进行翻译,这是我们又新开发的一个软件,也就是说把人可以做的好多工作,大量的工作变成机器来做。
另外我们还开发了一种软件,就是说将方言变成这种普通话的系统,因为各个国家它的语言里面都存在一定的方言,那么把它普通话之后会更加的容易理解。我们现在还开发了一种系统,以前我们比方说将一种语言分别翻译成好几种语言,现在我们是将一种语言统一的,各种语言统一翻成一种语言,这样同声翻译这个行业,我们就会对他们有很大的帮助,比方说就不需要那么多的译员去来做,不需要各个语言的译员做,只需要一种机器把各种语言翻译成统一的语言,这在成本的节约上也能够得到很大的节约。那么现在我们已经完成的部分,就是进行比较性的翻译,也就是说将这个文章进行比较的翻译,刚才说了,中文和日文的文法不一样,比较性的翻译之后把这个文法完全变成中文的格式。现在这个系统我们这个粉红色的模块里面,把这个声音收集进来之后,通过声音认知,将声音认知之后的语言变成其他语言的顺序,也就是说是主谓宾的变换,通过选择单词的变换,也就是说先是文法的变换,然后是单词的变换,再通过认知系统变成,比方说我说要去学校,那么学校就变成这个中文的学校的相对应,去,日本的去也变成中文的去学校,完全是先从每个单词的翻译,然后再进行文法的总结,这是两步进行的翻译,那么在这种翻译之后,就可以减少这个文法的错误。
那么现在你们可能看到这个语言按照中文来看的话就很难理解,我学校去,这个就很难讲通,那么我们再通过另外的系统把它的文法变成中文正确的文法。那么这些我们都是通过系统里面内存大量的关于中文的数据,来将日文正确的翻译成中文的。那么每个人的发音都不一样,所以在这个语音认知上面也是非常困难的,所以在这个机器的认知系统上面,它不可能达到100%的正确,那么在这其中肯定会有一些错误的地方出现,那么错误的地方我们怎么样去把它尽量减少到最低程度,这是我们正在努力的方向。
那么现在我们不可以达到100%的准确,但是可以达到90%以上的准确率,也就是说最起码它的文法,它的文法是跟中文完全一样,而在这一点上对每一个人的语音认知上面,我们认为是现在目前这个系统里面,对我们来说是比较困难的一个研究方向。另外在我们的系统中,我现在想介绍一下我们系统中语音的数据,这个语音的数据我们可以看到,现在目前这个图上写的,在日本有各个地方的方言,标准语言有方言,我们在全日本收集四千人的语音数据,将他们的语音系统放到这个系统里面,另外我们这个系统也可以认知英文的发音和中文的各个地方发音,比方说美国的发音它各个地方也像日本一样存在方言,那么我们这个系统中也可以自己去认知,比方说还有我们在澳大利亚也收集了各个地方的语音发言,还有在中国去年我们收集了400个人语音的数据,主要是北京、上海、广东这些地区发音的系统,然后将他们所有的数据也收集到这些系统里面,那么通过收集的这些英文和中文的数据,可以将各个方言变成统一的标准语。
另外我想对翻译的方面来进行一些介绍,那么可以看一下左侧这个系统里面集中了基本旅游会话的数据,也就是说相当于我们经常出去带的旅游手册,那么在这里面集中是我们基础的会话,在左下侧是更深一步语言系统的集中,黄色的部分是同样意思的文章,是几种语言都集中在这个模块里面,那么在里面有一千万条以上日语的文章,那么英文和中文其中相当于日文一般的数据量。那么几乎就可以全部帮助我们完成日常所有生活和日常会话了。那么再通过翻译的语言系统,我们把它全部翻出来,那么我们在关西飞机场,我们已经进行了试验,我们把翻译器给旅行者发过去,让他们实际的使用一下,看看这个效果怎么样,结果我们得到了很好的效果。那么翻译的时候有两种翻译形式,一种是基本的翻译,还有一个是致辞,比方说问候式的翻译,比方说我的东西丢了,或者是我想去买票,或者我想预约酒店,或者在饭店里面想点菜的时候,这些所有有关这种旅行方面的,各个方面的基本会话,我们都在这里有,但是现在还是存在一个问题。那么也就是说地点和名字的问题,比方说在北京现在有许多大酒店,那么好多新建起来的大酒店,我们没有它的名字和地点,所以对收集这方面的数据也非常重要,这对我们目前系统里面完善也非常重要,所以在这方面数据工作我们还没有做得很好。
这是日本语音认知系统所显示的一个数据,我们可以看到纵向的是声音的认知,它周围是对旁边噪音的影响,那么就是说我们可以看到,当时翻译的时候他随着这个语音的认知对周围的噪音影响也非常大,所以我们各位可以听一下,可以听到这个周围的影响非常大,周围非常的嘈杂,那么通过我们的系统之后,各位可以听一下,就像刚才各位所听到的,即使周围存在噪音,我们语言的认知系统,我们的系统也能够达到98%以上的认知,将噪音减少了,比如说称公共汽车的时候,在周围非常嘈杂的环境中,我们也可以达到90%以上的正确认知度。
那么我们再讲一下语音的构成,那么这些语音的构成系统发展的非常快,就是说通过发音出来的数据,比方说我们收集了很多播音员的数据,通过这些数据我们进行分析,进行处理,然后将这个发音调节成尽量最标准的语音系统。
那么现在我先简单介绍一下目前我们的技术,各位日语不懂,所以我用的是中文。比方说就像这种的系统,我们已经提供了非常完善的这种语音提供系统,这是中国的技术研究人员开发的。那么下面我对翻译的部分进行一些介绍,刚才我介绍了,通过人来翻译的时候会有一定的规则来翻译,那么通过机器翻译的时候,机器也有机器的规则,那么将人和机器翻译的规则统一到这个系统中去,可以达到完全正确的翻译,比如说讲中文的时候,中文就是断句的时候,这个地方非常难,日语也是,如果断句断不好的话意思就完全不一样了,所以我们在这个系统里面集中了无数个翻译的模块,在翻译模块里面根据不同的断句方式,进行翻译的时候挑选出最贴切、最合适的翻译语言翻译。那么在输入进来的文章中,我们有两种,比如说有大概概要的翻译,比如说有一个文章,就是很大型文章输入进去之后,我们先是整体对这个文章进行一个大概翻译,然后将其中各个部分,比方说技术部分,或者是生活部分,或者是不同领域的部分进行分别的分类,然后在这个翻译系统中的模块中,不同的模块中进行翻译。
那么另外具体的翻译上面,我刚才说的,比如说我要去学校,刚才我已经介绍了,就是说通过综合翻译里面将先进行单词翻译,然后再进行文法翻译,就是说通过这两个系统的结合之后,可以尽量达到最准确的翻译,那么通过这两个翻译系统的相结合,我们已经几乎达到98%以上的正确性。那么在刚才说的大概翻译的部分,如果翻译的越准确,在大概翻译的部分,翻译的越准确,各个领域翻译的也就越正确,所以这是我们系统的特征,比方说总体的翻译在达到90%以上的精确度的时候,下面的翻译就会达到95%以上,那么在整体的翻译如果稍微差一点的话,那么下面的翻译就越来越离原文,离的意思就越远了,下面我们对这个系统进行试验之后的评价来介绍一下,比方说我在翻译的时候,比方说将中文的单词翻译成英文的时候,因为文化和习惯也不同,所以单词在完全准确翻译的时候,这个单词的准确性非常重要,这个对最终的文章翻译起到决定性的作用,所以我们在文章,整体文章全部翻译完了之后,我们还会通过人工的来检查,也就是说校稿进行检测,比如说A是语音,C是发音,那么通过人工的检测对整体翻译的文章再进行一次校正。
比方说我们在翻译课文的时候,如果100%的正确翻译输入之后,如果通过A系统的话,我们可以达到94%以上的系统,那么通过ALR,那么通过我们不同的系统进行测试以后我们可以发现它达到翻译的准确性也完全不同,我们进行了ABCD这四种分类。那么在翻译最准确的程度,我们认为的是在课文的翻译上达到的翻译程度最准确。那么在日本现在有一种英检测试,相当于我们中文的雅思测试,在这个测试上面很多人使用这个系统翻译,我们在英检的实验中也把我们的机器用于试验点,在试验点上也得到很好的评价,那么我们通过英检的学生中我们招了99个人,那么对这99个人,让他们听日语的,日常的旅行会话,还有一个组我们让他们听的是课文的基本翻译,那么通过学生翻译出来的和我们机器翻译出来的,我们将两种进行比较之,我们发现,我们找出翻译的特点,比方说人工翻译和机器翻译最大的特点在哪里,我们找出这个特点以后进行大量的这种数据的收集,然后对这个系统又进行了进一步的改善,尽量接近人工化。
在基本旅行会话上面,我们基本上可以达到900点,也就是说日语的(日文)上面能达到900点,那么如果通过翻译系统,然后再加上人工的翻译,我们达到的点数能达到600点,那么在关西那么我们空港我们通过完全人工只能达到500多一点点的点数,那么我们在大学的毕业生中也进行这种测试,发现在进行旅行会话的翻译上,这个系统能达到的准确性和这个点数比任何的人工,机器和人工结合的这种翻译都高很多。那么在中国有一种比方说HSK中文能力的测试,那么我们也通过中文能力测试的试验和我们这个系统进行了比较,那么在基本的日常会话中,HSK的机器翻译能达到9级,那么通过语音认知系统翻译日常旅行会话能达到8级,但是这些目前只是我们收集的一些数据来进行的测试,并没有把这个机器拿到实际的日常生活中去进行测试,所以这只是一个大概收集来的数据。所以从这些数据可以看出,我们翻译出来的已经可以几乎达到接近人工翻译出来的准确性了。比方说这是在关西空港,这是两个人,这两个人来到大阪旅游的,然后这个女士她是关西空港的服务人员,那么他们都通过这个机器进行交流。
那么在关西空港进行测试的时候,我们进行了市场调查,我们可以看到这个数据表显示出来的,比方说对话的对方,到底理解了自己说话的,比方说得话的多少程度,说自己说的话对方到底明白了多少,我们针对英语和中文进行了市场调查。可以达到完全理解的只能达到20%,那么能够明白一半的达到了80%,能够只明白一点点的,能理解80%以上的人数达到了50%,理解一半的人数达到了80%,达到完全理解的只有20%,也可以看出我们这个机器现在需要进一步的发展。从去年开始,我们这个机器里面,因为它要进行大量的数据处理,所以我们也使用了服务器,大型的服务器进行处理,比方说用户在这个终端上面进行输入或者进行语音认知,然后通过这个手机或者是电脑来输入到这个服务器中,将这个信息传递到服务器中,然后服务器再进行大量的数据处理,处理完了的数据通过手机或者是电脑传到我们翻译器上,这是我们目前进行的一个测试。
那么这个现在看到的是通过手机上的一个卡,也就是天线,旁边可以看到小的伸出来这部分是天线,通过这个小天线来跟这个数据库进行连接,进行处理,去年我们将这个技术得到了进一步的完善,那么在翻译文章和语音认知系统上面,那么我们进一步缩小了,可以达到目前看到这种小型的尺寸,那么它的尺寸几乎可以跟最小型的电脑相比了。像这么小的系统中,可以将中文、日文以及英文的认知系统,以及它的翻译所有系统的软件都能放进来,而通过麦克的传送来将这个声音再传递出来,这是一个非常了不起的一项改进了。在这么小的一个方块内将这么多的系统,以及认知软件放进去,这是我们去年做得一个最大的改进。
那么各位都听到了,就像这种形式的翻译,进行语音的翻译。那么这是(jiejiedao,日文音译)的一个系统,我们叫(jiejiedao,日文音译),那么如果通过这个触摸盘的变换可以变成,就是日文和英文的变换,从前年开始我们可以翻译成日文和中文了,我们现在这个系统里面集中了中文、日文和英文,那么在这三种语言进行互相之间的翻译这个机器可以做到了,同样中文和英文之间的翻译,以及日文和英文之间的翻译也可以通过这个之间的翻译,通过CE来转换成GE,三种语言之间进行互相转换,我们今天在北京展览馆,会在那里展示,各位可以亲自去展览馆看一下。大家可以亲自体验一下这个感觉。
最后我想对这个数据基础,我们基于数据处理系统来进行的一个更新的技术软件翻译,那么通过这个技术软件的翻译之后,我们几乎可以达到完全准确的正确性了,那么在这里面我们收集了有100万条以上的有关中文和日文的所有的数据进行处理,那么比方说在将来我们不仅仅限于中文、日文和英文之间,比如说在加入韩语或者是法文等等,几乎就是大语言我们都想囊括在这个机器里面,比如说各种商务活动,各种会议,将来我们这种机器会在会议中发挥更大的能量,这个研究我估计还要花费十年的时间,那么从现在开始我们正在着力发展这项研究。
谢谢各位聆听!