中国翻译科研获得突破性进展
中科院声学所语音交互技术专家杜利民博士介绍说,中国着手研究语音翻译系统已有十年的历史。七国语音同声互译的原理是,先将本族语识别后翻译成中间语言,再用中间语言与其它语言互译。但目前国际语音互译计划的词汇量仅限于10000个字词,对话场景也仅仅初步定为预定旅馆、购机票、餐馆对话、外币兑换等场所
纵然如此,在技术上进行直接语音翻译仍有很大的挑战性。徐波介绍说,直接语音翻译集语音识别、机器翻译和语音合成于一体。首先是语音识别,尽管目前实验室里的语言识别率已达90%以上,但由于现实生活中的口音、方言、背景噪声等一系列因素,识别率仅为60%左右,还需我们在近几年内有进一步突破。?
其次是机器翻译,由于不规范的文本以及各种语言的自身特点,如汉语的非时态,句子的歧义等增加了翻译的难度,而最难的是把两者合在一起,即语音合成。目前除上述七国之外,许多国家都在进行这方面的研究,国内如IBM等公司,也一直在做相关研究,而日本的研究,几十年来一直就没有停止过。 |