中新網(wǎng)北京1月16日電 國際知名學(xué)術(shù)期刊《自然》最新發(fā)表一篇人工智能研究論文稱,研究人員研發(fā)出一個人工智能(AI)模型,能即時翻譯多達(dá)101種語言的語音和文本,包括直接語音到語音翻譯。
這款名為SEAMLESSM4T的人工智能模型,填補(bǔ)了語言覆蓋方面的空白,并且性能優(yōu)于現(xiàn)有的系統(tǒng)。研究團(tuán)隊說,本項研究工作或可為快速通用翻譯鋪平道路,其資源公開可用(用于非商業(yè)用途),以協(xié)助進(jìn)一步研究包容性語音翻譯技術(shù)。
該論文介紹,科幻小說的讀者可能很熟悉《銀河系漫游指南》里的“巴別魚”,這種小魚能侵入耳朵,即時將一種口語翻譯成另一種口語。類似“巴別魚”的這種工具對于促成全球互聯(lián)環(huán)境下的交流非常有用,但大多數(shù)現(xiàn)有的機(jī)器學(xué)習(xí)翻譯系統(tǒng)都是文本導(dǎo)向,或者需要語音識別、翻譯成文本、再將文本轉(zhuǎn)換成語音好幾步。此外,現(xiàn)有語音到語音模型的語言覆蓋范圍也遠(yuǎn)低于文本到文本的模型,并且傾向于從源語言翻譯成英語,而非從英語到另一種語言。
為了解決這些限制,在本項研究中,美國Meta基礎(chǔ)人工智能研究的“無縫交流團(tuán)隊”開發(fā)出一個單一模型SEAMLESSM4T,其支持多達(dá)101種語言之間的多種翻譯模式,可以支持語音到語音(識別101種語言并翻譯為36種語言)、語音到文本(101種語言譯為96種)、文本到語音(96種語言譯為36種)、文本到文本(96種語言)的翻譯,以及自動語音識別(96種語言)。
研究團(tuán)隊表示,在語音到語音的翻譯中,SEAMLESSM4T的文本翻譯比現(xiàn)有系統(tǒng)準(zhǔn)確率提升23%。同時,該人工智能模型可過濾背景噪音并適應(yīng)說話者的差異。
《自然》同期發(fā)表同行專家的“新聞與觀點”文章指出,雖然后續(xù)還需要進(jìn)一步優(yōu)化,但人工智能模型SEAMLESSM4T可能代表著向跨越語言障礙促進(jìn)交流的進(jìn)步。(完)