2020國際機器翻譯評測比賽結束,來自中國的中譯語通科技股份有限公司展現出機器翻譯領域的領先實力。其參賽6個語言方向,在高棉語-英語、英語-高棉語、普什圖語-英語、英語-普什圖語、泰米爾語-英語等5個語言方向上獲得冠軍,在英語-泰米爾語方向位居第二,奪冠數量全球居首。
國際機器翻譯大賽(WMT)由國際計算語言學協會 (ACL)主辦,是全球學術界公認的規模最大的國際頂級機器翻譯評測比賽之一,自2006年以來,已連續舉辦15屆。比賽的主要宗旨是評估機器翻譯最新發展水平,傳播通用測試數據集和公共訓練數據,改進機器翻譯評估評測方法。此次大賽共發佈中文-英語、捷克語-英語、法語-德語、德語-英語、因紐特語-英語、泰米爾語-英語、日語-英語、普什圖語-英語、波蘭語-英語、俄語-英語、高棉語-英語等11個語言對、22個語言方向的機器翻譯評測任務。
中譯語通在2020國際機器翻譯評測比賽的成績單。
中譯語通的機器翻譯戰績近年來一直優異,令同行刮目相看。在2019年國際機器翻譯大賽中,中譯語通與全球60餘家頂級團隊同臺競技,獲得3個語言方向冠軍,奪冠數量與微軟亞洲研究院、Facebook並列第一。在2018年國際機器翻譯大賽中,中譯語通僅參賽英中方向自動評測,獲得第一名。在2017年國際口語機器翻譯評測比賽(IWSLT2017)的20個語言方向翻譯評測中,中譯語通囊括了16個語言方向的第一名。
驕人的成績源自不斷創新與堅持。中譯語通是國內率先開展機器翻譯研究的企業之一,多年來,該公司科研人員在領域機器翻譯和語種機器翻譯模型研究上持續突破,並擁有了海量高質量語料和先進的數據清洗技術,使其機器翻譯優勢更為凸顯。目前,中譯語通的產品可支持金融、科技、醫療等多個垂直領域以及多達60個語種、3000個語言方向的翻譯,積累的高質量專業領域平行語料超過52億句對。在數據清洗上,中譯語通採用了語言模型和翻譯模型分別對語料進行清洗,設計了循環語料生成和清洗方法,來不斷重複提高翻譯質量和語料質量。在訓練技術上,採用了預訓練模型調優、知識蒸餾、多模型融合解碼、聯合訓練、翻譯重排序等技術,來提高訓練的質量。
如今,中譯語通已構建了完善的機器翻譯應用生態體系。應用範圍覆蓋文本、網頁、音視頻等多模態數據,應用產品形態涉及文件夾翻譯、文檔翻譯、Word翻譯插件、字幕通、網頁翻譯、輔助翻譯平臺等,應用場景更為廣泛,包括國際會議同傳、遠程辦公教學、翻譯項目管理、跨語言語義檢索、多語種數據加工等。中譯語通的應用模式十分多樣化,除成熟軟硬件產品外,還支持行業機器翻譯模型定製、私有雲及本地化部署、軟硬件一體機、雲端調用等多種模式。
轉載請超鏈接註明:頭條資訊 » 機器翻譯能達60個語種3000個方向,近日又奪全球五冠,這家牛企是誰?
免責聲明 :非本網註明原創的信息,皆為程序自動獲取互聯網,目的在於傳遞更多信息,並不代表本網贊同其觀點和對其真實性負責;如此頁面有侵犯到您的權益,請給站長發送郵件,並提供相關證明(版權證明、身份證正反面、侵權鏈接),站長將在收到郵件24小時內刪除。