2020国际机器翻译评测比赛结束,来自中国的中译语通科技股份有限公司展现出机器翻译领域的领先实力。其参赛6个语言方向,在高棉语-英语、英语-高棉语、普什图语-英语、英语-普什图语、泰米尔语-英语等5个语言方向上获得冠军,在英语-泰米尔语方向位居第二,夺冠数量全球居首。
国际机器翻译大赛(WMT)由国际计算语言学协会 (ACL)主办,是全球学术界公认的规模最大的国际顶级机器翻译评测比赛之一,自2006年以来,已连续举办15届。比赛的主要宗旨是评估机器翻译最新发展水平,传播通用测试数据集和公共训练数据,改进机器翻译评估评测方法。此次大赛共发布中文-英语、捷克语-英语、法语-德语、德语-英语、因纽特语-英语、泰米尔语-英语、日语-英语、普什图语-英语、波兰语-英语、俄语-英语、高棉语-英语等11个语言对、22个语言方向的机器翻译评测任务。
中译语通在2020国际机器翻译评测比赛的成绩单。
中译语通的机器翻译战绩近年来一直优异,令同行刮目相看。在2019年国际机器翻译大赛中,中译语通与全球60余家顶级团队同台竞技,获得3个语言方向冠军,夺冠数量与微软亚洲研究院、Facebook并列第一。在2018年国际机器翻译大赛中,中译语通仅参赛英中方向自动评测,获得第一名。在2017年国际口语机器翻译评测比赛(IWSLT2017)的20个语言方向翻译评测中,中译语通囊括了16个语言方向的第一名。
骄人的成绩源自不断创新与坚持。中译语通是国内率先开展机器翻译研究的企业之一,多年来,该公司科研人员在领域机器翻译和语种机器翻译模型研究上持续突破,并拥有了海量高质量语料和先进的数据清洗技术,使其机器翻译优势更为凸显。目前,中译语通的产品可支持金融、科技、医疗等多个垂直领域以及多达60个语种、3000个语言方向的翻译,积累的高质量专业领域平行语料超过52亿句对。在数据清洗上,中译语通采用了语言模型和翻译模型分别对语料进行清洗,设计了循环语料生成和清洗方法,来不断重复提高翻译质量和语料质量。在训练技术上,采用了预训练模型调优、知识蒸馏、多模型融合解码、联合训练、翻译重排序等技术,来提高训练的质量。
如今,中译语通已构建了完善的机器翻译应用生态体系。应用范围覆盖文本、网页、音视频等多模态数据,应用产品形态涉及文件夹翻译、文档翻译、Word翻译插件、字幕通、网页翻译、辅助翻译平台等,应用场景更为广泛,包括国际会议同传、远程办公教学、翻译项目管理、跨语言语义检索、多语种数据加工等。中译语通的应用模式十分多样化,除成熟软硬件产品外,还支持行业机器翻译模型定制、私有云及本地化部署、软硬件一体机、云端调用等多种模式。
转载请超链接注明:头条资讯 » 机器翻译能达60个语种3000个方向,近日又夺全球五冠,这家牛企是谁?
免责声明 :非本网注明原创的信息,皆为程序自动获取互联网,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责;如此页面有侵犯到您的权益,请给站长发送邮件,并提供相关证明(版权证明、身份证正反面、侵权链接),站长将在收到邮件24小时内删除。