设为首页 | 加入收藏 | 手机看新闻
您现在的位置是:首页-东大要闻-小牛翻译,做最好的机
东大要闻
小牛翻译,做最好的机器翻译发动机
作者:张广宏 编辑:王钰慧 来源:东北大学 更新日期:2018-11-02 浏览次数:次 字体:



    近日,工业和信息化部公布了2018年人工智能与实体经济深度融合创新项目名单。由东北大学计算机科学与工程学院朱靖波教授小牛团队创立的沈阳雅译网络技术有限公司经项目推荐、综合评审和网上公示等环节,从全国2428个申报项目中脱颖而出,成功入选最终106个项目的名单。辽宁省仅有四家单位入选,另外三家单位为新松机器人有限公司、中科院沈阳自动化所、东软医疗。专家评价“小牛翻译云服务平台”是综合实力强劲、融合创新程度高、可复制可推广性强、能够有力提升我国人工智能技术水平和自主创新能力,推动人工智能产业加速发展的创新项目。

    小牛翻译是目前支持语种最多的机器翻译系统,能够支持中文与118种语言互译,包括英日韩俄法西等语种、“一带一路”沿线所有国家的官方语言,是业内唯一能实现“维蒙藏哈朝彝壮”七大少数民族语言翻译的系统。这就是仅60余人的小牛翻译团队在激烈的市场竞争中取得的骄人成绩。

    小牛翻译创始人朱靖波表示,“基于东北大学自然语言处理实验室38年机器翻译技术的积累,团队坚持自主研发,不断创新突破,做世界最好机器翻译系统的梦想,正在我们手中一点点变成现实。”

38年积淀,小牛翻译夯实了发展基础

    “人的精力是有限的,一辈子做成一件事就已不容易。”这是我国自然语言处理领域开创人之一—姚天顺教授对弟子们细心的叮嘱。1980年12月1日,姚天顺教授创建了东北大学自然语言处理实验室,开创了中国计算语言学的研究方向。

    朱靖波1992年师从姚天顺教授,开始接触基于规则的机器翻译方法研究,1999年博士毕业留校,继续从事这项工作。2003年,在香港城市大学副校长邹嘉彦的建议下,朱靖波到香港城市大学学习半年,随后又在台湾计算语言学领域创始人苏克毅老师的介绍下,到南加州大学ISI研究所做访问学者,并在前计算语言学协会主席Eduard Hovy教授的指导下从事知识工程和机器翻译的科研工作。

    在这个机器翻译领域国际最顶尖研究所学习期间,朱靖波被研究所科研人员的工作态度所震撼。“科研工作不是跟潮流,哪有热点往哪里跑,而是坚持自己的研究方向,努力把冷门变成热点,让别人跟着自己跑。”朱靖波表示,“正是这种敢为人先的开拓精神和从容的研究心态,才使ISI研究所成为世界最顶级的研究所。”

    2007年回到实验室后,朱靖波学会了以一种更好的心态去从事科研工作,不急功近利,不盲目跟风,研究工作也突飞猛进。2009年,团队第一次使用统计机器翻译技术参加国内规模最大、历史最长的机器翻译比赛—CWMT评测,取得了汉英新闻翻译系统第二名的成绩,仅以微弱的差距落后于微软亚洲研究院。

    在这次评测大会上,朱靖波教授注意到,绝大多数参赛单位都在使用英国爱丁堡大学的Moses开源统计机器翻译系统做优化,但是系统并没有针对以中文为核心的翻译任务进行调优,造成许多参赛单位的比赛结果并不理想。朱靖波在会上郑重地宣布,要开发自己的开源机器翻译系统,让全世界的科研人员都可以在东北大学的平台上开展研究。

   为了鼓舞士气,朱靖波给这个系统起了一个很有内涵的名字—NiuTrans。朱靖波说:“NIU蕴含着东北大学(NEU)、新(new)和老黄牛精神(牛)三重含义,Trans是translation的缩写,两个部分合起来,表达了团队要发扬老黄牛的精神,勇于创新,积极进取,努力打造出最牛的机器翻译软件。

    实验室的每个人都秉持着“精益求精、百炼成钢”的精神,努力地在以中文为核心的自然语言处理领域不懈奋斗。系统的主要技术负责人、朱靖波教授培养的第一个博士、如今已经成长为实验室副主任的肖桐副教授说,“当时正是8月份,沈阳天气炎热。我们的系统开发和实验需要在多个服务器上进行,由于天气太热,服务器所在的机房经常跳闸,我们就需要守在服务器旁,忍受着巨大的噪音和高温,有时从早上7:00一直要实验到晚上11:00,直到信息学馆闭馆,被打更老大爷撵了几次才离开。功夫不负有心人,经过近两个月的工作,我们终于完成了整个参赛系统的开发。”

    2011年7月,团队正式发布了NiuTrans的第一个开源版本,得到了非常多的关注。又经过一年的努力,团队把包括短语、层次短语、树到串、串到树、树到树的五个模型都集成到了NiuTrans系统中,形成了一个属于中国人自己的、完整的统计机器翻译系统,这也是世界上第二套支持五个主流模型的翻译系统。在随后的国际大赛中,NiuTrans连获佳绩,在日本东京举办的国际汉英专利翻译评测中系统取得第二名,在CWMT2011英汉新闻机器翻译评测中取得第一名。东北大学开源统计机器翻译系统NiuTrans被ACL2010选择为参会的演示系统,引起国际学术界的关注。

    小牛翻译团队今年的评测成绩更是令人瞩目:国内的CWMT2018评测,中英翻译自动评价第一名,英中翻译自动评价第二名;首次参加国际顶级机器翻译评测WMT2018,中英翻译人工评价第一名、自动评价第二名,英中翻译自动评价第二名。

    目前,NiuTrans开源机器翻译系统,作为世界上支持语言模型最多的开源系统之一,已被全球70多个国家的2000多个研究机构下载使用。鉴于在机器翻译技术上的重大创新与突出贡献,小牛翻译团队在2016年荣获国内自然语言处理领域最高科学技术奖—钱伟长中文信息处理科学技术奖一等奖,成为国内首次获得该奖的机器翻译研发团队。

机器翻译产学研,小牛翻译走上了行业的最前沿

    随着跨境电商、跨境旅游、跨境金融等产业、行业的快速发展,多语种语言信息的快速处理成为必须跨越的障碍。而这一问题,人工翻译无法快速、准确、低成本地解决,被认为是自然语言处理领域“皇冠上的明珠”的机器翻译成为必然选择。为此,谷歌、微软、脸书等科技巨头纷纷投身于机器翻译发展领域。

    面对机器翻译行业及市场的迅猛发展,手握“明珠”的朱靖波看到了希望,雄心勃勃地走出实验室,开启了机器翻译产学研一体化发展的创业之旅。

    基于自主研发的神经机器翻译技术,小牛翻译团队构建了小牛翻译开放平台,采用线上线下结合的方式,面向企业级大数据的翻译需求提供机器翻译服务解决方案,已经与腾讯、科大讯飞、京东、携程、去哪儿、中国联通、东软集团、国家知识产权局、SYSTRAN等国内外50余家行业标杆企业以及多个政府部门建立了合作关系。

    朱靖波自信地表示,“现在的机器翻译市场竞争激烈,与很多人交流时,对方说的第一句话都是‘与Google翻译、微软翻译、百度翻译等软件的性能相比,小牛翻译的性能如何?’当用户自己体验完小牛翻译品质优于所有同类型的产品时,用户才会关心我们的水平有多高,比如论文、获奖、样板工程等等。看到我们强大的研发能力,完全能够满足用户的需求,合同就比较容易签订了。”

    作为科大讯飞及其客户的唯一机器翻译解决方案提供商,2017年10月,在科大讯飞举办的首届“1024开发者节”上,小牛翻译团队被科大讯飞列为“AI钻石团队”,得到了科大讯飞“1024计划”的战略支持,多个语种的小牛翻译引擎接入讯飞开放平台,成为讯飞平台上外部唯一的机器翻译服务提供商,为平台上的50多万名开发者提供机器翻译服务,小牛翻译也迅速地为更多的用户所知晓。2017年11月,在北京国家会议中心举行的科大讯飞年度产品发布会暨讯飞开放平台论坛AI大学成立仪式上,朱靖波教授被聘为讯飞AI大学首批特聘教授。

    目前,小牛翻译团队已经成为国内的机器翻译产学研领军团队。“我们是在岗教师搞科技成果转化的先行军!” 创业之路越来越顺利的朱靖波表示,“基于实验室多年的研发积累,自主研发多语种机器翻译引擎,是一件快乐的事情。我们赶上了国家的好政策,东北大学也大力扶植我们团队,这种模式让产学研融会贯通形成良性循环的闭环。在这个过程中,我既是教授,又是团队负责人;不脱离学校,又兼顾市场。我们每个人都是受益者。”

    小牛翻译的发展得到了学校和学院的大力支持,小牛翻译团队也积极引入外部资源,助力学院快速发展。2018年9月15日,在东北大学成立95周年之际,依托小牛翻译团队,锋创公司董事长、东北大学1981级杰出校友张寒燕女士与计算机学院共同创办人工智能联合实验室。该实验室将以实际市场应用为导向,充分发挥企业和高校的联合优势,解决人工智能领域难题,进一步加快计算机学院的科技成果转化。

    展望未来,小牛翻译团队将继续坚持“机器翻译,让语言交流无障碍”的梦想,与更多知名企业强强联合,让机器翻译技术服务社会、造福人类。




东大主页 | 英文主页 | 东北大学报 | 广播电视网 | 长夜书香 | 时事新闻 | 东大黄页 | 滇西开发网 | 昌宁新闻网
领导 | 院士 | 校友 | 图书 | 招生 | 研究生 | 就业 | 校园网 | 教务 | 人事 | 校园安全 | 后勤服务 | 学报 | 心理咨询 | 医院
Copyright © 2004-2011 东北大学党委宣传部(新闻中心)版权所有
投稿须知 投稿邮箱:85590@mail.neu.edu.cn 新闻热线:024-83685590