设为首页 | 加入收藏 | 手机看新闻
您现在的位置是:首页-东大要闻-让每个人拥有自己的机
东大要闻
让每个人拥有自己的机器翻译系统——讲述朱靖波教授与NiuTrans 的故事
作者:张广宏 编辑:王钰慧 来源:东北大学 更新日期:2014-12-18 浏览次数:次 字体:

    身居异国他乡,因为语言不通而茫然四顾不知所措时,打开手机,对着手机说出母语,手机就能准确地将你的话翻译能当地语言,帮助你实现与老外的顺畅交流。这不是科幻大片中的虚幻镜头,而是东北大学自然语言处理实验室自主研制的机器翻译软件,通过软件的自主学习,手机很快就可以学会各种语言,成为你在各个国家的翻译。


让每个人拥有自己的机器翻译系统

——讲述朱靖波教授与NiuTrans的故事



前排右四为朱靖波教授

    信息学馆410室,一间极其普通的教室,二三十米的空间内沿墙摆满了普通的电脑桌,中间又用电脑桌围成一个小会议桌,整个空间内只有一圈1米宽的通道。这就是东北大学自然语言处理实验室主任朱靖波教授和他的学生们共同的办公室,也是NiuTrans诞生的地方。“空间虽小,却拉近了我与学生的距离,在这里,与学生一起开发NiuTrans,是我最快乐的时光。”朱靖波自信地说,“东北大学自然语言处理实验室主任不敢说是机器翻译技术领域国家队队长,但绝对是国家队的主力队员。”

    朱靖波1992年开始接触机器翻译,1999年博士毕业留校,继续从事这项工作。2003年,朱靖波到香港城市大学学习半年,随后又到南加州大学ISI实验室做访问学者,并在ACL院士Eduard Hovy的指导下开始从事知识工程和机器翻译的科研工作。2007年回到实验室后,朱靖波以一种更好的心态去从事科研工作,不急功近利,不盲目跟风,研究工作突飞猛进。

    2009年暑假,信息学馆没有了往日人流涌动的喧嚣,显得十分安静。但信息学馆410室内却是异常紧张地忙碌着。朱靖波团队正在第一次使用统计机器翻译技术参加国内规模最大、历史最长的机器翻译比赛——CWMT评测。

    系统的主要参与人肖桐回忆说,“当时正是8月份,沈阳也很炎热。我们的系统开发和实验需要在多个服务器上进行,由于天气太热,服务器所在的机房经常跳闸,我们就需要守在服务器旁,忍受着巨大的噪音和高温,有时从早上7:00一直要实验到晚上11:00,直到信息学馆闭馆,被打更老大爷撵了几次才离开。最后功夫不负有心人,经过近两个月的工作,我们最终完成了整个参赛系统的开发。”

    在比赛中,东北大学的汉英新闻翻译系统只用了不到十几分钟就完成了所有测试句子的翻译,比绝大多数参赛系统的速度都要快。结果提交两周之后,他们得到了评测方的报告,东北大学的汉英新闻翻译系统取得了第二名,仅以微弱的差距落后于微软亚洲研究院。

    评测大会的颁奖仪式隆重热烈。取得优异成绩的朱靖波教授成为人们关注的焦点。但朱靖波却仍旧保持着谦虚的姿态,虚心地与众多同行交流。当得知绝大多数参赛单位都在使用Moses等国外大学开发且没有针对以中文为核心的翻译任务进行调优的开源统计机器翻译系统后,朱靖波在会上郑重地宣布:“东北大学要开发自己的开源机器翻译系统,让全世界的科研人员都可以在东北大学的平台上开展研究。”NiuTrans开源系统的开发就是从这时起步,一做就是5年,团队至今仍然在为其持续升级而不断努力。

    从那时起,信息学馆410就始终处于高速运转的状态。每天都是最早开门,最晚熄灯。朱靖波、肖桐和李天宁、陈如山两位硕士研究生组成的团队夜以继日地开始钻研机器翻译工作。后来又有张浩和李强两位同学也加入进来,共同为开发中国人自己的开源系统而努力。

“NiuTrans”是朱靖波给将要开发的系统起的一个很有内涵的名字。“NIU蕴含着东北大学(NEU)、创新(Innovation)和老黄牛精神(牛)三重含义,Trans是translation的缩写,两个部分合起来,表达了团队要发扬老黄牛的精神,勇于创新,积极进取,努力打造出最牛的机器翻译软件。”朱靖波说。

    2011年7月,团队正式发布了NiuTrans的第一个开源版本,得到了非常多的关注。又经过一年的努力,团队把包括短语、层次短语、树到串、串到树、树到树的五个模型都集成到了NiuTrans系统中,形成了一个属于中国人自己的完整的统计机器翻译系统,这也是世界上第二套支持5个主流模型的翻译系统。

    “当朱老师最初宣布建开源系统时,大家都很担心,公开源代码,这需要勇气和自信,需要我们付出更多的努力。但朱老师的自信激励了团队的每一个成员,我们齐心协力,并最终取得了成功。”肖桐回忆说。

在随后的国际大赛中,NiuTrans连获佳绩,在日本东京举办的国际汉英专利翻译评测中系统取得第二名,在我国CWMT2011英汉新闻机器翻译评测取得第一名。

    2012年7月9-11日,一年一度的自然语言处理领域国际上最高级别的学术会议——国际计算语言学大会第50届会议在美丽的韩国济州岛隆重举行。东北大学开源统计机器翻译系统NiuTrans被选择为参会的演示系统,引起国际学术界的高度关注。

    平日里着装比较随意的朱靖波老师,以一身帅气的西装出现在人们面前。他以技术报告的形式介绍了NiuTrans系统,赢得了热烈反响。来自于英国爱丁堡大学的Miles Osborne教授两次返回东北大学的展台,进行技术交流。

    “There is only one difference between Moses and NiuTrans: the developers(NiuTrans和Moses两个系统间只有发明者不同的区别).”,Miles Osborne教授说。这句看似简单的评价,却是对东北大学自然语言处理实验室最高的褒奖。

    信息学馆410室的空间略显拥挤,但在这里成长起来的科研团队却展现着广阔的胸襟。“计算机软件开源是一项公益事业。我们进行NiuTrans开源系统的开发,就是让更多的科研工作者在我们的肩膀上开始工作,更快地推动科研事业的发展。”朱靖波表示,“让每个人拥有自己的机器翻译系统是我们坚持的使命,帮助用户利用NiuTrans技术构建自己的本地化、专业化和个性化机器翻译系统是我们需要完成的任务。看到越来越多的单位和个人使用我们的软件,我们就很自豪,很骄傲。”


东大主页 | 英文主页 | 东北大学报 | 广播电视网 | 长夜书香 | 时事新闻 | 东大黄页 | 滇西开发网 | 昌宁新闻网
领导 | 院士 | 校友 | 图书 | 招生 | 研究生 | 就业 | 校园网 | 教务 | 人事 | 校园安全 | 后勤服务 | 学报 | 心理咨询 | 医院
Copyright © 2004-2011 东北大学党委宣传部(新闻中心)版权所有
投稿须知 投稿邮箱:85590@mail.neu.edu.cn 新闻热线:024-83685590