广外学子王晨旭:引入AI大模型开发城市标语翻译纠错系统
日前,由广东省教育厅主办、广东外语外贸大学(以下简称“广外”)承办的2024年广东省大学生计算机设计大赛暨第17届中国大学生计算机设计大赛粤港澳大湾区赛(以下简称“大赛”)成功举办,广外全校共有来自46个专业537名师生参赛,18组作品获得国家级赛奖项,包括一等奖1项,二等奖9项,三等奖8项。其中,信息科学与技术学院(以下简称“信息学院”)的师生团队获得二等奖3项,三等奖6项。
“马桶易堵”翻译成“Toilet is blocKed(马桶已堵)”、“灭烟台”翻译成“destroy Yantai”(“毁灭”烟台)……去年年末,王晨旭发现,广州不少公共设施标语充斥诸如此类令人啼笑皆非的翻译错误。
“希望这个系统,能对广州甚至全国的标语正确翻译和使用起到贡献。”王晨旭,广外信息学院大三学生,今年组队自研的《基于生成式人工智能的广州市标语翻译与纠错系统》,获得了2024年广东省大学生计算机设计大赛一等奖(软件应用与开发)与2024年中国大学生计算机设计大赛二等奖。
一个跨学科跨专业的五人团队,历时九个月自研AI系统,以人工智能应用等我省战略产业发展方向为研究方向,致力于为城市装上AI眼睛,提升城市美好形象,让城市治理现代化。
本期报道,南都记者走近这个跨专业科创新生代团队。
王晨旭在威海参加决赛后的游客照。受访者供图
偶然的发现
去年岁末,一个阴雨绵绵的下午,王晨旭闲逛流花湖公园,一个公厕标语英文翻译引起他的注意:“马桶易堵”翻译成“Toilet is blocKed(马桶已堵)”。
2023年11月,王晨旭在流花湖公园的公厕内看到翻译错误的标语。受访者供图
一字之差,意思差之千里。
无独有偶,随后一次外出吃饭,王晨旭注意到,广州地铁二号线站内的手扶电梯标语:电梯(elevator)被译为“stair(楼梯)”。
“标语的指示功能被大大削弱了。”王晨旭在网上搜索一番之后,他发现,翻译错误的标语在全国有很多,在二三线城市更泛滥。有些更是令人哭笑不得,例如“小心地滑”的标语,底下对应的英语却是slip carefully(小心地滑倒),“要是不会中文的外国人看到这样的标语,会满脸问号吧?”
他心想,虽然看起来是很小的问题,但频繁地出现,对城市的国际形象产生着负面影响,也会对有需要的人产生错误的指引。
他开始琢磨:“该做一个怎样的软件能解决这些问题?”
在研究了市面上同类的竞品后,王晨旭发现,这些App能实现的功能还比较初级。他想要做的不只是一个能翻译的软件,还能收集翻译错误的标语及位置,反馈给相关负责的部门,推动后续的修改;再增加一个审核端口,让专业的人士、志愿者、相关部门对报错进行审核,鼓励用户更积极地去发现和反馈错误,形成一个激励循环。
“当时我们是有一个大创的校级立项,所以说我们想把这个东西做的好一点,立项满足之后也可以顺便参加一下(广东省大学生计算机设计大赛)。”谈到项目设立最初的情景,王晨旭难忘当时跃跃欲试的心情。
决定性的引导
这个想法得到了导师周栋的肯定。周栋是王晨旭所在的信息学院智能信息处理实验室的导师,也是信息学院软件工程系的教授。
王晨旭团队和周栋教授。
一个App如何准确地识别出标语中的翻译错误,并对识别出的错误进行有效的纠正?
王晨旭想到的逻辑是:用户输入翻译错误的词句或图片,然后使用机器翻译,再输出正确的结果。
“现在市面上开源的大模型选择很多,各种应用百花齐放,学习门槛也较低,而且比传统的机器翻译更准确。”周栋建议他直接使用大模型:在系统内搭建一个智能体,让它来完成具体的操作,可以大幅简化研发的过程,“既然模型能够进行纠错,那么我们可以将其应用在报错端口,也可以用在审核环节。”
周栋提出的系列建议,让王晨旭醍醐灌顶,同时也让他意识到,大模型的潜力远超最初设想的范围。
跨界的团队
确定项目的方向,开始组建团队。
虽然AI大模型可以直接调用翻译,但是具体到公共场所的标语,还做不到完全精细、准确的翻译,语料库的内容还不够。该团队需要做的除了研发,还需要对语料库进行完善,对常见的标语给出准确的翻译。
“我需要一支英语翻译、计算机技术都很强的团队。”王晨旭没有选择发朋友圈的方式招募,而是让实验室的同学互相推荐介绍。
在朋友圈拉人,还得面试,要面试别人,自己需要比被面试的人更懂。
“这学习成本太高了。好在,这里是广外。”他说,找专业横跨这么大的优秀同学倒不难,没隔几个实验室就把人找齐了。
王晨旭组建的团队一共有五个人:一部分同学来负责制作App、优化算法、设计界面、开发前端后端等;另一部分负责收集并整理包含大量广州公共标识及其规范英文译写的平行语料库,要对文化娱乐、旅游、交通、教育、医疗等十个公共服务领域的标语进行翻译和纠错。
“团队里,有高级翻译、汉语专业的同学,他们手工标注了三千条左右的标语。”王晨旭介绍。
2024年5月,王晨旭和团队成员参加省赛决赛。
难啃的硬骨头
分好工之后,大家分头行动。王晨旭负责的是算法的研究。
AI大模型的内容包罗万象,他要做的就是从海量的内容中精确地把需要的内容找出来。这需写代码来实现。
在查阅了大量文献综述,了解了一些主流方法和技术后,他发现,公共场所的标语翻译这个分类还是太“小众”了,没有现成的代码能实现这个功能。
“我只能自己研究。”大二时,学校的课程对大模型算法的涉及还比较少,搜索了相关的论文和课程之后,王晨旭觉得“很晦涩,得生啃。”抱着电脑一头埋进实验室,他用了大量的课余时间和多个周末节假日来学习,学习目标是:自己先学到熟练运用并能教会别人的程度,才能跟团队里的其他人说清楚他想要做的方向,才能给需要的人进行算法相关的指导。
训练模型和微调的过程也推进得很慢。
王晨旭和团队成员向南都记者展示参赛作品。
写代码,输入数据之后运行、报错、修改、调试、找导师指导……反复循环,并不顺利。
另外,作为项目的负责人,王晨旭一直组织成员们定期开会,但有时漫无目的地开了很久的会,也没什么讨论出什么结果。
反复开会、不断碰撞,当拿出做好的第一版App时,不顺似乎到了顶点。
直面困难的勇气
“这和我们之前设想的差距太大了。”他有些沮丧地说道。
进行了回顾和归因后,王晨旭意识到,需要更加系统地分析需求,并更准确地传达给负责开发的同学,确保团队的理解和目标一致。
找到了高翻学院的学生,进行了用户访谈,收集了他们反馈的需求,团队经过调研发现,用户们普遍认为,工具的翻译结果过于直译,缺乏自然性。比如:“科技改变生活”,机器翻译为“Technology changes life”,用户则更期待“Technology transforms lives”这样的地道表达。
此外,用户们还希望工具能根据不同场景调整翻译风格,例如商务场合的正式表达与广告标语的口语化风格应有所区;也希望纠错功能能更智能化,不仅指出语法和拼写错误,还能给出更专业的用词建议。
明确了需求之后,王晨旭重新组织了组会,激烈的讨论后,大家重振旗鼓,决定对作品大幅修改。
对于其他遇到的困难,王晨旭也在一个个想办法解决。
纠译通App运行时的界面。
一次会议上,成员们的意见有了大的分歧。一部分成员主张以标语纠错为核心,认为标语需要准确无误的语法和拼写,纠错功能是基础,可以提升标语的专业性和可信度;另一部分成员则更倾向于以翻译为核心,认为市场对多语言翻译的需求更大,翻译功能的质量和文化适配性决定了项目的价值;还有成员提出,纠错与翻译应兼顾,以提供完整的解决方案,但这可能会增加技术实现的复杂性和开发成本。
作为队长,经过不断沟通、评估、与团队头脑风暴,最终达成一致:以“翻译为主,纠错为辅”的方向推进,即在翻译模块中嵌入轻量化的纠错功能,通过预处理实现基本的语法与拼写检查,同时将重点放在优化多语言翻译的准确性与流畅性上,确保翻译结果贴合语境和文化背景。
作品越来越完善了。
自豪的作品
“AI是势不可挡的。”一个跨学科跨专业的五人团队,历时九个月,基于AIGC打磨AI作品,王晨旭感慨道
而最开始,王晨旭摸不清如何用AI。
作品最初版本的界面设计比较臃肿,不够美观。没有足够的经验的他们,想到了向市面上成熟的优秀产品学习。
研究小红书和抖音等App的设计理念,参考色彩搭配和界面布局,使用一些设计工具进行原型设计和用户测试,收集反馈后不断迭代,王晨旭回忆,经过多次调整,参赛时的App界面干净简洁,特色功能“AI助手”的按钮变身晶莹剔透的水晶球,颇具设计感。
引入了AI辅助后,产品比竞品反应更快,给出的回应更全面,更准确。
作品完成,参赛!
从立项开始,参加校赛,省赛,国赛,选拔,初赛,决赛,进度条的刷新一次次拓宽着他们的目标。随着模型越调越好用,App越来越成熟,最终,《基于生成式人工智能的广州市标语翻译与纠错系统》获得了2024年广东省大学生计算机设计大赛一等奖(软件应用与开发),2024年中国大学生计算机设计大赛二等奖。
第17届中国大学生计算机设计大赛颁奖典礼上的王晨旭。受访者供图
国赛时的紧张,多次模拟答辩后越来越顺畅的表达,组织推进的会议,和团队成员们激烈争辩后调整方向的喜悦,啃下的课程之外的算法知识,完整的跑通一个App生产的全过程......这九个月的时间,王晨旭的收获远超这一个获奖的作品。
“我觉得还是低调点好。”获奖之后,王晨旭没发朋友圈,团队们一起吃饭庆祝,并肩作战的他们无疑有了更多的信心。
2024年7月,王晨旭参加人工智能创新实践实训营。
作品的计算机软件著作权已经提交了申请,暂告一段落。
除了希望这个项目能推广出去,对城市语言景观的治理出一份力,他说,接下来,将继续寻找更多算法,去解决现实生产生活中的问题。
【寄语】
周栋 广外信息学院软件工程系教授
对学生:非常有活力,非常有特色,是一个融合AI人才、语言人才等具有广外特色的跨学科团队。
对作品:兼具实用性和公益性。生活中,标语错误无处不在,但缺乏发现渠道和上报渠道,这个作品在目前市场上是稀少的。广外信息学院一直在做多种小语种的语料库,希望未来实验室的同学们可以把这些内容集成到大模型里面去,也希望这个系统能落地转化为成果,真正产生经济效益、社会效应。
“广东省大学生计算机设计大赛成果汇报专题”系列报道
本期采写:南都记者 潘欣
摄影:南都记者 张志韬 冯宙锋
更多报道请看专题:广东省大学生计算机设计大赛成果汇报专题
扫描二维码推送至手机访问。
版权声明:本文由0538资讯网整理发布,内容均来自互联网,如有侵权联系8641340@qq.com删除。