欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > DOCX文档下载  

    2023机器翻译技术及产业应用蓝皮书.docx

    • 资源ID:1386065       资源大小:85.53KB        全文页数:37页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2023机器翻译技术及产业应用蓝皮书.docx

    卷首语Ol科技赋能翻译事业发展是时代大势1.1 翻译是国际传播能力建设的重要环节1.2 翻译技术助力新时代国家翻译能力建设02机器翻译技术不断发展创新2.1 机器翻译技术的发展历程2.2 机器翻译技术的发展态势2.3 机器翻译技术面临的挑战和发展方向03产业级机器翻译系统及产品形式3.1技术特征3.2系统架构3.3产品形式04机器翻译产业现状及应用案例4.1 产业应用现状及趋势4.2 产业应用案例4.2.1赋能企业全球化发展4.2.2助力各行各业数字化建设4.2.3助力中华文化“走出去”4.2.4赋能跨语言国际交流4.2.5加持硬件产品开启智慧生活05机器翻译发展趋势和建议5.1 趋势展望5.2 发展建议结束语参考文献科技赋能翻译事业发展是时代大势1.1翻译是国际传播能力建设的重要环节党的十八大以来,党中央高度重视国际传播能力建设和对外话语体系建设,作出一系列重大决策部署。2021年5月31日,习近平总书记在中央政治局第三十次集体学习时强调,要下大气力加强国际传播能力建设,全面提升国际传播效能,形成同我国综合国力和国际地位相匹配的国际话语权,为我国改革发展稳定营造有利外部舆论环境,为推动构建人类命运共同体作出积极贡献。面对中华民族伟大复兴的战略全局和世界百年未有之大变局,习近平总书记在党的二十大报告中再次对增强中华文明传播力影响力,加强国际传播能力建设,推动中华文化更好走向世界提出明确要求。这些重要论述,为我国新时代翻译事业发展提供了根本遵循。习近平总书记多次在国际国内重要场合讲述翻译故事,充分肯定翻译工作对中国走向世界、世界读懂中国的积极贡献。在2019年9月致中国外文局成立70周年贺信和2022年8月给外文出版社外国专家回信中,习近平总书记强调翻译对人类文明进步产生的积极作用和促进人类文明交流的重要意义,提出用融通中外的语言、优秀的翻译作品讲好中国故事,更好向世界介绍新时代的中国,为中国走向世界、世界读懂中国作出新的更大的贡献的明确要求。中国外文局局长、中国翻译协会会长杜占元口指出,国家翻译能力作为一个国家在翻译领域整体能力的集中体现,涵盖了翻译人才队伍建设、对外话语体系构建、重点语种建设布局、翻译技术研发和应用、重大翻译项目组织协调、翻译行业管理与服务等各领域,涵盖了政府、市场和行业等各方面,是国家语言能力的重要体现,是通过翻译行为建构对外话语、开展文化传播、塑造国家形象的综合能力,是文化软实力和国际传播能力的重要组成部分,也是发挥大国作用、提升国际话语权的重要保障。加强国家翻译能力建设,对增强中国国际传播能力、推动中国与世界在更广领域'更深层次的开放交融、互联互通,为实现第二个百年奋斗目标、建设社会主义现代化强国有重要意义。当前,我国翻译事业正在经历由“翻译世界”向“翻译中国”、由“翻译大国”向“翻译强国”的历史性转变,翻译工作在推动中国与世界开放交融'互联互通方面发挥着战略支撑作用,在加快构建中国话语和中国叙事体系、提升国际传播效能方面发挥着基础性作用,在促进中华文明和世界多元文明的交流融通、互学互鉴方面发挥着桥梁纽带作用。推动翻译高质量发展,对满足人民对外交往需要、建设社会主义文化强国具有重要意义。1.2翻译技术助力新时代国家翻译能力建设当前,以人工智能为引领的新一轮科技革命和产业变革正在加速推进,也深刻改变着国际传播的舆论生态、媒体格局、传播方式。把握人工智能等新技术新机遇,加强国际传播能力和国家翻译能力建设,是事关国家发展的重大战略任务。习近平总书记强调,加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源。要探索将人工智能运用在新闻采集、生产、分发、接收、反馈中,全面提高舆论引导能力。这为我们大力推动人工智能等新技术在国际传播领域的应用、加快融合发展指明了新的方向,提供了新的遵循。面对新形势,唯有进一步提升技术创新能力,优化技术创新制度环境,深化技术创新协同协作,方能把握先机。习近平总书记指出:“科技创新是核心,抓住了科技创新就抓住了牵动发展全局的牛鼻子。”站在新的历史节点,面对百年未有之大变局和我国“十四五”时期以及更长时期的发展需求,创新无疑是源头活水,更是“第一动力”。近年来,科学技术特别是翻译技术的发展,对翻译行业起着巨大的推动作用,同时也开辟了新的“赛道”。在许多大规模翻译项目中,只有充分依靠新技术的帮助,才能更好提升翻译质量和效率。借助技术手段,多语种内容的批量翻译输出成为现实,远程翻译、线上同传等翻译新业态在快速发展。人才培养单位愈发重视人才的跨学科、跨行业发展以及对机器辅助翻译技能的训练,开始探索利用现代技术为翻译专业教育赋能,翻译语料库、国别区域数据库等核心数字基础设施被更多地应用于翻译教学。当前,以ChatGPT、文心一言(ERNIEBot)为代表的新一代预训练模型技术在语言理解与生成,特别是低资源、长篇章以及多模态的场景应用中表现出强大能力和发展潜力,与人的互动性和反馈学习能力不断增强。随着新技术的迅猛发展,技术赋能翻译的模式势必还将向数字化、智能化的更高水平迈进。翻译行业各方应积极探索和推进人工智能'大数据、虚拟现实等技术在习近平新时代中国特色社会主义思想对外宣介、对外翻译出版中的应用,将新时代中国正在发生的故事多维度'真实全面地介绍给世界,不断增进国际社会对中国特色社会主义道路'理论、制度'文化的理解和认同。机器翻译技术不断发展创新机器翻译是人工智能的一个重要领域。在电子计算机诞生的第二年,即1947年,美国洛克菲勒基金会自然科学部主任韦弗(W.Weaver)和英国工程师布斯(A.DBooih)就提出了利用计算机自动翻译人类语言的设想。机器翻译既有着丰富的科研内涵,又有着广泛的应用场景,是帮助人们跨越语言鸿沟的核心技术。在七十多年的发展历程中,伴随着技术革新、社会发展等诸多因素,机器翻译技术一直在寻求变革和突破。2.1机器翻译技术的发展历程1954年,美国乔治敦大学在国际商业机器公司(IBM)协同下,用IBM-701计算机首次完成了俄英机器翻译试验21,展示了机器翻译设想的可行性,拉开了机器翻译走进现实的序幕。我国在机器翻译领域的研究几乎也同时起步。1956年,全国科学发展工作规划中就设立了名为“机器翻译、自然语言翻译规则的建设和自然语言的数学理论”的研究课题,并在1957年由中国科学院语言研究所和计算技术研究所合作开展了俄汉机器翻译的研究13。机器翻译发展历程中涌现出三种具有代表性的方法:基于规则的机器翻译、统计机器翻译,以及现阶段主流的神经网络机器翻译。基于规则的机器窗译:从机器翻译设想提出到二十世纪八十年代,基于规则的机器翻译方法处于主导。其基本思想是由语言专家总结不同语言间的翻译规律并撰写翻译规则,计算机工程师将这些规则转换为机器语言,实现自动翻译。基于规则的机器翻译打开了机器翻译从设想走向实践的大H,在机器翻译发展初期立下了汗马功劳。不过此方法存在撰写规则成本高、系统开发周期长'翻译质量低、难以快速进行多语言扩展等问题,制约了其规模化应用。统计机器翻译:上世纪八十年代末、九十年代初,受到统计方法在语音识别任务上取得的进展的鼓舞,国际商业机器公司研究人员提出了统计机器翻译方法。统计机器翻译利用噪声信道模型对翻译过程进行建模,基于大规模语料自动训练模型参数,突破了基于规则的方法依靠人工构建翻译规则的限制,大幅降低了系统开发成本、提升了翻译质量。这一时期,互联网的迅速普及使获得大规模训练数据成为可能,统计机器翻译逐渐进入发展的快车道。2006年,谷歌(GOOgIe)推出了基于统计方法的互联网机器翻译系统。在此后近10年的时间里,统计机器翻译是机器翻译舞台的主角。但由于统计机器翻译较难处理译文全局调序等问题,致使译文流畅度受限,逐渐遇到发展瓶颈。神经网络机器翻译:近年来,深度学习的迅速发展推动了机器翻译的技术变革,神经网络机器翻译成为现阶段主流的机器翻译方法。神经网络机器翻译通过建立深度神经网络模拟人类的翻译过程,将源语言映射(编码)到高维向量空间,并通过神经网络转换(解码)为目标语言。相比统计机器翻译,神经网络机器翻译在语言表示、语义理解、译文生成等方面均有显著进步,翻译质量明显提升。2015年百度发布了全球首个互联网神经网络机器翻译系统,标志着神经网络机器翻译系统开始登上大规模产业应用的舞台。2016年谷歌也将其统计机器翻译系统升级为神经网络机器翻译系统,随后国内外行业巨头公司纷纷研发并推出神经网络机器翻译系统。我国一直高度重视机器翻译的研究和应用,在机器翻译发展初期就开展相关技术研究,在新的发展机遇期,国务院发布的新一代人工智能发展规划以及工信部发布的促进新一代人工智能产业发展三年行动计划(2018-2020年)均将机器翻译列为重要发展方向。随着我国综合国力的增强,中文在世界话语体系占据越来越重要的地位。研究以中文为核心的大规模、高质量机器翻译系统,服务于新时期国际传播能力和国家翻译能力建设,是新时代赋予我们的重要任务。2.2机器翻译技术的发展态势经过70多年的发展,机器翻译在翻译质量、系统性能、实用性'规模化应用等方面均取得了较大飞跃。机器翻译呈现百花齐放、满园春色的蓬勃发展新态势,其产业应用也呈现一派欣欣向荣的景象。目前机器翻译技术有以下五大发展趋势:1 .深度学习技术不断发展,神经网络机器翻译成为主流近年来,机器翻译的快速进步主要得益于深度学习技术的发展。神经网络机器翻译在2014年左右萌芽,并迅速茁壮成长。借助深度神经网络模型在语义表示及理解方面的能力,以及大数据、大算力的支持,神经网络机器翻译的译文质量大幅跃升,迅速实现了对统计机器翻译的超越和替换,将机器翻译带入新的发展阶段。2 .研发门槛降低,机器翻译进入规模化应用阶段受技术进步、市场需求增多等多重因素影响,国内外相关行业公司热情高涨,均投入大量资金和精力研发大规模翻译系统。国外有谷歌、微软(MiCrOSOfI)、Mela(原FaCebOOk)等,国内有百度、阿里巴巴、腾讯、有道、讯飞等。值得一提的是,国内公司研发的机器翻译系统在技术上具有很强的竞争力,多次在国际机器翻译系统评测中拔得头筹。先进技术通过开源开放平台共享,使得产业各方都可以使用已有的技术成果,研发新的技术。在深度学习平台方面,国外有Meta的Pytorch谷歌的TenSOrflow,国内有百度的飞桨(PaddlePackne)等,都集成了最新的机器翻译技术。无论是研究人员还是开发者,都无需从头做起,只要有数据,就可以迅速利用开源平台搭建一个机器翻译系统,大幅降低了机器翻译研发门槛。得益于此,机器翻译创业公司也如雨后春笋般涌现。3 .机器翻译与行业紧密结合,得到广泛应用和认可随着国际化进程的加速,传统行业对高效率、高质量的机器翻译技术的需求愈加旺盛。不同领域对行业术语和文体风格等需求各不相同,对译文的要求也不尽相同。神经网络机器翻译可以在大规模数据预训练基础上,结合行业知识和领域数据,进彳亍优化精调,进一步提升垂直领域的翻译质量。尤其在新闻资讯、学术文献、金融财经、生物医药、信息技术等领域,经过优化训练的机器翻译系统译文的准确度可以达到90%以上。高质量机器翻译也受到了语言服务公司和专业译员的青睐。根据2023中国翻译及语言服务行业发展报告4,90席的语言服务企业愿意在未来投入更多资金用以提升企业在机器翻译相关领域的技术实力,91.3%的语言服务需求方受访者认为使用翻译技术能够提高翻译质量。九成受访者认同翻译技术的使用能够降低翻译成本(94.7%)及提高效率(95%)。4 .多语言翻译市场需求巨大,相关研究和应用发展迅速当今世界多种文明和文化相互融合,人类社会丰富多样的语言交相辉映,“开放共享、合作共赢”越来越成为各国共识,成为推动社会进步的重要理念。实现高效的多语言翻译,搭建不同语言顺畅交流的桥梁,是时代和社会发展的迫切需求。随着“一带一路”倡议的深化发展,截至2023年1月,已有151个国家和32个国际组织与中国签署共建“一带一路”合作文件1.其中涉及的语言超过110种。多语言翻译面临语言资源分布不均衡、非通用语种语言资源匮乏、语言差异大、部署成本高等挑战,如何克服这些困难备受瞩目,成为国内外前沿课题研究的焦点。近年来,学术界、产业界围绕数据增强、多语言统一建模、多语言预训练等内容开展了诸多研究,促进了多语言翻译技术的发展。得益于此,国内外主流的机器翻译系统均支持多语言翻译。截至2023年初,百度、讯飞、小牛、谷歌、微软等国内外机器翻译系统均支持上百种语言互译。5 .翻译模式由文本翻译扩展到跨模态翻译,应用场景愈加丰富随着智能设备的普及,翻译需求和场景日趋多样。人工智能技术在图像、语音等领域的进步为跨模态翻译提供了技术支持。如结合图像技术的拍照翻译和增强现实翻译,被广泛用于票据翻译、外语学习等场景;结合语音技术的语音翻译广泛用于日常会话、会议演讲等场景,提升了沟通效率。2018年,麻省理工科技评论(MnTeChnologyRevieW)将“语音翻译”列为全球十大技术突破,百度和谷歌(GOogIe)被列为“关键参与者(KeyPlayer)"n在2020年国际计算语言学学会(AC1.)年会上,百度'谷歌、脸书、清华大学、宾夕法尼亚大学(UniVerSityOfPennSylVania)联合举办了首届机器同传研讨会2.极大地促进了相关技术发展。近年来,机器同传在翻译质量、同传时延等方面取得显著进步,机器同传被越来越广泛地应用于国际会议。2https:/autosimtrans.github.io/2020/#2.3机器翻译技术面临的挑战和发展方向与人们对于翻译的理想化追求相比,机器翻译技术仍然任重道远,需要在以下五方面加强研究,持续突破。1 .机器翻译译文质仍需持续提升随着机器翻译技术的发展以及大规模应用,人们对于翻译质量有更高的要求和期待。目前机器翻译系统主要的翻译方式是以句子作为翻译单元,较少考虑上下文以及篇章信息。此外,在翻译文学性较强的内容时,通常需要结合背景知识'历史文化知识等,甚至要进行“二次创作”,而目前的机器翻译技术还无法做到。加强对机器翻译结合上下文信息、融合丰富知识等方面能力的训练将有助于进一步提升机器翻译译文质量。2 .机器福译鲁棒性和容错能力需进一步加强机器翻译对于输入内容比较敏感,有时在表意不变的情况下稍微改动原文,就可能导致整个译文发生很大变化。此外,训练数据中的噪声、领域分布对于机器翻译模型都会产生较大影响。面对复杂丰富的应用场景,提升机器翻译的鲁棒性和容错能力,将有助于其在实际应用中发挥更大作用。3 .低资源语言机器翻译能力仍有待突破神经网络机器翻译技术的本质是数据驱动型技术,依赖于大量高质量的训练数据。然而,在多语言翻译、垂直领域翻译中常常面临数据稀缺的问题。尽管技术方已提出多种解决方案并应用于实际系统,但受到资源和现有技术限制,低资源语言机器翻译仍难以满足高质量译文需求。探索面向低资源语言、少样本量的神经网络机器翻译学习机制,是机器翻译的发展方向之一。4 .多模态融合的机器翻译技术需进一步探索近年来,机器翻译技术与语音、视觉处理技术的结合取得了较大进步,诸如机器同传、图片翻译等技术已被广泛应用。此外,多模态统一建模也取得较大进展。多模态的深度融合将有助于进一步提升译文质量、拓展应用场景。例如,在同声传译中,演讲者的幻灯片材料、语音语调、肢体语言等多模态信息都有助于提升机器同传质量。2023年,中国外文局翻译院智能翻译实验室发布T语言服务行业的机器翻译使用情况调研问卷,根据问卷收集到的反馈数据,目前语音服务行业对多模态融合的机器翻译技术有较大需求。如图1所示,超过70%的受访者表示有图片转文字功能的需求,超过65$的受访者有语音转写功能的需求。您希望能增加哪些附加功能搭配机器翻译使用?5 .机器福译相关标准建设需继续加强在质量评价体系、人机协作模式、语料库建设等方面,需结合技术发展形势和市场需求,加快相关标准的研制工作。如对机器翻译质量的评价,目前仍主要基于B1.EU(BilingUalEvaluationUnderStUdy)等自动评价指标以及面向通用场景的流利度、准确度等人工评价指标。在具体应用时,应结合具体需求制定合适的评价流程和评价标准。此外,也应针对系统性能、硬件要求等制定相应规范。在人机协作模式方面,同样歪需制定相关行业标准,明确人与机器的关系、在翻译过程中发挥的不同作用以及承担的不同责任,以此更好促进新技术应用发展,推动形成健康的行业生态。根据语言服务行业的机器翻译使用情况调研问卷收集到的反馈数据,如图2、图3所示,仅有不到30%的受访企业表示会区分轻度和深度译后编辑,并制定不同规范标准。在日常进行“机器翻译+译后编辑”的人机结合服务模式时,语言服务提供方会面临客户对译后编辑程度的要求不明确、译后编辑的工作量难以预估及如何定价等问题。如果不能直接采用,机徜翻译结果需要进行编辑,是否会针对修改程度区分轻度译后编辑和深度译后编辑,并就此制定不同的规范标准?会区分两种译后编辑,且有不同规范标准会区分两种译后编辑,但没有制定不同标准不会区分两种译后编辑,也没有制定不同标准图2:轻度和深度译后辑区分图3:相比人工译任务,译后编任务存在的问产业级机器翻译系统及产品形式3.1技术特征随着机器翻译技术的不断进步,应用场景越来越丰富,应用规模持续扩大。概括来说,成熟的产业级机器翻译系统通常具有如下技术特征:1 .多领域、多语言、跨模态的全面翻译能力产业级机器翻译系统需要将机器翻译与计算机视觉、语音处理等人工智能技术深度融合,满足不同行业、不同场景下复杂'丰富、灵活的应用需求。2 .基于飞轮效应的持续进化能力产业级机器翻译系统的底层模型和上层应用可以产生飞轮效应,即上层丰富的应用场景为底层模型提供反馈信息,底层模型基于反馈持续进化,为上层应用提供更好的支持。3 .核心技术自主研发能力深度学习时代,从芯片'深度学习框架到模型,越多的核心模块拥有自研能力,机器翻译系统就越能及时、深入地响应业务需求。产业级机器翻译系统通常拥有较强的核心技术自研能力,可以在翻译效果、翻译性能、产品交互、系统架构、资源部署等多维度进行端到端迭代优化,更好地为企业降本增效。4 .全生命周期安全保障能力产业级机器翻译系统需构建全流程安全保障体系,确保数据、模型、系统安全可靠。5 .2系统架构一个成熟的产业级机器翻译系统除了对翻译结果(译文质量)有所要求,还应在翻译过程中充分考虑到系统性能、硬件要求、系统部署、数据安全等诸多因素。图4展示了一个面向产业的机器翻译系统的流程图,主要包含以下四部分:1 .模型训练收集大规模训练数据(包括双语平行语料、单语语料、词典等),并根据应用需求基于深度学习平台训练机器翻译模型,如多语言翻译模型'领域自适应模型、多模态翻译模型等。2 .部署发布部署发布包含两个子模块,质量评价与系统部署。在机器翻译模型训练完成后,需要进行翻译质量评价,评估新版本模型的翻译质量是否优于上一版本、是否满足用户需求、是否能解决某一类问题等。如达到要求,则进行系统部署,否则还需进一步迭代优化模型,直至满足各项要求。在系统部署阶段,需考虑多种因素。一个成熟的机器翻译系统除了能够高效完成翻译任务外,还应具备动态调度能力,即根据流量变化实时调整各个机器的负载,最大程度提升机器利用率、响应海量翻译需求;如出现流量异常、重要内容翻译错误等突发情况,应能够及时检测并预警。同时,系统还应具备实时干预能力,即在不影响系统服务的前提下,及时采取系统动态扩容、错误译文实时修正等措施。3 .产品及应用机器翻译最终通过丰富的产品形态为用户提供服务,常见的机器翻译产品有面向用户的网页端翻译服务、桌面客户端翻译应用、移动端翻译应用、翻译插件(包括但不限于浏览器翻译插件、计算机辅助翻译软件插件、办公软件翻译插件等)、智能翻译硬件,以及面向开发者二次开发集成的应用程序接口(API)、软件开发工具包(SDK)等。这些产品集成了文本翻译、文档翻译以及融合了语音、图像处理的多模态翻译等丰富功能,极大地满足了人们生产生活中的翻译需求。4 .数据及系统安全安全策略是人工智能系统的一个重要组成部分,机器翻译也不例外。一个实用的机器翻译系统应该构建全生命周期的安全策略,包括认证和授权机制、数据隔离、数据加密、监控审计等方面,保障在存储和传输过程中语料、模型和用户相关信息的数据安全。此外,在具体应用场景中,可根据需求灵活设计和开发安全策略,例如针对不同硬件和系统环境进行模型适配调整,针对高时空开销的场景进行模型压缩等。22产品及应用部署发布模型训练应用产品形态翻译模型训练平台训防翻S又本翻译文档翻译语音翻译图像/视频翻译PCAPP小程序插件翻译硬件APVSDK高效解码动态调度检测预警实时干预人工评价自动评价模型对比评价神经网络机翻译核心模型多语言翻译领域自适应多模态翻译数据及系统安全策略深度学习平台双语数据单语数据词典数据图4:产业级机器翻译系统流程图5 .3产品形式机器翻译产品形态与技术发展、市场需求密不可分。目前市场上的机器翻译产品形态丰富,并且还不断有新的产品面世。1按照模态来分主要有文本翻译'语音翻译、图像翻译等。近年来,结合了计算机视觉、语音处理和机器翻译技术的手语翻译取得较大进展,手语数字人在新闻播报、体育赛事等场景中崭露头角,为听障群体提供了无障碍信息服务。2 .按照栽体来分主要有电脑端(翻译引擎、翻译插件等)、移动端(应用程序、小程序等)以及多种形式的智能硬件产品,如翻译机、翻译耳机'翻译笔等,满足用户丰富多样的需求。3 .按照系统部署来分主要有在线部署和离线部署。在线部署将机器翻译系统部署在服务器端,通过互联网为用户提供翻译服务,是一种常用的部署方式。离线部署需要考虑硬件性能和使用场景,通常用于网络信号不好或者由于保密要求而不能接入互联网的场景。此外,出于数据和系统安全考虑,企业内部也可以采用私有化部署方式,将机器翻译模型部署在局域网内。除上述可直接用于翻译服务的产品外,很多场景下用户希望基于已有翻译技术对自身产品进行二次开发,例如调用机器翻译引擎将企业网站翻译为多语言版本。机器翻译技术开放平台正好可以满足这类需求,通过对机器翻译模型进彳舁寸装,提供接口(API)和开发工具包(SDK)等,只需几十行代码即可便捷接入机器翻译能力。机器翻译产业现状及应用案例尽管机器翻译的产品形态丰富多样,应用场景也非常广泛,但总体而言,机器翻译的用途可总结为以下三类:T信息获取。即从国外获取多语言信息并加以分析和使用,如专利信息检索、新闻热点分析、多语言舆情分析等。从翻译方向来看,这类用途的翻译方向主要是外文到中文的翻译。二是信息传播。即将所要表达的内容翻译为其他语言并进行传播。随着中国综合国力的提升,世界需要聆听中国声音。在加强国际传播能力和国家翻译能力建设方面,机器翻译将发挥重要作用。这类用途的翻译方向与第一类正相反,主要是中文到外文的翻译。三是跨语言交流。跨语言交流侧重信息传递的双向性,既获取信息,又输出信息。典型的场景有跨境旅游、多语言客服、即时通讯、会议同传等。这类用途的翻译方向是双向、甚至多语言互译。无论在何种场景下,用户对机器翻译的要求都是一致的:第一,翻译质要高;第二,翻译速度要快;第三,翻译成本要低。相比于人工翻译,机器翻译在速度和成本方面具有天然优势。随着机器翻译技术的进步,尤其是神经网络机器翻译的出现,机器翻译译文质量显著提升。很多场景下机器翻译译文质量已经可以满足用户需求,机器翻译也被越来越广泛地接受和应用。4 .1产业应用现状及趋势机器翻译的产业应用呈现高质量、多语言、跨模态、定制化等需求特点。据全球市场洞察公司(GlobalMarketInSightS)发布的调研报告,2021年机器翻译市场规模超过8亿美元,预计2022到2030年的年复合增长率将超过30炉。机器翻译已经融入人们的生产生活,进入了大规模应用阶段,主要表现在以下五方面:1 .机器翻译普及应用,意及全球机器翻译诞生之初主要服务于国防军事等需求。由于其技术难度大、系统部署复杂,普通用户难以使用机器翻译服务。随着机器翻译技术的发展以及互联网的普及,机器翻译逐渐开始作为互联网的一项应用为用户提供服务。近年来,神经网络机器翻译技术的发展一方面使得机器翻译质量有了显著提升,另一方面降低了机器翻译技术门槛。国内外各大互联网公司均把机器翻译作为必备服务,通过丰富多样的产品形式,服务全球用户。2 .机器翻译助力传统行业国际化进程传统行业在国际化进程中,需要跨越语言鸿沟。如果单纯依靠人工翻译,会面临成本高、周期长及人才短缺等问题。机器翻译在效率和成本上拥有人工翻译无可比拟的优势,同时译文质量又可以结合实际场景进行针对性优化,以满足企业需求。在此情况下,机器翻译成为企业国际化进程中的重要一环。3 .机器翻译在语言服务行业得到广泛应用翻译是语言服务行业的重要一环,传统语言服务行业以人工翻译为主,提供高质量翻译服务。随着机器翻译技术的进步,机器翻译在语言服务行业中的应用越来越普遍。据中国翻译协会20233中国翻译及语言服务行业发展报告,“机器翻译+译后编辑”的人机结合服务模式将到市场普遍认同,%.1%的翻译及语言服务企业认为采用该模式提高了效率。如图5、图6所示,根据语言服务行业的机器翻译使用情况调研问卷收集到的反愦数据,超过80«的受访者认为未来五年内机器翻译会普及到更多领域,超过85%的受访者认为“机器翻译+译后编辑”的工作模式会在更大范围内应用。您是否同意未来五年内机器翻译会普及到更多领域?12.46%28.33%543Q%-非常同意比较同意不同意也不反对不太同意非常不同意图5:未来五年内机翻译农域拓展预期您是否认同“机器翻译+译后编辑”的工作模式在未来将得到更大范围的应用?2.55%1.42%38.81%48.16%非常同意比较同意不同意也不反对不太同意非常不同意ffl6:“机1翻译+译后编辑”模式推广期4 .机器翻译成为译员的得力助手和有效补充中国翻译协会发布的2022中国翻译人才发展报告回显示,我国翻译人才队伍以45岁以下的中青年为主,呈现年轻化、高知化、梯队化等特征。译员力量丰富强劲,但是专业化翻译人才和非通用语种翻译人才依然匮乏。机器翻译成为译员的得力助手和有效补充,一方面体现在年轻译员对于机器翻译技术的接受程度更高,可以将机器翻译作为工作助手;另一方面体现在机器翻译在专业领域和多语言翻译方面存在一定优势,可以对专业译员群体起到一定补充作用。5 .机器翻译拓宽了翻译市场一方面,原本因人工翻译成本高而被压抑的需求,被价格低廉甚至免费的机器翻译激发并满足。例如在跨境电商行业中,一些中小企业原本可能因为高昂的翻译成本放弃海外市场,但借助机器翻译就可以低成本地将业务快速扩展到多个国家和地区。另一方面,机器翻译技术的应用促使翻译行业催生出更多如译后编辑,机翻质量控制等新职业。4.2产业应用案例本节将结合实际案例,介绍机器翻译在企业智能化升级、行业数字化建设、国际传播、国际会议及赛事、智能硬件等场景中的应用。4. 2.1赋能企业全球化发展2023年是共建“一带一路”倡议提出十周年。十年来,中国与“一带一路”沿线国家间的贸易、投资规模快速增长,对多语言机器翻译的需求十分旺盛。1 .多语言大数据翻译,海外市场经营“知己知彼”在国际化不断加速的进程中,企业需实时收集和分析多语言信息,及时感知国际环境的瞬息万变,辅助企业决策。使用机器翻译技术对海量多语言数据进行高效翻译是现实之需。国内某世界500强企业,业务覆盖全球100余个国家和地区,拥有庞大的海外用户群体。在海外市场经营方面,海外媒体报道和电商渠道的消费者评论等信息是公司在海外市场经营决策的重要依据。智能商情分析系统可以自动收集并分析全球相关媒体报道和消费者评论等信息,为企业研判和决策提供依据。一般而言,上述信息内容涵盖近百种语言,每月翻译需求超百亿词。面对如此海量的翻译任务,该公司选择使用机器翻译技术,以多语言统一机器翻译模型为基础,使用业务场景数据进行优化训练,以满足多语言高效翻译需求,实现年翻译千亿词以上,大幅缩短商情数据处理时间,极大提升决策效率。2 .企业级智能IB译平台,服务中石化全球化战略中国石油化工集团有限公司(下文简称“中石化”)业务遍及全球70个国家和地区,拥有数万名海外员工,其境外财务票据核销、重大项目审计、合规备案等工作有庞大的翻译需求。2022年,中石化启动企业智能翻译平台建设,平台涵盖22个语言翻译方向,具备文本、文档、图片等多种翻译能力,可以支持中石化多场景、多语种'多模态的翻译需求。其中,法律系统机器翻译功能可以对平台上的外文法律业务表单进行智能翻译,形成中文法律业务数据库,方便国内员工快速便捷了解国外相关法律规定,为中石化合规管理效率的提升和转型提供了高水平的法律信息服务支撑和保障。审计系统机器翻译功能可以对外文审计成果文档、审计过程文档及各种审计资料进行智能翻译,有效支撑境外审计工作,提升审计工作效率。财务系统机器翻译功能可以支撑境外财务共享平台的多语种转换,提升多语言海外票据的审核效率。3 .“T一路”信息务,支撑企业出海高质决策“新华丝路”是由新华社打造的面向政府、企业、机构的综合信息服务平台,该平台为共建“一带一路”参与各方提供线上全流程咨询和线下一站式务。在国内企业加速布局海外业务,加入“一带一路”寻求更大业务发展的趋势下,共建“一带一路”相关国家产业、法律法规与知识产权方面的信息研究与咨询需求快速增加。针对高实效性、高准确率的多语言翻译需求,“新华丝路”引入智能翻译平台。一方面利用机器翻译辅助人工译员,提高翻译效率,另一方面可以管理翻译过程中产生的语料,并通过智能翻译平台的术语干预、记忆库干预等功能让机器翻译模型结果更优,形成了“越用越好用”的良性循环。机器翻译技术解决了业务中的翻译供需不足、数据无法高效利用等问题,为“走出去”和“引进来”提供了高质量信息服务。4. 2.2助力各行各业数字化建设2023年,中共中央、国务院印发了数字中国建设整体布局规划,规划指出,建设数字中国是数字时代推进中国式现代化的重要引擎,是构筑国家竞争新优势的有力支撑。机器翻译与行业紧密结合,在降低翻译成本、提升翻译效率'提高翻译质量等方面成效显著。1 .译后编辑新模式,帮助翻译行业降本增效随着全球化不断向纵深发展,翻译行业逐渐成为重要的服务产业之一。如何提高翻译质量和效率,已成为翻译行业亟需解决的问题。译马网为成都优译信息技术股份有限公司旗下的AI辅助翻译(AIAT)生产平台,是翻译行业的数字智能基建平台。在行业发展新形势下,译马网积极拥抱技术,在翻译任务中引入“Al+人工”的译后编辑模式,为翻译行业带来了更智能化的解决方案。译马网运用神经网络机器翻译技术,快速分析和理解原文本的语言特征和上下文,获取更精准的翻译结果,并利用机器翻译模型的自我学习和优化能力,持续进化,使翻译准确性和效率不断提高。相比于传统翻译方式,“A1+人工”的译后编辑模式日均翻译字数可提升近4倍,翻译成本降低34乳为客户带来更大的业务价值和经济效益。2 .专业级垂直领域机器翻译,助力科研人员实现外文资料母语阅读机器翻译技术在法律、医学、金融等专业领域的应用持续深入,但不同行业对专业术语和句式的译法、甚至译文风格都有特定要求。面对这一现实需求,基于行业数据和专业知识深度学习的垂直领域机器翻译已成为专业领域翻译工作提质增效的首选解决方案。北京迈迪培尔信息技术有限公司(下文简称“迈迪培尔”)开发了人工智能翻译、文献数据库、药学数据库、生物医学绘图工具和论文写作工具等十多个具备行业先进水平的大型数据库和科研工具,为广大科研人员开展研究工作提供了极大便利。其中,人工智能翻译系统尤其受到科研人员欢迎。由于生物医药翻译对于翻译引擎的精准度要求很高,同时存在大量专业化术语和特定描述句式,因此通用的翻译引擎很难满足需求。为获得更好的翻译效果,满足用户专业化的需求,迈迪培尔与机器翻译技术公司开展深度技术合作,对生物医药领域的机器翻译模型进行了全面优化。评测结果显示,在完成两轮定制化训练后,其译文质量优于通用模型18机且针对医药行业的术语和句式特点有了明显改进,用户满意度显著提高。4. 2.3助力中华文化“走出去”随着我国综合国力的不断提升,世界越来越多地聆听到中国声音。面对复杂多变的国际环境,我们愈发需要高质量、高效率地向世界讲好中国故事。机器翻译技术为传播好中国声音提供了有力的技术支持。1 .视频翻译,加速中国优质内容出海如今,短视频在全球发展势头正猛,短短几年内吸引了世界各地众多视频创作者。为了吸引更多的观众,有不少国内创作者尝试在内容上推陈出新,也有部分创作者将目光投向了潜力巨大的海外市场。然而,由于语言的限制,对于大部分短视频创作者来说,将相同的内容翻译成多种外语成本巨大且周期过长。传统视频翻译主要有以下问题:优质译员储备难:在翻译过程中由于不了解对象国的文化知识、风俗习惯等,译文无法全面地表达原文内容;(2)人员配置不稳定:无法随时匹配大量的多语种视频翻译人员;(3)人工译审成本高:多次审校需要多次协调人员,经济成本较高。针对以上问题,人人译视界作为国内先进的专注于视频字幕翻译的公司,提供“A1+人工校对”的视频翻译模式。人人译视界通过利用定制化视频领域机器翻译模型,省去了脚本翻译等二次制作过程,为视频创作者节约了时间和金钱成本,让创作者能有更多时间进行新视频的内容构思,有助于产出更多高质量的视频。2022年,人人译视界助力国内知名视频弹幕网站Bilibili的海外达人项目,完成三百多个频道的译制工作,并同时运营近二十个海外社交媒体账号,其中不乏拥有百万粉丝的Bilibili个人视频博主,以及央视电视剧官方多语种频道等,取得良好传播效果。2 .机器翻译为网络文学出海插上“翅膀”近年来,网络文学逐渐成为全球青年了解中国的新窗口,网络文学海外市场增长迅速。2020网络文学出海发展白皮书10显示,从网络文学出海整体规模来看,截至2019年,我国向海外输出网络文学作品100Oo余部,覆盖40余个“一带一路”沿线国家和地区。从出海模式来看,翻译出海占比达72%。中国作家协会发布的2021中国网络文学蓝皮书显示,2021年网络文学海外市场规模突破30亿元,海外用户达1.45亿人。大量的网络文学作品与缓慢的翻译速度构成了巨大矛盾,虽然国内网络文学发展欣欣向荣,但国外读者的庞大需求却无法得到满足。近年来,机器翻译解决了传统网文翻译效率低、成本高的问题,为网络文学出海插上了“翅膀”。国内网络文学平台纷纷借助机器翻译技术,加速中国网络文学海夕滩广。晋江文学城、米读小说APP对机器翻译技术的应用对于翻译行业极具借鉴意义。晋江文学城是中国著名的原创文学网站之一,在近20

    注意事项

    本文(2023机器翻译技术及产业应用蓝皮书.docx)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开