时间:2022-12-22 05:01:08
引言:易发表网凭借丰富的文秘实践,为您精心挑选了九篇翻译器范例。如需获取更多原创内容,可随时联系我们的客服老师。
关键词:手语翻译;自然语言处理;动画自动生成;知识管理
0 引言
根据第六次全国人口普查我国总人口数以及第二次全国残疾人抽样调查我国残疾人数占全国总人口数的比例和各类残疾人数占残疾人总人数的比例,推算2014年末我国聋人总人数2700万人。中国社会对聋人群体非常关心,彭丽嫒女士曾多次到特殊学校看望聋人儿童,给其带去社会的关爱。然而,由于手语学习比较困难,很少有志愿者懂得手语,可以和聋人进行交流,很大影响了社会服务的效果,也不利于聋人融入社会。
1 现状分析
为了解决手语学习上的困境,国内外的学者进行了一些尝试,如微软亚洲研究院和中科院的Kinect手语翻译系统和东芝公司的手语机器人等。
(1)微软亚洲研究院和中科院的Kinect手语翻译系统:能将手语翻译成口语。(2)日本东芝公司的手语机器人:名Aiko Chihira,拥有逼真的外观,内置Android系统,可以自我介绍、眨眼和微笑,可以模拟出各种手语和人交流。这些软件或系统为手语翻译的研究带来了新的理念和技术,但是并不能真正用于中国聋人群体中,主要原因在于,这些软件或系统,要么是一个真正的机器人,不能推广到普通家庭,要么实现了手语手势的识别,不能直接用于手语学习。
本文在自然手语专家积累的自然手语资源的基础上,综合运用了自然语言处理、知识管理、3D动画建模、移动互联网、Android开发等技术,以用户体验为核心,设计开发了聋人自然手语翻译器。
2 总体设计
自然手语翻译器系统的模块结构如图l所示。
自然手语翻译器系统的主要功能包括:
(1)自然语言处理模块:包括语义理解、纠错、全简称识别等功能。能完成汉语文字到自然手语词汇序列的翻译。
(2)自然手语动画自动生成(也称:手语合成):利用自然手语调序语义规则、自然手语动画生成语义规则等,对资源库手语动画(手语词汇动画)进行最优组合,形成完整的自然手语动画或图片。
(3)手语资源管理子系统,提供了对手语调序语义规则、自然手语动画生成语义规则的管理,同时提供了其他手语专家和聋人建设的手语资源的接入和同步功能。
本系统主要包括以下3个部分如图2所示。
(1)自然手语生成子系统:为手机APP和其他接入的手语展示应用提供自然手语资源的服务。主要功能包括:①自然语言处理;②手语动画自动生成。
(2)自然手语资源管理子系统:对自然手语资源库中的各种资源进行管理。自然手语资源库包括2类资源的管理。①自然手语资源:手语图片库、手语视频库和手语动画库;②自然手语资源服务中所需的其他资源:日常对话、语素、词语短语、同义词、术语语义网、自然手语文法和自然语言文法等。
(3)手语展示客户端:在手语展示客户端(目前主要针对手机APP)展示手语,如动画或图片等。
自然语言处理技术,包括如何进行语义理解、纠错、拼音术语全简称等的识别。首先建设了日常生活中的手语句子、词汇的语义库,该库包含了这些词汇的同义词词典,词汇上下文信息词典等各种词典和手语句子的文法信息;然后进行了综合最大前向和最大后向的分词,并在此基础上进行拼音和纠错;最后进行了基于文法的句子含义自动匹配和生成。
自然手语的3D动画建模技术,包括自然手语的角色模型建设和手语动作、面部表情等的建模、手Key动作优化等。团队首先选择了3Ds Max作为动画建模软件,利用这个软件构建3个人物角色模型,包括:成人男、成人女、小孩。然后进行了动作建模。已经通过手key的方式建了30个动作模型。拟利用国内最先进的动作捕获设备,将日常对话300句中涉及的所有自然手语由手语专家分别进行表演并进行动作捕获,从而生成原始的动画并拍摄手语视频;然后对这些动画进行人工的调优,形成可用的动画。
手语动画自动生成技术:将自然手语词汇序列的每一个自然手语词汇对应的手语动画自动拼接,形成完整的手语动画。利用Unity3D上实现了该功能,可以完成已建好的30个自然手语动作的任意组合。
手语展示技术,包括调用讯飞语音识别、调用自然语言处理、调用手语动画的自动生成和播放手语动画等。首先完成了讯飞语音云提供的语音识别功能的调用。然后实现了自然手语资源服务平台提供的自然语言处理的调用和手语动画自动生成功能的调用。通过这些功能的调用,得到了生成后的自然手语动作的组合。最后,利用Unity3D,将得到的动作序列在自然语言手语角色模型上连续播放。
系统的主要技术指标:(1)语义理解准确度:日常对话300句的语义理解准确率98%,从网上随意获取的语料共i00句的语义理解准确率80%。(2)自然手语资源的标准性:手语资源如手语图片、手语视频、手语动画(手语词汇动画)等必须让聋人能够100%理解。(3)手语动画的聋人可读度:手语词汇动画必须标准,系统翻译出来的手语,聋人能够真正读懂,具体要求是:开放场景下能够读懂70%,限定场景下的能够读懂90%。(4)平台的开放性:聋人或其他手语专家按照我们的标准建设的手语资源库可以无缝接入本平台。
下面以手机APP为例介绍本产品的工作过程。手机APP的工作过程如图3所示。
(1)用户在手机APP上输入语音或文字。(2)语音通过讯飞语音云识别为文字。(3)调用自然语言手语资源服务平台提供自然语言处理功能,对这些自然语言文本进行自然语言处理,将符合自然语言文法的自然语言文本,转变成符合自然手语文法的自然手语词汇序列。返回的结果是Json字符串。(4)手机APP获取到这些自然手语词汇序列后,调用自然手语资源服务平台提供的动画自动生成功能,生成可播放的手语动画。(5)手机APP以动画、图片、视频等形式展示自然手语给用户。
3 系统实现
当用户通过手机APP输入一段语音时,服务器程序会返回用户一串手语序列,这些手语序列在客户端生成3D手语cG动画。使手语更加简单明了地呈现在用户面前。
3.1 三种显示
动画显示、视频显示、序列显示。(1)视频显示:通过视频方式,显示手语动作。(2)序列显示:以一张一张带文字说明的图的方式显示手语动作序列。(3)动画显示:词汇动画自动生成Unity3D可播放的手语动画。
3.2 获得帮助
使用语音或文字,输入“help”或“帮助”呼出系统帮助说明。
1语音识别系统设计的技术依据
近年来国内教育信息化趋势更加明显,英语教学活动建立信息化平台是师生所需,改变了早期英语课堂模式的不足之处。语音识别是计算机翻译软件不可缺少的一部分,如图1,主要针对不同语言进行识别处理,帮助学生快速地理解英语知识内涵。语音识别技术主要包括:特征提取技术、模式匹配技术、模型训练技术等三大技术,也是系统设计需考虑的重点。
1)特征提取技术。一般来说,语音识别系统辅助功能涉及到收录、处理、传递等三个环节,这也是语音识别系统设计的关键所在。计算机语言与自然语言之间存在极大的差异性,如何准确识别两种语言的差异性,这是翻译软件识别时必须解决的问题。特征提取技术是语音识别系统的基本构成,主要负责对英语语言特征进行提取,向翻译器及时提供准确的语言信号,提高计算机翻译工作的准确系数。
2)模式匹配技术。语音识别系统要匹配对应的功能模块,以辅助师生在短时间内翻译出语言含义,避免人工翻译语言失误带来的不便。模式匹配技术采用智能识别器,由翻译器录入语音之后自主化识别、分析,减小了人工翻译语句的难度。例如,计算机软件建立匹配模型,按照英语字、词、句等结构形式,自动选择相配套的翻译模式,执行程序命令即可获得最终的语言结果,给予学生语音识别方面的帮助。
3)模型训练技术。设计语音识别系统是为了实现教育信息化,帮助教师解决英语课堂教学中遇到的翻译难题,加深学生们对英语知识的理解能力。语音识别结束之后,翻译器会自动执行模拟训练操作,为学生创建虚拟化的语音训练平台,这也是软件识别系统比较实用的功能。模拟训练技术采用人机一体化设计思想,把翻译器、语音识别器等组合起来执行训练方式,快速地识别、判断英语发声水平,指导学生调整语音方式。
2英语翻译器语音识别系统设计及应用
英语翻译器是现代化教学必备的操作工具,教师与学生借助翻译器功能可准确地理解英语含义,这对语音识别系统设计提出了更多要求。笔者认为,设计语音识别系统要考虑翻译器具体的工作流程,事先编排一套符合翻译软件工作的方案,如图2,从而提高人机语言转换速率。语音识别系统设计及应用情况:
1)识别模块。语音识别方法主要是模式匹配法,根据不同翻译要求进行匹配处理,实现英语翻译的精准性。一是在训练阶段,用户将词汇表中的每一词依次说一遍,并且将其特征矢量作为模板存入模板库;二是在识别阶段,将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。
2)前端模块。前端处理是指在特征提取之前,先对原始语音进行处理,这是预处理操作的主要作用。语音识别系统常受到外界干扰而降低了翻译的准确性,设计前段处理模块可消除部分噪声和不同说话人带来的影响,使处理后的信号更能反映语音的本质特征。例如,比较常用的前端处理有端点检测和语音增强。
3)声学模块。语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算。声学特征的提取与选择是语音识别的一个重要环节,这一步骤直接关系到翻译器的工作效能,对英语语音识别与学习有很大的影响。因此,声学模块要注重人性化设计,语音设定尽可能符合自然语言特点。
4)搜索模块。英语语音识别中的搜索,就是寻找一个词模型序列以描述输入语音信号,从而得到词解码序列。本次所设计的搜索模块中,其前端是一个语音识别器,识别产生的N-best候选或词候选网格,由语法分析器进行分析获取语义信息,再由对话管理器确定应答信息,由语音合成器输出。由于目前的系统往往词汇量有限,也可以用提取关键词的方法来获取语义信息。
5)执行模块。实际应用中,语言识别系统凭借执行模块完成操作,对英语语言识别方式进行优化择取,以最佳状态完成英语翻译工作。目前,就英语教学中使用情况,听写及、对话系统等是语音识别执行的两种方式,充分展现了翻译器在语言转换方面的应用功能。(1)听写机。大词汇量、非特定人、连续语音识别系统通常称为听写机。其架构就是建立在前述声学模型和语言模型基础上的HMM拓扑结构。训练时对每个基元用前向后向算法获得模型参数,识别时,将基元串接成词,词间加上静音模型并引入语言模型作为词间转移概率,形成循环结构,用Viterbi算法进行解码。(2)对话系统。用于实现人机口语对话的系统称为对话系统,英语翻译器中完成了人机对话、语言转换等工作,全面提升了翻译器操控的性能系数。受目前技术所限,对话系统往往是面向一个狭窄领域、词汇量有限的系统,其题材有旅游查询、订票、数据库检索等,随着语音数据库资源的优化配置,对话系统功能将全面升级。
3翻译器使用注意事项
语音识别系统就是让机器通过识别和理解过程,把语音信号转变为相应的文本或命令的高科技。随着高校教学信息化建设时期到来,计算机软件辅助教学活动是一种先进的模式,彻底改变了传统人工教学模式的不足。翻译软件采用数字化元器件为硬件平台,配合远程互联网建立多元化传输路径,满足了英语翻译数据处理与传输的应用要求。但是,未来英语教学内容越来越复杂,翻译器语音识别系统承载的数据范围更广,学校必须实施更新翻译软件产品,才能进一步提升英语智能化翻译水平。
4结论
关键词: Leap Motion; 手势识别; 手语翻译器; 语音播报; 多语言翻译
中图分类号: TN919.8?34 文献标识码: A 文章编号: 1004?373X(2015)24?0114?04
Design and implementation of sign language interpreter system based on Leap Motion
WENG Shenghui, CHEN Weihao, CHEN Kuanglin
(School of Computing Science, Beijing Institute of Technology (Zhuhai), Zhuhai 519085, China)
Abstract: As a communication bridge between normal people ignorant of the sign language and handicapped persons using the sign language, the sign?language translator has recently become a hot research. However, sign?language interpreters on the market are rare. A high recognition accuracy and portable sign?language translator was achieved by utilizing Leap Motion’s characteristics of high recognition accuracy and small size. The interpreter implemented the sign?language recognition, text translation, voice broadcast, multi?language translation and other functions, as well as can support static sign?language recognition and recognize dynamic sign?language. The experimental result shows that the sign?language interpreter has high recognition accuracy, and can basically realize simple communication between people with disabilities and normal people. Therefore, it has a nice prospect.
Keywords: Leap Motion; gesture recognition; sign language interpreter; voice broadcast; multi?language translation
0 引 言
目前全球大概有1亿聋哑人,而我国就有超过2 000万聋哑人,而且每年还在以2万~3万名的速度递增。听力正常人之间主要采用口语和书面语进行交流,并辅之以一定的体势和表情。在聋人之间的交流中,手语如同正常人的口语一样,起着非常重要的作用。由于正常人懂手语的较少,所以正常人与聋哑人之间的沟通存在较大的障碍。随着社会的发展,聋哑人的地位不断提高,手语翻译工作应用的范围也越来越广泛,也将越来越引起社会各界的关注和重视。我国目前手语翻译职业化道路刚刚起步,各方面还很不完善,缺少专业的手语翻译,尤其分科明确专业程度很高的手语翻译人员。目前手语翻译工作大多是由聋校教师和残疾人工厂的手语翻译人员,这些人不仅缺乏手语翻译技能技巧等方面的专业培训,而且更缺乏某一专业领域的知识储备和训练,如法律、医疗、心理咨询等专业知识,手语翻译的水平极大地限制了聋人群体的发展和生存质量的提高。但是近年来互联网和计算机不断的发展,机器翻译变得随处可见。机器能有丰富的专业知识储备,能在不带任何私人感情和主观意识的情况下准确无漏地进行翻译,解决了手语翻译人员存在的一些翻译缺陷,而且其便携性也是一大优点[1]。
目前手语识别系统主要分为基于数据手套的识别和基于视觉(图像)的手语识别系统[2]。基于数据手套的手语识别系统,是利用数据手套和位置跟踪器测量手势在空间运动轨迹和时序信息[3?4]。这种方法的优点是系统的识别率高,缺点是打手语的人必须穿戴复杂的数据手套和位置跟踪器,并且输入设备比较昂贵。
本文提出的手语翻译器属于基于视觉(图像)的手语识别系统[5]。采用的识别设备是Leap Motion体感控制器Leap Motion是一款μm级3D手动交互设备,只有三寸长,一寸宽,看起来像一个U盘大小[6]。可以追踪到小到0.01 mm的动作,拥有150°的视角,可跟踪一个人10个手指的动作,最大频率为290帧/s,延迟比显示器的刷新率还要低,特别适合用作手语翻译器。
1 系统概述
手语翻译器主要由3大模块组成,分别是手势识别模块,文本显示模块和语音播报模块。总体框架图如图1所示。
图1 系统总体框架图
该手语翻译器主要利用手势识别模块中的Leap Motion体感设备自身的两个红外摄像头进行手势的捕捉,通过识别人手的姿势和动作,将其转换成数据通过数据线发送到主机进行处理,主机将对这些数据进行提取,把提取出来的有用的数据通过算法处理识别出手势动作,翻译成文本信息显示在显示器上,语音模块可以根据需要转换成语音信息,最后还可以通过接入互联网的方式连接云翻译服务平台实现多语言翻译功能。
2 各模块的设计与实现
2.1 手势识别
该模块功能主要由Leap Motion控制器实现,该设备中内置两个红外线摄像头,内部结构如图2所示[6]。
它可捕捉到设备面前的一块半球型区域中的人手和一切棍棒状的工具,虚构出xyz三个轴,生成一个监听者将检测到的物体计算生成相关的数据,如手中各个手指的骨骼点之间的距离、手指的长度、数量、方向等;还可以识别出各种基础手势特征基元,如转圈,平移等,这些数据都将按照时间片的单位封装成1帧使用。由于手语不只有静态的,还有动态手势,所以一个动态手势可以细化成很多帧,每一帧都有其特定的ID与之区别开来,而Leap Motion设备一次捕获一帧,之后可以通过对控制器物体的轮询获得帧,然后将其通过数据线发送到处理机。
图2 Leap Motion内部结构示意图
为了更方便,需要将控制器检测到的数据进行提取,放进一个onframe()函数中。onframe()是核心函数,它实时返回控制器所监听到的一些基本信息并显示,能以数据的形式更直观的对当前手势进行分析。通过controller对象调用onframe()函数,函数将获取最新的运动跟踪帧数据,并把检测目标的信息作为标准输出。
下面的代码是手势识别代码中的一部分,实现的功能有:获取最新的Frame对象,并根据Frame对象检索人手的list列表,然后输出Frame的ID、时间戳、以及帧数据中人手的数量、手指数、工具的数量:
const Frame frame = controller.frame();
std::cout
接下来,函数将检测list列表中的第一只手,并判断左右手:
const Hand hand = *hl;
LRhand = hand.isLeft() ? "Left hand" : "Right hand";
if(LRhand=="Left hand")
ui?>lineEdit?>setText("左手");
else
ui?>lineEdit?>setText("右手");
Hand类的一个对象包含ID、反映人手物理特征的属性、手指对象的list列表,而每个Finger对象又包含ID、反映手指物理特征的属性。
这是基本的信息提取,Leap还提供了基础手势特征基元的识别,首先调用enableGesture()函数,启用了所有的手势识别类型:
controller.enableGesture(Gesture::TYPE_CIRCLE); controller.enableGesture(Gesture::TYPE_KEY_TAP);
controller.enableGesture(Gesture::TYPE_SCREEN_TAP);
controller.enableGesture(Gesture::TYPE_SWIPE);
Leap设备把代表识别动作模型的Gesture对象放到Frame对象中gestures的list列表中。通过对控制器的轮询循环读取gestures的list列表,并把每个手势的信息输出。
在动态手势的识别中,需要将当前帧的手势信息与前面的帧里对应的手势进行比较,可以随时调用一个时间范围内的帧数据,设置一个x值,通过比较并计算当前帧frame()与x帧之前frame(x)中数据变化来识别手势。例如,画圈的手势动作中有个进度属性,此属性用来表示手指已经画圈的次数。这是一个完整的过程,如果想在帧与帧之间获取这个进度,需要减去前一帧中手势进度值。在实际操作中,可以通过手势gesture的ID找到对应的帧。下面的代码就是用了这个方法由前帧导出相应的角(单位:rad):
float sweptAngle = 0;
if (circle.state() != Gesture::STATE_START) {
CircleGesture previousUpdate = CircleGesture(controller.frame(1).gesture(circle.id()));
sweptAngle = (circle.progress()-previousUpdate.progr
ess()) * 2 * PI;
}
2.2 文本显示
文本显示模块主要是将手势手语翻译成文本并显示出来,能更方便聋哑人和正常人之间交流,实现实时交谈。为了使该软件更具实用性,该系统还加入了多语翻译的功能,可连接上云翻译服务平台,将文本显示的容易翻译成多种语言。
多语言翻译功能是利用网上百度公司提供的百度翻译API实现的[7]。百度翻译提供中文、英语、日语、韩语、法语、泰语、德语、俄语、西班牙语、葡萄牙语、阿拉伯语、意大利语、粤语等16个语种,136个语言方向的翻译服务,支持文本翻译和网页翻译两种类型。目前市面上百度翻译API目前有近万个开发者接入,日均访问量近亿次。手机百度App、金山词霸全线产品、灵格斯词霸、华为手机、OPPO手机、敦煌网、百度文库、腾讯SOSO、特快翻译IOS和Android版、百度PC浏览器和手机浏览器、百度输入法等均与百度翻译建立了良好的合作关系。要使用百度翻译API需要先向百度申请开发所需的ApiKey。默认翻译API使用频率为每个IP 1 000次/h,如有需要可向百度开发者中心申请更高频次权限。然后通过HTTP协议发送get翻译请求。
发送的请求中需包含字符编码必须为UTF?8的待翻译内容和作为开发者已授权用户的身份证明的ApiKey,指定要翻译的源语言和目标语言种类(可设置为自动识别)。之后便可以得到相应的响应。
返回的响应是ISO?8859?1编码格式的标准JSON字符串。为了能正常使用需要先将其转换成日常使用的字符编码格式UTF?8格式:
QTextCodec *codec = QTextCodec::codecForName("UTF?8");
然后使用QScriptEngine一层层解析返回的嵌套JSON字符串,除去多余的内容,将需要的翻译完成后的文字内容显示出来:
QString all = codec?>toUnicode(reply?>readAll());
QJsonDocument myjson = QJsonDocument::fromJson(all.toLatin1(),&jsonErr);
QByteArray byte_array = myjson.toJson(QJsonDocument::Compact);
QString json_str(byte_array);
QScriptEngine engine;
QScriptValue sc = engine.evaluate("s=" + json_str);
qDebug()
QScriptValue subsc = sc.property("trans_result");
QScriptValue subsc1 = subsc.property(0);
ui?>textEdit?>setText(subsc1.property("dst").toString());
2.3 语音播报
语音功能是该翻译器的拓展功能。翻译不应该只有翻译显示的功能。为了更加适应聋哑人和正常人之间的交流,引入了语音播报的功能,使其更符合正常人日常之间使用语言而非文字的交流习惯。对此,翻译器除了能发出声音,还加入了不少特色功能。同时支持简体中文和英语,根据使用者的性别,可在男声女声选项中选择对应的声音,而且加入了声音大小调节、语速快慢调整等功能功能,使该翻译器更具人性化和实用性。
语音播报模块使用微软免费提供的的TTS引擎和发音包,同样只需要使用官方提供的API即可。微软SDK提供的SAPI是基于COM封装的,无论是否熟悉COM,只要按部就班的初始化COM获取接口,调用接口完成某个功能,实现语音控制,程序结束时释放资源[8?9]。
模块的核心是ISpVoice接口,其主要功能是speak()函数,该函数的具体实现如下:
bool TextSpeech::speak(QString txt)
{
if(!_binit)
return false;
int result = this?>_voice.dynamicCall("Speak(QString, SpeechVoiceSpeakFlags)", txt ,1).toInt();
_bReading = true;
return result;
}
传入可识别的字符串为参数,执行播报功能,返回一个参数表示是否执行成功除了Speak()外IspVoice接口还有许多成员函数,如通过SetRate(int),SetVolume(int)等语句将具体参数传入,设置音量、音调,Pause(void)和Resume(void)来暂停和回复语音的朗读,几乎可以使输出达到自然语音效果。至于音色,则通过SetVoice(ISpObjectToken *pToken)函数选择预装的语音库,可实现男声女声的切换。不仅如此,这个TTS API功能最强大之处在于能够分析XML标签,输入文本并不需要严格遵守W3C的标准,只要含有XML标签就行。XML标签同样也能做到上述函数中的功能:设置音量、音调、延长、停顿等。再另外,根据XML标注的不同,数字、日期、时间之类的读法有自己的一套规则。例如数字1 024,"1024"念成“一千零二十四”,"1024"将念成“一零二四”。
实际上所有的语言发音都是由基本的音素组成,以中文发音为例,拼音是组成发音的最基本的元素,只要知道汉字的拼音,即使不知道怎么写,也不知道怎么读,都没有关系。对于TTS引擎来说,它不一定认识所有字,但是只要把拼音对应的符号(SYM)给它,它就一定能够读出来,而英语发音则可以用音标表示,例如“h eh ? l ow 1”就是hello这个单词对应的语素。所以与一些用预先录制的声音文件实现发声的应用程序相比,TTS的发声引擎不需要大量的声音文件支持,只有几兆大小,因此可以节省很大的储存空间,缩小了程序的体积。
3 应用前景预测
目前市面上的手语翻译器很少,但是对于这种应用的需求可以从助听器市场中窥知一二。2012年我国助听器国内销量为406.5万个,同比增长21.2%,增幅较2011年增加6.5个百分点。2008―2012年我国助听器销量统计如表1所示[10]。
表1 2008―2012年我国助听器销量统计统计表
以上的数据都显示出我国助听器市场强劲的需求,从而可推断出算出手语翻译器潜在的市场容量,丝毫不必过多地担心市场容量问题。目前市场上助听器价格昂贵,品牌助听器最便宜2 000元起,贵则几万元,据残疾人的就业调查相关数据显示我国聋哑人群体的就业状况不容乐观,虽然市场上有针对听力障碍者推出的各类品牌助听器,但是也相对比较昂贵。这对于有就业困难的特殊人群来说,无疑是难以负担的。而且据调查,大部分助听器的使用者均表示佩戴不适,伴有噪音,轻微头晕等症状。而本文提出的手语翻译器,不仅不会给使用者带来不适,其小巧的机身与低廉的价格更具竞争力。2009―2014年我国助听器销量如图3所示[11]。
图3 2009―2014年我国助听器销量图
4 结 语
本文叙述了基于Leap Motion的手语翻译器的设计与实现。这种翻译器利用了Leap Motion对手部识别的高精度,手势时间片段的细化和其体积小巧的特性,做出了识别度高,便携性好的手语翻译器。日常手语中有很多动态手势,该翻译器不仅支持静态手语的识别,同时也能识别出动态的手语。而且该设备还内置有光感调节,红外线打的摄像头对环境的兼容性很高,即使在强光弱光的情况下均能使用,基本实现了聋哑人与正常人之间简单的交流。相对其他手语翻译设备来说,Leap Motion除了具有精度高、体积小等优点外,价格也比较低廉,具有较好的应用前景。
参考文献
[1] 倪训博,赵德斌,高文,等.非特定人手语数据生成及其有效性检测[J].软件学报,2010,21(5):1153?1168.
[2] 姜华强,潘红.基于关键帧的多级分类手语识别研究[J].计算机应用研究,2010,27(2):491?493.
[3] 顾伟宏,闵昆龙,张晓娜.新型数据手套及其手势识别研究[J].自动化仪表,2011(2):56?58.
[4] 刘明涛,雷勇.基于数据手套的汉语手指字母流识别系统[J].计算机工程,2011,37(22):168?170.
[5] 杨全,彭进业.基于深度图像信息的手语识别算法[J].计算机应用,2013,33(10):2882?2885.
[6] Leap Motion, Inc. Leap Motion controller [EB/OL]. [2015?04?11]. https://.
写作翻译网权威经典散文英汉互译:春天的融化,更多经典散文英汉互译相关信息请访问英文写作翻译网。 Every April I am beset by the same concern-that spring might not occur this year. The landscape looks forsaken, with hills, sky and forest forming a single graymeld, like the wash an artist paints on a canvas before the masterwork. My spirits ebb, as they did during an April snowfall when I first came to Maine 15 years ago. "Just wait," a neithbor counseled. "You"ll wake up one morning and spring will just be here."
Andlo, on May 3 that year I awoke to a green so startling as to be almost electric, as if spring were simply a matter of flipping a switch. Hills, sky and forest revealed their purples, blues and green. Leaves had unfurled, goldfinches had arrived at the feeder and daffodils were fighting their way heavenward.
Then there was the old apple tree. It sits on an undeveloped lot in my neighborhood. It belongs to no one and therefore to everyone. The tree"s dark twisted branches sprawl in unpruned abandon. Each spring it blossoms so profusely that the air becomes saturated with the aroma of apple. When I drive by with my windows rolled down, it gives me the feeling of moving in another element, like a kid on a water slide.
Until last year, I thought I was the only one aware of this tree. And then one day, in a fit of spring madness, I set out with pruner and lopper to remove a few errant branches. No sooner had I arrived under its boughs than neighbors opened their windows and stepped onto their porches. These were people I barely knew and seldom spoke to, but it was as if I had come unbidden into their personal gardens.
My mobile-home neighbor was the first to speak."You"re not cutting it down, are you?" Another neighbor winced as I lopped off a branch. "Don"t kill it, now," he cautioned. Soon half the neighborhood had joined me under the apple arbor. It struck me that I had lived there for five years and only now was learning these people"s names, what they did for a living and how they passed the winter. It was as if the old apple tr
但热度终究会退却,真正回归产业、产品和用户需求时,我们除了那些科幻式的畅想和预测,还需要理解,基于现有的研究进展,人工智能可以给我们带来什么真正有价值的东西,帮助我们解决哪些切实需求。比如说,我们可以得到更好的搜索结果;手机上的语音助手带给我们一种全新的、更加省力的人机交互方式;计算机能够读出、辨别图像中的内容等等。除此之外,人工智能还有一个非常重要的应用领域,也是可以改变全世界交流方式的工具——机器翻译。
1、语言和机器翻译的重要性
机器翻译之所以重要的原因是在于语言对人类的重要性,《圣经·创世记》有个故事,当时人类联合起来兴建希望塔顶通天能传扬己名的巴别塔。为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。科幻作家斯蒂芬森也在著名科幻小说《雪崩》中将语言称为人类大脑的最底层结构,对人类的精神起到了至关重要的作用。LeraBoroditsky认为我们使用的语言在影响着我们对世界的感知,塑造了我们的行为方式和思维模式,Alan Yu称之为“语言塑造世界观”。不同的语言带来了文化的多样,也对每个个人产生了决定性影响。但世界上存在的多种语言给我们带来的不便也是显而易见,它影响了人类最基本的需求——沟通交流。
语言是人类智能的体现,是人类区别于其它生物的基本能力。而人工智能长久以来的目标就是让机器完成那些以前只能靠人类自身才能完成的任务,所以在人工智能的具体应用,如何让机器帮助人类进行语言翻译就显得尤为重要了。
2、机器翻译的产生与发展
机器翻译一直被公认为是人工智能领域最难的课题之一。让机器理解语言,进而实现不同语言之间的翻译,不仅仅是几代科学家们孜孜追求的技术梦想,也寄托着普罗大众实现自由沟通交流的美好愿望。《星际迷航:企业号》里有这样的情景:星舰通讯指挥官佐藤星利用翻译器发明了linguacode矩阵,通过把翻译器集成到星舰人员佩戴的交流别针上或者植入耳朵里,说不同语言的人们就可以进行自由交流。这就是理想态的机器翻译。
机器翻译是人们最早设想的计算机应用领域之一,1949年由Weaver提出。机器翻译技术的发展一直与计算机技术的发展紧密相随。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,随着计算机计算能力的提升和多语言信息的爆发式增长,机器翻译技术逐渐走出象牙塔,在近10年中开始为普通用户提供实时便捷的翻译服务。而近几年,许多科技巨头也公布了和机器翻译相关的产品或服务。
机器翻译在近几年取得突破进展的原因在于两方面:
第一是深度学习(模拟神经网络)技术的出现,比如说百度此次的翻译系统,就是借助计算机模拟的海量神经元仿效人脑“理解语言,生成译文”,同时结合百度已有的统计机器翻译技术,使得机器翻译质量实现了质的飞跃。基于深度学习的翻译系统的核心是一个拥有无数结点(神经元)的深度神经网络。一种语言的句子被向量化之后,在网络中层层传递,转化为计算机可以“理解”的表示形式,再经过多层复杂的传导运算,生成另一种语言的译文。科技巨头在机器翻译方面取得的成绩和他们在自然语言处理、深度学习等领域的布局和积累是分不开的。
第二是海量数据的积累,百度的人工智能专家曾把算法比作火箭的发动机,把数据比作火箭的燃料,这两者缺一不可。还是以百度举例,百度已有的统计翻译系统是用大量文本语料库的统计信息来训练概率模型而建立起来的。这种方法并不需要一个复杂的中间语言概念本体,不需要手工建立源语言和目标语言的语法,也不需要人工标记的数据库。它所需要的只是数据——翻译实例,从这些翻译实例中可以学习得到翻译模型。就像百度副总裁王海峰所说,百度翻译在基于大数据的翻译模型、翻译知识获取、枢轴语言翻译等方面取得了重大技术突破。倪光南院士也把大数据比作“第四种科学范式“,称其为”一个强大的工具”。而数据的积累是搜索巨头得天独厚的优势,也成为了能够在机器翻译方面取得进展的必备条件。
3、机器翻译应用的重要意义
上文提到,对于人工智能,我们现在最为关心的是该项技术的应用场景,能够在哪些方面解决我们的切实需求。对于机器翻译来说,不管是它应用范围的广度,还是其发挥作用的重要性,都具有不可估量的想象空间。值得庆幸的是,我们已经可以从这些科技公司的产品看到机器翻译在未来的广泛应用。百度副总裁王海峰在第十届中国电子信息技术年会互联网机器翻译论坛的演讲中表示,通过在理论、技术、应用上的创新和突破,百度机器翻译已经实现了大规模产业化。通过免费开放API,该项技术成果支持了包括华为、金山等企业的超过7000个第三方应用。
不同语言造成信息交流的障碍。互联网的出现使世界变平,这更有利于信息的流动和共享,但再进一步来说,我们不只要获得信息,还要读懂这些信息,这就对不同语言间的信息交流产生了影响,提高了信息交流成本。而机器翻译的出现就帮我们所有人解决了这个难题,除了书面信息以外,机器翻译和语音识别技术的结合可以为我们在语音通话时提供实时便捷的翻译。
对于每个用户来说,我们在出国旅游时,借助一个APP就能与当地人进行实时的无障碍沟通,通过拍照识别路牌和菜单;浏览国外网站也可以及时翻译成本国语言。从行业来讲,机器翻译的出现对互联网教育、旅游、金融、传媒和外贸等行业都能产生积极影响。
翻译批评是翻译理论的核心问题,是翻译实践的规范。很多翻译学家提出了多种不同的翻译批评的标准。科学技术迅速发展,翻译学也从其他的学科中吸取了新的营养元素,翻译家们对翻译批评的讨论仍有着极高的热情。虽然翻译批评活动很早就有,但是作为学科结构所构成的理论探讨还处于起步阶段。如何以翻译批评来指导翻译教学成为教学改革的新亮点。
一 翻译批评与翻译教学之关系
《中国翻译词典》把翻译批评定义为:从广义上讲,翻译批评即参照一定的标准,对翻译过程及其译作质量与价值进行全面的评价,评价的标准因社会背景而异,评价的目的旨在促使译作最大限度地忠实于原作,并具有良好的社会价值。翻译批评除给予翻译实践以指导外,还充当着纽带的作用。 翻译学在发展当中有三大支柱,分别为翻译理论、翻译批评以及翻译实践。翻译批评是处于翻译理论和实践之间的桥梁,也是中介,它是翻译理论和实践之间不能缺少的一个环节。首先,翻译批评可以根据变化的翻译实践活动把翻译理论通过补充以及修正而不断丰富化;其次,翻译实践在理论方面进行构建需要一个桥梁,也就是翻译批评。翻译学的三大支柱构成了一个良性循环系统,促进了系统内各个元素的整合,推动了翻译学的发展。正如纽马克所论:“翻译批评是翻译理论与实践的一条根本纽带”。此外我们还应该从多角度来讨论翻译批评,可以从宏观或者微观的角度来审视它的本质。翻译批评不仅要包括自己的翻译观等宏观角度的相关内容,还要包含翻译欣赏以及翻译评价等传统方面的相关内容。所以,温秀颖博士所给出的翻译评价的定义比较到位,他认为,翻译批评是以翻译批评的理论作为基础,对各种翻译出来的作品、翻译现象以及翻译的思潮进行评论的认知活动。它是一种翻译接受活动和翻译研究活动,属于高层次的,有自己的独特地位的翻译活动;它不仅具有自律性,同时还具有他律性。我们可以看出,翻译批评所承担的不仅是对译本的评论和评价的基本任务,还要从宏观的层次上来认识翻译的思潮。
许钧认为:“翻译批评是对翻译活动的理性反思与评价,即包括对翻译本质、过程、技巧、手段、作用、影响的总体评析。就翻译批评的目的而言,它并不仅仅在于对具体译作或译法作裁判性的是非判别,更在于对翻译活动何以进行、如何进行加以反思与检讨,进而开拓翻译的可行性,促进翻译活动健康而积极地发展,体现翻译活动具备的各种价值,真正起到翻译活动应有的作用。”将翻译批评与翻译教学相关联,以一种特殊的方式教授翻译理论、指导翻译实践,而不是把两者分开。翻译理论以翻译批评为基础才能有效地指导翻译实践,而对翻译实践的批评又丰富和校正了翻译理论。例如,教师首先让学生翻译原文,然后呈现参考译文,请学生将自己的译作与参考译文和原文进行比较,并讨论译文之差别。通过学生间的讨论和老师的评讲,提高了学生对原文的理解及译文的质量,也实现了翻译批评能力的提高。这种教学方式使翻译批评、理论和实践的三角关系得到了具体的展示。翻译教学是把翻译作为一门专业来进行教学,树立学生正确的翻译观念,培养学生良好的翻译习惯,让学生掌握翻译的技巧,熟悉各种翻译理论以及翻译批评理论,这样学生具有了翻译素养和翻译的能力,成为翻译事业的后备人才。翻译教学已逐渐成为区别于语言学的独立的翻译学科,因此,翻译教学应该树立自己的学科意识,探索翻译教学的最佳的教学模式和教学方法。在翻译教学当中引入翻译批评有很大作用。通过培养学生的翻译批评的能力,并且把学到的翻译批评的理论知识运用于实践活动中,提高学生的鉴赏能力以及文本的评判能力,帮助学生学会对译客观的评判。引入翻译批评还可以为翻译的实践建立参照系,增加对译文的理论和实践维度的质量评判,能够使译者和读者很好地进行沟通,最大化呈现出译作的价值。
二 翻译批评在翻译教学中的启示
翻译批评在翻译教学中起着实践的作用。比如,可以起到识别语篇问题的作用、反思和提高的功能。识别语篇问题的功能主要是树立学生的正确的语篇观念,运用翻译批评的基本理论以及方法,根据翻译所要达到的目的,对译文在问题上进行分析、识别以及做评价。反思提高是学生通过翻译的课内和课外教学的批评实践活动,提高鉴别译文意识、赏析能力和透过现象看本质的反思能力。
原着的作者是价值的主体、是智慧的结晶,原着当中所包含的主体思想以及主体精神反映了当时社会的状况以及作者的意向。在对原着正文进行翻译时,我们需要把握好原着当中所隐含的各种含义,如果想做到这点,我们需要了解原着的背景,在教学过程中,我们需要培养学生先了解作品背景的好习惯。很多学生在翻译时不看原着的作者是谁,不了解文章的出处,不考虑这部作品是如何写成的,而是拿到文章后就开始翻译,利用字典和语法书这些工具来完成翻译的工作,这种做法是不可取的。想要保证翻译的质量,就需要充分认识翻译的课题,宏观把握整篇文章,才能在翻译过程中做到游刃有余。教师在教授翻译课程时需要让学生做到:首先,学生要谨记自己翻译的目的,翻译的目的是满足人们的需要,在翻译的过程中应该让学生认识到自己的身份,在学生下笔之前要明确自己的翻译目的和读者的范围以及翻译成文后的使用功能。学生在翻译过程中只有针对不同的文本来选取合适的翻译策略以及语言的风格,才能使得原着的价值得到充分的发挥。其次,教师要提升学生的审美素养。在翻译过程中每个学生都有自己的审美取向以及审美的兴趣,要成为一名优秀的翻译人员,就需要提升自己的审美品位,提高对文学作品的审美品位,学生可以大量阅读经典的文学作品以及译本等等,潜移默化地形成自己的审美标准。还需要学学语文等相关内容,提升汉语的修养来培养学生的审美能力。最后,学生要能够掌握英汉比较研究方面的内容。不少学生掌握了汉语的意思,可是翻译后的英文意思却不了解,主要是学生的语言基础弱,基本功不扎实,没有掌握好汉语与英语的区别。此外,学生还需要了解英语的文化,同一种事物在不同的文化中会有不同的释义,翻译不好就会引起误会和笑话。
所以,教师要教授给学生英汉语言的差异,从而提升学生的翻译能力。
1.翻译批评提高学生语篇意识
传统的翻译理论把整个翻译活动的重心放在原文上,所以,所有的译文都要保证对原文作者的意图做到忠实。多数的翻译批评也是以原文作为重心。这只是从理论上看起来合理,可是却偏离了实际的轨道。自从翻译工作开始专业化、翻译实践实现了文化转向以后,委托式的翻译就要满足委托人的利益。如果是规模很大、很重要的翻译,翻译人员首先要和委托人进行深入的讨论,以便达成共识,更好地去实现委托人的翻译需求。所以,多样化的翻译需求使得传统的翻译理念受到了严峻的挑战。如果翻译活动只是单一的以原文为中心一定会有失偏颇。翻译的要求、委托者的利益、原文的文体风格等很多原因都会影响翻译的重心。在这些所有的影响因素中,原文的文体会在某种程度上决定翻译的态度以及策略。例如,科技翻译与文学翻译在思维方式、翻译心理、译介过程、文本背景等方面均不同,其他诸如法律翻译、新闻翻译、经贸翻译等又各具特点。不同的文体具有不同的
功能,比如商业和宗教公文多数使用祈使功能;诗歌和谈话多数使用的是表达的功能;新闻和法律多数使用的是描述的功能;小说和散文多数使用的美感的功能。但是,这种划分也不是绝对的,只能说明语篇功能的倾向性。比如某个公司的年报会同时具有描述的功能,报告公司的业绩;表达功能,公司负责任向股东说明情况;祈使功能,建立形象和改变读者的态度等等。有些学者提出翻译理论本身很难体现翻译的语篇观念,最好的方法就是通过翻译教学来穿插一些翻译批评的练习,从而提高语篇意识以及对文体的识别能力。
2.翻译批评提高学生的翻译技巧
通过对译文的评价可以帮助学生逐步养成对译文翻译现象以及翻译思潮的价值判断和对翻译活动的最终成果的鉴别的意识。学生通过不断反思,可以避免成为只是按照翻译技巧来进行翻译。翻译批评不断介入翻译教学活动当中,可以让学生摆脱传统的教学模式和教学方式,在更高层次上对原文进行翻译、总结,提高学生翻译的能力。还是以上面的例文为例,通过对翻译进行批评,得到以下更好的译文:
“Oh, my! My parasol!” with a surge of warmth rising in her bosom, she dashed back to get her parasol from the woman’s hand.
The bus was disappearing in the distance, but she stood there in a trance for quite a while…
综上所述,翻译批评在翻译教学中的文体识别功能以及反思提高的作用有很重要的意义。通过翻译批评,翻译技巧和理论得到更为透彻的阐释,师生之间及译者和读者之间得到更为良好的互动和沟通。它可以树立学生的语篇观念,培养学生对英语原文的赏析能力,根据翻译的目标和原文的文体来灵活运用多种翻译策略,建立翻译实践的有益参照系,提高学生的翻译实践能力,为培养专业化的翻译人员打下了坚实的基础。
参考文献
[1]季羡林、叶水夫、冯亦代。关于恪守译德,提高翻译质量的倡议和呼吁[J].出版发行研究,2002(04)
[2]吕俊。对翻译批评标准的价值学思考[J].上海翻译,2007
[3]宋晓春、秦绪华。论当代翻译批评中的排他性——兼论走向交往实践的翻译批评[J].湖南大学学报(社会科学版),2009(04)
[4]王恩冕。论我国的翻译批评回顾与展望[J].中国翻译,1999
[5]许钧。翻译论[M].武汉:湖北教育出版社,2003
[6]朱健平。关于翻译研究各流派分类的现状分析——兼论中国译论在国际翻译理论体系中的地位[J].外国语学院学报,2004(02)
压抑的气息窜入鼻尖,混着尘埃,眸子竟觉生疼,氤氲雾气,盈了眶。
时光在走,岁月不居。朝夕之间,人物两非。
我们在凉意的初秋遇见,却又在这几点流萤的夏转身,各奔东西。
你是我的站点,而我只是你的过客。匆匆忙忙间,丢了承诺。我还在原地,你已不知去向。带走了,我许下的愿。
几抹余晖下,一个人,守着过去的温暖,迈不开步子。
我还在想你。
想念你的乖张,你的倔强,你和我吵架的样子,点点滴滴,都已刻下痕迹。
你是柒月的烟火,点亮我的一整个天空,然后,消失不见。
你喜欢看海,看浪花拍打海岸,留下一圈又一圈的水痕,白色泡沫泛着轮廓。看日出漫过海平面,洒满光线,水蓝染了绯红。你会笑着,像个孩子奔跑在沙滩上,留下一串脚印。你爱一袭白纱,如海藻般的发铺卷开来。夹着淡淡咸味和鱼腥味的海风总是会吹起你的裙摆,弄乱你的发。你美得像白玉兰,妖娆又恬静。
你走后,我握着回忆,品尝苦茶。
如果,没有如果。
我害怕夜,夜安静得太寂寞,心的缺口会再次决堤。那里,你走了就空了。是我丢了你的好,你在角落的哭泣扯疼了我。我知道,你不会再回来,烟火耀眼灼伤回忆。最后的十二点半,电话里的你的声音,听起来那么陌生。以后,再也没有关系。第一次,眼泪划过脸颊,打碎在地板上,绽放一朵又一朵的嘲笑。原来,我舍不得你离开。
明兰的爸爸是前东亚拳击冠军,在明兰妈妈忌日那天输了比赛,被打到半身不遂。此后明兰怀揣东亚冠军的梦想,照顾行动不便的父亲及年幼的、成天爬上屋顶试图飞翔的弟弟,生活十分艰苦。为了不再给明兰增添负担,父亲选择自杀后被送进医院,明兰挑战现女子亚洲冠军的比赛正在进行。明兰恍若看见父亲站在场外为她加油那一幕,就像小时候她站在场外看父亲,连台词都是一模一样的。
自幼被父母抛弃跟随拾破烂为生的爷爷一起住在漏雨的简陋房屋里的小兄妹,一东和二顺,表情天真可爱,一唱一和的对白,总是叫人忍俊不禁时想要流下眼泪。一东因捡拾滚落到街边的西红柿,被水果店老板殴打,二顺在眼泪rp看见了从天而降的林昌正,于是一人搬了一箱西红柿欢喜地走在回家的路上,却被几个有钱人家的小孩骑着单车追赶,整整两箱西红柿像拳头般一个个砸在兄妹俩身上,这是整部影片中最让人难忘的一幕。
做网络营销,一心想嫁给有钱人摆脱贫困的女孩善珠每天喝着自动售货机里的咖啡,认识了自动售货机的主人,他们的爱情故事很平淡。她每日打扮光鲜照人去上班,回家的路上要脱掉高跟鞋换上布鞋。她担心着自己卑微的身份,在“自动售货机”的告白里选择了拒绝,善珠在回家的路上,丢掉了高跟鞋,坐在路边哭到快要岔气。
黑社会派来一番街督促拆迁之事的林昌正,从嫌弃一番街的贫苦到融入这里的生活和孩子们打成一片,从给老大办事找村民们签合同到替村民们揍老人,他本质上就不是一个坏人,下着雨的夜晚在屋顶帮小兄妹俩堵住漏水的地方,买两箱西红柿给那对小兄妹,把自行车送给明兰,暗中照顾帮助明兰。他不让小孩子们看着他们的家园被毁,叫他们背对着那些“战争”,含着泪水和他们一起唱儿歌,或许奇迹就是在这首催人泪下的儿歌里不经意间产生了。
那场拳赛并没有逆转,小兄妹也没能向欺负他们的人报仇,失去家园而绝望自焚的妇人也终究没有得到拯救。而奇迹终究还是出现了,兄妹俩种的西红柿发芽了,戴着眼镜的小男孩摔伤N次后终上了蓝天,短暂的时空之旅,让他看到一番街奇妙的景观以及希望。小兄妹俩最后回到了妈妈身边,温室里K满r西红柿,当然还是留给爷爷吃的。林昌正走上了正轨成了明兰的经济人兼爱人。善珠与自动售货机还有她的母亲甜蜜地生活在了一起,共同观看明兰的拳赛。
《家庭纷争》
导演:泰勒・派瑞
主演:凯西・贝茨、阿尔弗莱・伍达德、泰勒・派瑞
类型:喜剧
夏洛特・卡特怀特虽为社交名流,却和工人阶级出身的爱丽丝・普拉特是多年的亲密好友。两人的友谊随着年头的增加而愈发深厚。而眼下正要打算一同享受美好的晚年生活的这对好友,却遭遇来自自家后院的种种麻烦,几乎所有的家庭成员都进入了不安混乱的状态之中。为了远离烦恼,夏洛特和爱丽丝决定一同去进行一次长途旅行,而在路上的经历也让她们重新找到了自已,并逐渐找到了让两个家庭重回正轨的办法……
《校园兔女郎》
导演:弗雷德・沃尔夫
主演:安娜・法瑞丝、凯瑟琳・麦菲
类型:喜剧
作为花花公子杂志的兔女郎,谢丽・戴琳通过着自在惬意的生活。每天的工作只是在相机前搔首弄姿,在男人面前投怀送抱就可以混个衣食无忧、光鲜亮丽。好景不长。随着时间的推移,男人对她逐渐失去了兴趣,谢丽开始为姐妹们培训化妆技巧和对付男人的功夫,而与此同时谢丽也从社团中其他姐妹身上学会了如何独立的活出自我,几个女孩就这样为了一个简单而义复杂的目的忙活开了。
《女人们》
导演:戴安・英格利什
主演:梅格・瑞恩、安奈特・贝宁
【关键词】机器翻译;机器翻译方法;比较与优劣势
一、机器翻译方法简介
随着全球化的发展,互联网的日新月异,迅速改变着人们信息传播的方式,极大的刺激了全球机器翻译产业的发展。人们期待着能够帮助人们快速准确的翻译理解另一种语言,获得不同的领域不同国家的知识。人们对机器翻译的接受度也迅速提高。机器翻译(machine translation),又称为自动翻译,是将源语言的句子或全文利用计算机翻译成另一目标语的过程。随着机器翻译研究的发展,越来越多的翻译方法在实际操作中应用,词对词的直译方法,即依赖于字典的翻译方法早已过时。人们希望清楚的了解机器翻译能做些什么,如何能让机器翻译最大效能的帮助译者进行翻译。越来越多的机器翻译方法的出现值得我们去研究与实践体会,如基于规则(rule-based MT),基于知识(Knowledge-based MT),基于实例(Example-based MT),基于模式(Pattern-based MT)和统计法(Statistical MT)。本文将挑选基于实例(EBMT), 基于规则(RBMT), 和统计法 (SMT)进行论述与比较。
(一)基于规则的机器翻译
基于规则的翻译方法涉及到源语言(SL)和目标语(TL)的词汇与语法以及中间部分双方词汇与语法的转换。基于规则的翻译方法的核心就是规则(语法)和语料库。对于源语言的词汇与语法分析和接收之后,进行目标语接受,最后再通过深层次的目标语语法词汇的整合输出目标语。传输过程运用映射规则(mapping rules)和国际语过程(interlingua process)来转换源语言和目标语言抽象的和深层次的文本。
(二)基于实例的翻译方法
基于实例的翻译方法最重要的是匹配和提取,和输入源语言文本相匹配并从目标语中提取相等的部分。整个翻译过程是通过对比算法从目标语中找到对应的翻译。也就是通过把源语言分解成语言片段,将片段进一步匹配,从目标语言库中找出最相像的句子成为翻译的最终结果。可以看出,基于实例的翻译方法是通过使用匹配的方法来进行翻译的。这种翻译方法需要目标语语料库足够强大并充满了能与源语言和目标语相匹配或能够对齐(aligned)的句子或短语。
(三)统计法机器翻译
统计法机器翻译首先语言模块对源语言的语言单字进行解码,接下来用语言模块组合成目标语的的句子,然后对目标语的句子进行选择与过滤。由于是基于统计的方法,能够相对齐的数据库至关重要。对输入语言的分割为其后的源语言的合成和目标语片段的输出起着重要作用。统计数据通常依赖于可用的语料库,计算通常是基于概率,所以也叫做基于概率的机器翻译(Probability-based MT)
二、机器翻译方法之比较
(一)基于规则和基于实例的机器翻译之比较
语言之间转换时若结构大不相同,或者涉及到搭配和习语等,语言语法或语法树就不起作用。基于实例的方法可以弥补基于规则的方法从而产生良好质量的翻译。基于实例的方法可以从已翻译的语料库中找到相匹配的翻译。因此,基于实例的方法是对齐,匹配和提取,而基于规则的方法则是规则(语法),转换和生成,重点是将源语言的结构通过规则(语法)转化成目标语。当涉及复杂的结构和微妙的词汇,基于规则的方法就行不通了,无法生成高质量的翻译。从理论上讲,基于实例的译文来自数据库导出,而基于规则的方法由规则导出。
(二)基于实例的机器翻译和统计法机器翻译之比较
首先二者都需要双语文本,即原文及其译文。统计法机器翻译主要是基于统计概率―词频。基于实例的机器翻译基于片段的匹配,提取和组合,其核心是与源语言相对应的目标语片段的匹配和提取。核心过程是源语言与目标语的对齐与提取。统计法机器翻译的核心则是通过统计的方法来从语料库中对齐。输入的部分分解成源语言并转化成通过概率计算出的目标语词组。统计法机器翻译利用“翻译模型”和“语言模型”,基于实例的机器翻译则是利用语言数据库。
三、结论
表1 资源需求比较
从表中我们可以看到,基于规则的方法需要规则,词汇语法语义分析和分析器等。但是没有包含双语数据库,相对齐的数据,平行语料库。基于实例的机器翻译和统计法机器翻译都包含双语数据库,相对齐的数据,平行语料库,看起来统计法是隶属于基于实例的机器翻译的一个方法。当综合运用这两种方法时,一定会降低错误率并提供翻译质量。
表2 翻译过程之比较
统计法运用的是单词和词组对应的频率统计。基于规则的方法核心在于语法和句法的分析。基于实例的方法则是寻找相对应的语言并提取。所以得方法如何能取其优点,共同运用。当句法行不通时,可以尝试语料库的使用,当二者都行不通时,可以统计词汇频率来继续翻译。随着这些方法的各自缺陷逐步为人们所认知,人们在集中探索系统中集成多种机器翻译的实现方法,每种方法构成的翻译模块作为一个引擎,多个引擎协同配合,共同完成翻译工作,使机器翻译能够发挥最大效能。
参考文献:
[1] Arturo Trujillo. (1999). Translation Engines: Techniques for Machine Translation. London: Springer-Verlag.