10万的记忆库如何发挥出百万的作用
>> 欢迎您 登陆翻译论坛 您的身份:游客 | 登陆 | 注册 | 帮助信息 | 精华

统一坊在线翻译网
中国译典
     译典论坛

>>>>译典添词*****译典评注*****公告求译*****博客文章*****会员排行榜 <<<

中国在线翻译网>>译典论坛>>翻译词汇
您是本主题第 12812 个阅读者 == 回贴倒排
作者
主题: 10万的记忆库如何发挥出百万的作用 [翻译词汇]
雪贝


贡勋等级:男爵
经验值:61
技术等级:童生
技术分:0
共发贴3篇
共回贴0篇
发表于 2010/6/12 9:43:00
EBMT技术的应用,充分发挥记忆库的作用。
  目前的CAT软件主要采用的是TM技术,即翻译记忆(Translation Memory, TM),TM技术要求两句的相似度要非常高;对两句间不同的部分,一般只能自动替换其中的非译元素,如数字等。所以,记忆翻译质量的如何,很大程度上取决记忆库的规模,记忆库越大、覆盖面越广,翻译的质量自然越高。但是,记忆库不是无中生有的,而是靠译员苦心积累下来的;如何提高记忆库的利用率,让10万的记忆库发挥出百万的作用?这对我们译员来说相当有价值!
  而EBMT(Example-Based Machine Translation基于实例的机器翻译)技术可以比较好的解决这一问题,例如:首先告诉计算机:“Herry is a student, he was born in 2000. 亨利是一个学生,他出生于2000年。”这一句的翻译。接下来的这一句“Anna is a teacher, she was born in 1976.”计算机能通过对上一句的类比和学习,自动替换翻译出“安娜是一个教师,她出生于1976年。”此外,对两句看起来相差较多的句子,也可通过对其中一句学习,自动替换翻译出另外一句,如对“America is a scientic country. ”和“He is a student.”这两句,表面看起来相似度不高,但雪人同样可以通过对:“America is a scientic country. 美国是一个科学技术发达的国家。”这一句的学习,准确翻译出“He is a student. 他是一个学生。”这些在一般的CAT软件中由于匹配度不高,会认为是两句完全不同的句子,那么记忆库中的那句就不会对当前句有贡献。下面我们来看看记忆库是如何充分发挥作用的?

(1). 一般的替换翻译:
  当我们翻译了第一句:“Herry is a student, he was born in 2000. 亨利是一个学生,他出生于2000年。”后,接着翻译第二句:“Anna is a teacher, she was born in 1976.”这时在屏幕下方的“句子比较”窗口中,已经根据对第一句学习给出了“安娜是一个教师,她出生于1976年。”的正确译文,点击旁边的 “引用译文”按钮,即可将译文引用到上面。上方显示的是当前句,下方显示的是记忆库的参考例句,并以不同字体颜色、底色、下划线等区分当前句子与记忆库的匹配句子的不同之处和两句之间的对应关系,以便译员查找两句中各词的对应关系。对于这两句,一般的CAT软件只能替换翻译数字,即将2000替换成 1976,不能将Herry替换Anna、student 替换teacher、he替换she。
[imghttp://www.gcys.cn/image/fanyi/new/j1.jpg[/img]
 
(2). 增词替换翻译:
  当翻译第三句:“Davis is a part-time teacher, he was born in 1982.”这一句与刚才的那两句相比,结构仍旧相似,但增加了一个词“part-time”,软件在合适的位置插入了“兼职的”这几个字,如下图:“戴维斯是一个兼职的教师,他出生于1982年。”而且对增词部分“part-time、兼职的”以绿色字体显示,以提醒译员注意该部分是否翻译正确。
[imghttp://www.gcys.cn/image/fanyi/new/j2.jpg[/img]
 
(3). 减词替换翻译:
  当翻译“We were watching a movie.”这一句时,软件自动从记忆库中搜索出相似度只有0.57的“They were watching a beautiful sunset. 他们在观看美丽的日落。”这一句,并以它做模板正确将“We were watching a movie.”翻译为“我们在观看电影。”而且对减词部分“beautiful 美丽的 ”以绿色字体显示,以提醒译员注意该部分是否翻译正确,如下图。这两句看似并不怎么相似,但一样可以很好地利用记忆库的“They were watching a beautiful  sunset.”来为当前句服务,这在一般的CAT软件中是做不到的。
[imghttp://www.gcys.cn/image/fanyi/new/j3.jpg[/img]
 
(4). 方便的短语提取
  当我们翻译“Haven’t you heard that I’ll married soon?”这一句时,从记忆库中找到了相似度0.79的“Haven’t you heard that he’ll get a promotion soon? 你难道没听说他不久就要晋升了吗?”这一句做参考,但软件并没有将“晋升”自动替换为“结婚”二字,刚才那些相似度只有0.57的都可以正确替换,为什么这个相似度更高的却不能正确替换呢?如下图“句子对比”窗口下方的从记忆库搜索出的那句,其原文、译文都加了红色的下滑线,这是因为在我们的词典中找不到 “Haven’t  难道没”、“ get a promotion 晋升”这样对应的解释,并以红色的下滑线显示出来以示注意。这时我们先用鼠标在原文中划选“Haven’t you heard that”,然后在译文中划选“你难道没听说”这几个字,刚才所划选的内容自动出现在屏幕右侧的“新词定义区”中,点击“新词定义”按钮或按【Ctrl+D】即可添加新词,如下图。同理,我们也在原文划选“get a promotion”和在译文划选“晋升”二字,并将它添加到项目词典中。通过这个方法:可以很方便地从记忆库中提取短语,而且一旦提取,立即出现在屏幕取词窗口中,以后点击即可输入;通过提取短语,不但可以不断丰富自己的词典,还可很好地提高自动替换翻译的准确性。可谓一举多得!
[imghttp://www.gcys.cn/image/fanyi/new/j4.jpg[/img]

    这样做了新词定义后,当鼠标再次指向该短语时,会弹出屏幕取词窗口,点击即可输入。开始软件未能正确将“晋升”自动替换为“结婚”二字是因为我们词典中缺少其相应的词汇,现在我们已经将这两个短语添加到了词典中,我们点击旁边的 “重新翻译”按钮,则发现此时译文已经正确了。如下图:
[imghttp://www.gcys.cn/image/fanyi/new/j5.jpg[/img]
 
(5). 创建高质量的模板型记忆库
    记忆库大型固然好,但如果无法达到时,如何让有限的记忆库资源以一当十用?这不是没有可能,关键是创建高质量的“模板型记忆库”和“记忆库型的用户词典 ”,让记忆库中的译文能在词典中找到对应的解释,这样的记忆库就相当强大,对一些看似不怎么相似例句,也能根据它来翻译出正确的译文。例如:当翻译“He is a student.”这一句时,从记忆库中搜索出许多相似度只有0.5的例句做参考,我们点击哪一句,软件就以这一句为模板来翻译当前句子,如果觉得不合适,可以点击其他句子看看以哪一句为模板翻译的效果最好。一般来说,当然是匹配度越高翻译的效果越好了。这里我们选择记忆库的“America is a scientic country.  美国是一个科学技术发达的国家”这句为模板来翻译“He is a student.”,发现其译文是:“他是一个科学技术发达的学生”,显然不正确。软件对“America和country都能正确替换了,但对 “scientic”这个词没有很好地处理,为什么呢?而且我们可以从下图中看到:“scientic”和“科学技术发达的”这两个地方都加了红色的下滑线,这表示词典中“scientic”并没有这个意思。
[imghttp://www.gcys.cn/image/fanyi/new/j6.jpg[/img]

  这时我们划选“scientic”和“科学技术发达的”这几个字,然后将它添加到词典后,发现红色的下滑线的已经消失了,表示记忆库中该句译文的所有词语在词典中都有其相应的解释。现在我们点击旁边的 “重新翻译”按钮,则发现“He is a student.”已经正确翻译为“他是一个学生”了。如下图:
[imghttp://www.gcys.cn/image/fanyi/new/j7.jpg[/img]

  一般情况下如果自动翻译译文不正确,是因为记忆库例句中有些词语的译文在词典中没有其对应的解释,而这部分又正好出现在两句中不同地方,如果词典的没有的解释出现在两句中相同的地方,还是可以正确替换翻译的。
  由此看来,创建一个模板型的高质量的记忆库和配套的词典,对提高自动替换翻译的准确性是相当有帮助的;对在词典中无法找到的译文解释,在记忆库的例句中会以红色的下滑线显示,这时如果能对它划选进行新词定义后,那么它对以后的翻译帮助是相当大的。这个高质量的记忆库和配套词典需要译员日积月累,慢慢改进!如果做好,那么你的记忆库就能以一当十用了。

雪人CAT绿色免费版下载地址http://www.gcys.cn/fy_xiazai.html

QQ交流群:65383573,群中有句库和96万的词典下载!








你还没有个性签名,点击此处可以添加。
发贴者的其它发贴: 上一篇: 翻译时,如何高效率地利用在线词典和在线自动翻译


||给作者留言

您要搜索的字符
搜索范围



Sponsored by Totra Technology