AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
原本英文的广告语是「Yours.Truly.」。但到了中文这里,则有种「明明每个字都认识,可连在一起却怎么也读不懂了」的感觉。如果从翻译的角度来看,原因主要在于语言之间存在的文化鸿沟。与专业术语不同的是,蕴含丰富文化寓意的词语,字面翻译对于有文化背景的人来说,难以理解。论文地址:httpsarxiv/htm...
百度宣布同传翻译新突破 外媒称将在机器翻译领域挑战谷歌
为了降低时延提升翻译质量,人类译员通常对演讲内容进行合理预测,百度开发人员从人类译员身上获得启示,研发了“wait-kwords”模型,可以根据历史信息,直接预测翻译中目标语言词汇。该模型在翻译质量和翻译延迟之间做出了很好的平衡,用户可根据实际需求设定延迟时间(例如延迟1(k=1)词或延迟5(k=5)词)。比如,法语和西班...
季羡林口述6:德国大学校园里有个阶段没有男生,因为都当兵去了
英文之外就是俄文。俄文不能成为系,(它属于)斯拉夫语系。斯拉夫语,不叫南斯拉夫语,没有(南斯拉夫语)这个说法,叫塞尔维亚·克罗地亚语。当时教俄文的叫冯·格林,他始终没有成为教授,所以一肚子牢骚。德国大学里一个系只有一个教授,不像美国、中国,一个系一大堆教授。布劳恩教授是教斯拉夫语言的。(我)经常到他家去...
阿里Qwen2技术报告翻译:最强开源大模型是如何训练的?
后训练数据主要由两部分组成:演示数据D={(xi,yi)}和偏好数据P={(xi,y+i,y??i)},其中xi代表指令,yi代表满意的响应,y+i和y??i是xi的两个响应,y+i是比y??i更受偏好的选择。集合D用于SFT,而P用于RLHF。构建训练数据涉及一个两步过程:协作数据注释和自动化数据合成。首先,我们从大规模...
一把斧头一串英文,朝鲜澳大利亚断交25年,才发现是翻译错误
事后,朝方在案发现场捡到一把斧子,这是冲突发生的时候,部分韩国士兵带到现场进行斗殴的凶器。在斧子上,朝鲜人发现了英文“madeinAustria”——奥地利制造,因为英文奥地利(Austria)与澳大利亚(Australia)很像,朝鲜人翻译错了,把奥地利翻译成澳大利亚,将这把斧子当作澳大利亚制造的斧子,认为澳大利亚正在为韩国提供武器。
LLM 的“母语”是什么?
「对于以英语为母语的人来说,这可能会令人惊讶,但对于其他人来说,这种倾向性是可见的,只不过有时多,有时少(www.e993.com)2024年10月17日。」「有时我会想LLM为什么要这样回答,然后我意识到这个答案在英语中更有意义。」「这在诗歌中更是显而易见的。LLM写诗很漂亮,但通常没有押韵——如果你把它翻译成英语,就押韵了。」...
清华成果落地,领跑国产AI大模型!
“中国要有自己的预训练模型框架”成为一种共识张鹏参加中国计算机大会GPT、BERT、T5都是西方科学家提出的底层技术沿着已有路径走无疑最省力然而“核心的技术是求不来也买不来的”作为清华人要为国家、民族和社会做点事情想要掌握前沿领域的先进技术...
考研英语阅读训练:甲流和乙流有什么区别?
中文翻译:流行性感冒,通常称为流感,是一种由病毒引起的高度传染性的呼吸道疾病。有两种主要类型:甲型和乙型。H1N1和H3N2是甲型流感的亚型,而乙型流感有其独特的变异。流感的传播主要通过感染者咳嗽或打喷嚏时的呼吸道飞沫而发生。及时识别症状对早期检测至关重要,包括发热、咳嗽和全身酸痛。
陈斐评林语堂《英文汉译法讲义》|语言、心理与艺术视域的作家译论
《讲义》是近代译学史上的经典之作,被翻译界广泛征引并收入多种论文集,然所据多为《论翻译》,无人留意其文本演变及前后差异。其实,《讲义》最初应是受商务邀约所撰,初名“英文汉译法讲义”,与内容十分吻合。后改名“论翻译(代序)”,收入吴曙天选编的论文集《翻译论》(光华书局1933年2月初版)。不久...
六层楼先生:去女性健康科普的“上游”看看 | 对话自媒体人
原创深度营深度训练营用试纸测量润滑剂的PH值,观察黄瓜片在有无润滑剂环境中的水分流失,测试滑块在有无润滑剂斜坡上的滑行速度,穿着实验服、戴着橡胶手套的六层楼先生(以下简称“六层楼”)正通过实验讲解挑选润滑剂的标准:酸性、保湿、润滑。在这则名为的科普视频里,六层楼运用熟悉的开场白介绍自己——“Hel...