智源人工智能研究院林咏华:建中文语料库让AI说中国话
ChatGPT等国外模型训练语料主要取自英文语料库,来源主要包括维基百科、新闻报道、社交媒体、电子书籍、论坛帖子等,中文比重不足千分之一,英文语料占比超过92.6%。由于中西文化的源头、演进路径不同,导致国外生成式人工智能产品可能对中华文化的包容性和多样性的认识不充分,生成交互信息的文化内涵和精神往往带有局限性和片...
...海外!建议加强AI翻译产学研合作 建议建立网络文学多语种语料库
他表示,相关主管部门可牵头推进AI翻译的产学研合作:一是提供政策和资金支持,激活市场主体的创新创造活力;二是整合资源统一标准,通过建立网络文学多语种语料库,增强AI对多语种的学习和适应能力,保障作品的语言风格、文化内涵和本地化适应性,以此提升整体内容的翻译质量,从而让不同母语的海外用户能通过阅读感受中国...
SCI写好后怎么翻译成英文?写好SCI必备的十大翻译神器
??Linggle是一科研可用来进行英语语法、句子写作的工具,可为学习者提供更准确的英文写作建议,还能够根据词性来推测短句和句子,精准的分析出完整英文句子如何撰写。09NetSpeak??网址:httpnetspeak??NetSpeak是一款提供免费线上单词、词组、语句翻译的工具,其特点是可以在线搜索和比较各种英文词汇、...
北京外国语大学2023年硕士研究生招生简章
朝鲜语、西班牙语、阿拉伯语、泰语、意大利语的口译及笔译专业)为20000元/年,翻译硕士(英语口译专业)为30000元/年;汉语国际教育硕士为18000元/年;金融硕士50000元/年;国际商务硕士30000元/年;会计硕士为35000元/年;新闻与传播硕士为35000元/年;法律硕士为35000元/年;工商管理硕士为64000元/年、工商管理(非全日制)...
人工智能赋能英语翻译教育
在这个过程中,教师应利用人工智能技术对音视频、动画、文字等多媒体教学资料进行搜集,对英语翻译教材中的知识点进行延伸、拓展,做到对英语翻译教学资源的集中化管理。此外,教师还要遵循“以学生为本”的理念,结合学情确立翻译教学资源库框架,在英语翻译学习语料库内匹配、筛选出优质的教学资源,并按照专题的形式凝练出...
LLM 的“母语”是什么?
实验专注于Llama-2系列语言模型(www.e993.com)2024年11月19日。Llama-2系列模型在多语言语料库上进行训练,语料库主要由英语主导(占89.70%)。不过考虑到总体训练数据的大小(2万亿个token),即使是一小部分非英语训练数据,绝对值仍然很大(德语占0.17%=3.4B,中文占0.13%=2.6B)。
仅8B参数,可与GPT-4媲美,上交大团队构建多语言医学大模型
尽管非英语语言只占总数的一小部分,但整体语料库的庞大数量使模型能够在训练期间遇到大量的多语言文本,从而显著增强了它们的多语言能力,从Llama2、Mistral和Llama3之间的比较可以看出,后者的模型表现都比前者好得多。这种通用多语言能力的增强也可以提高医学领域适应后的表现(MMedLMvs.MMedLM2vs.MM...
“中秋节”的英译:直译已超意译
曾泰元表示,直译是逐字翻译,能展现源语(sourcelanguage)的语言思维,是比较偏向“异化“的翻译策略,是文化自信的一种体现,比音译来得缓和,在西方社会更容易进入人心。英语词典的收词、英语语料库的展现,反映的是英语世界对中华文化的接受程度持续上扬,对尊重中国特色所做的反映。(完)...
有道QAnything背后的故事---关于RAG的一点经验分享
第三,我们业务场景有很多混合语言的情况,比如库里面放的是英文的文档,用户用中文去问答。这种跨语种的能力,现有模型支持不好。第四,单纯的embedding在检索排序上天花板比较低,所以我们在embedding的基础上又做了rerank,共享同样的底座,head不一样。为啥我们自己训练的模型会比openai的效果好?我们认为可能是通才和专才...
香港中文大学(深圳) 2020年外语类保送生招生问答 - 特殊类型招生...
专业必修课程包含语法分析、英语文学、语言学、创意写作、语言与媒体、跨文化交际等。专业选修课涵盖商业、企业文传、商务英语、中西方文化、商务法和公司法、法律英语、法律翻译、国际知识产权法、自然语言处理、语料库、计算机编程等。专业采用跨学科、跨专业特点的“英语+X”的模式,毕业生将具备用英语进行高水准...