智源人工智能研究院林咏华:建中文语料库让AI说中国话
我国语料库的建设在20世纪70年代开始起步,目前已建成了多个汉语语料库,如几所高校和科研院所独立建设的规模不等的语料库,但是由于这些语料库在建设之初或多或少存在临时性、局部性、短期性、功能单一性等限制,缺乏长远考虑和全局性设计,未能全面反映国家通用语使用的现状。需要指出的问题主要有以下几点。其一,语料库...
学英语,用好这10种书
7.《牛津学术英语词典》(英汉双语版):课业优选,进学阶梯,让你在学术场合真正把英语用起来。《牛津学术英语词典》为学习型词典的创新之作,聚焦英语学术文章,提供全程深入指导。词典中收录的单词,是依托含8500万词的“牛津学术英语语料库”(OxfordCorpusofAcademicEnglish)、通过科学分析精选得出,普遍见于各门学...
雅思词汇书正版购买指南:避免购买盗版的实用建议
雅思王听力语料库这本教材收集了大量的雅思听力原文和相关练习题,涵盖了各个话题和难度级别,帮助考生提高听力理解能力。雅思真题7天速成胜经这本教材提供了一套系统的备考计划和方法,包含大量的真题练习和答案解析,帮助考生提高考试技巧和应对能力。九分达人雅思阅读这本教材详细讲解了雅思阅读部分的各种题型和解题...
英语系举办“调查问卷设计和语料库技术及应用”主题学术沙龙
本网保定讯:为营造良好的学术氛围,帮助师生提升学术素养,更好地掌握外语研究方法,英语系联合学校“一带一路”能源语言服务研究中心于4月16日在教十一楼D106举办“调查问卷设计和语料库技术及应用”主题学术沙龙活动(总第66、67期),活动同步线上进行。英语系行政负责人及23级研究生到场聆听。继“一带一路”能源...
仅8B参数,可与GPT-4媲美,上交大团队构建多语言医学大模型
一个大规模多语言医学语料库在最新的研究中,上海交通大学的研究团队开发了一个大规模多语言医学语料库(MMedC),收集了六种主要语言(英语、中文、日语、法语、俄语和西班牙语)中超过255亿个与医学相关的token。图示:MMedC上的统计结果。(来源:论文)...
北京外国语大学2023年硕士研究生招生简章
应用型(专业学位)硕士研究生:翻译硕士(包括英语笔译、俄语、法语、德语、日语、朝鲜语、西班牙语、阿拉伯语、泰语、意大利语的口译及笔译专业)为20000元/年,翻译硕士(英语口译专业)为30000元/年;汉语国际教育硕士为18000元/年;金融硕士50000元/年;国际商务硕士30000元/年;会计硕士为35000元/年;新闻与传播硕士为35000...
雅思写作语料库:广告的利弊
雅思写作语料库:广告的利弊如果大家想进入国外大学,那么基本上都需要准备语言成绩,下面是由小编为大家整理的“雅思写作语料库:广告的利弊”,仅供参考,欢迎大家阅读本文。广告类:Ifaproductisgoodoritmeetspeoplesneeds,peoplewillbuyit,soadvertisingisunnecessaryandnomorethanan...
外语学院与医学部协同推进医学外语课程和多语种医学语料库建设
新闻网讯7月1日上午,医学部副部长任贺(主持工作)、副部长李冰带领科研管理与国际合作、本科教学与留学生管理、附属医院科研与外事工作部负责人到访外语学院,与外语学院党政领导及有关教师专题讨论医学西班牙语课程和医学语料库建设方案。会议由外语学院院长卞建华主持,
10月语言学联合书单|书写还有未来吗
每章均由该领域的国际领军专家所著,内容包括民族志、话语分析、Q方法、关联分析等,为进行课题规划、数据收集与数据分析提供详细指导和经验总结。《基于语料库的英汉中动结构对比研究》付岩著,上海外语教育出版社本书以语料库为依托,以构式语法和原型范畴理论为指导探讨了中动语义及其在英汉两种语言中的实现,包括...
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库,命名为MMedC。该数据集包含255亿tokens,其内容来自于四个来源:1.通过启发式算法,从广泛的多语言语料库中(例如CommonCrawl)筛选相关内容。2.搜集全球各地的电子版医疗教科书,并使用光学字符识别(OCR)技术转化为文...