东西问|陈芳:“City不City啊”?中文是如何与英文走到一起的?
City是“城市”的意思,词性是名词。但在“City不City”的句式中,其被当作形容词使用,可以翻译为“城市化的”,延伸为“具有城市特征的”“时髦的”,甚至可以表达“让人震惊的”等多种含义。外国博主借鉴了英语语言中部分名词兼具形容词的词性特征,套入中文句式,打造了中西合璧的“City不City”。无论是中国网友还...
为啥全世界只有中国人有看字幕的习惯?|翻译|电影|方言|台词|港片|...
02-中文和英文的词性不同中文源于象形文属于“表意文字”主要靠“识图”来进行辨识所以它音节非常少有很多同音字不信的话请欣赏《季姬击鸡记》如果不加字幕看的时候理解可能就会有偏差一些词语联系上下文还能理解意思但要是“名字”不看字幕就完全不知道了而像英文、韩文等等“表音文字”主要...
超级重要!15条关于高考日语作文体裁错误的分析!
(八)各种词性前后的接续是否正确例:美味しく料理。×美味しい料理。√きれいだ人。×きれいな人。√(九)确认时态是否正确例:昨日、私がバナナを食べます。×昨日、私がバナナを食べした。√(十)确认「ある??いる」使用是否准确例:窓の外から猫の声が聞こえました。カーテンをか...
中文分词最佳记录刷新了,两大模型分别解决中文分词及词性标注问题...
词性标注是在已经切分好的文本中,给每一个词标注其所属的词类,例如动词、名词、代词、形容词。词性标注对后续的句子理解有重要的作用。在词性标注中,歧义仍然是个老大难的问题。例如,对于“他要向全班同学报告书上的内容”中,“报告书”的正确的切分和标注应为“报告_VV/书_N”。但由于“报告书”本身也是一...
创新工场两篇论文入选ACL2020 中文分词和词性标注新模型性能创新高
宋彦介绍,中文分词和词性标注是两个不同的任务。词性标注是在已经切分好的文本中,给每一个词标注其所属的词类,例如动词、名词、代词、形容词。词性标注对后续的句子理解有重要的作用。在词性标注中,歧义仍然是个老大难的问题。例如,对于“他要向全班同学报告书上的内容”中,“报告书”的正确的切分和标注应为...
创新工场提出中文分词和词性标注新模型 可提升工业应用效率
在NLP中,中文分词和词性标注是中文自然语言处理的两个基本任务,尤其在工业场景对分词有非常直接的诉求,但当前没有比较好的一体化解决方案,而且中文分词普遍存在歧义和未登录词的难题(www.e993.com)2024年10月23日。创新工场方面解释,中文语言因其特殊性,在分词时面临着两个主要难点。一是歧义问题,由于中文存在大量歧义,一般的分词工具在切分句子时...
古汉语怎么分词!?第一届古汉语分词和词性标注国际评测会议顺利举办
EvaHan第一届古汉语分词与词性标注评测会议2022年6月25日晚上8点至9点半,第一届古代汉语分词和词性标注国际评测子会议成功举行。该次评测会议是在法国马赛法罗宫举办的第十三届语言资源与评测国际会议(LanguageResourcesandEvaluationConference,LREC)的分会场,即第二届历史和古代语言技术研讨会(WorkshoponLanguag...
复旦邱锡鹏团队最新成果fastHan:基于BERT的中文NLP集成工具_澎湃...
fastHan是基于fastNLP与PyTorch实现的中文自然语言处理工具,像spacy一样调用方便。其内核为基于BERT的联合模型,其在13个语料库中进行训练,可处理中文分词、词性标注、依存句法分析、命名实体识别四项任务。fastHan共有base与large两个版本,分别利用BERT的前四层与前八层。base版本在总参数量...
哈工大讯飞联合实验室夺中文语法诊断大赛全球冠军
第一,将词向量、统计、先验的语法知识相融合,如汉语语言习惯用法等统计特征,比如“静静的顿河”和“静静地等待”中结构助词“的”和“地”的使用会根据上下文的词性而决定;第二,采用模型内部融合的技术,将多个BiLSTM单模型的输出加权融合,再经过CRF计算最终结果;...
余光中称翻译如婚姻是妥协艺术 强调中文重要
余光中坦言,抽象名词在西方国家语言中非常普遍,中文却颇难对应,中文同1个字,在不同地方可以有不同的词性,不会像英文会有字尾变化,全由上下文来判断。他建议,可以用中文的短句来化解英文抽象名词,比较有效。代名词和所有格是西方文法的常态,出现率极高,但是中文文法绝对不可以如此,余光中认为,对中文来讲,这是最可...