从语言语素—音节编码类型看世界语言分类
这个句子可按语素切分为:tuntu-ssur-qatar-ni-ksaite-ngqiggte-uq,意思是“驯鹿—狩猎—将来时—说—否定—再次—第三人称单数”。除语素tuntu“驯鹿”之外,其他语素都不能单独出现,属非自由语素。名物语素对应双音节,动作语素对应单音节。南非的班图语、现代英语也属此类语言。新视角有助于破解人类语言编码...
我们试着让5个国内AI大模型教会大家Token的秘密,看看你能学会吗
在第一种分词方法中,我们将句子切分为多个较小的token,每个token的语义相对较小,如"The"、"quick"等。而在第二种分词方法中,我们切分出了更大的token,如"quickbrownfox"、"jumpsoverthelazydog”等。对于模型来说,第一种分词方法能够更好地捕捉到每个词汇的独立语义,而第二种分词方法则更注重整个句...
期刊目录 |《华文教学与研究》2023年第1期
研究发现:韵律因素和语素位置概率显著影响词语的切分和识别;汉语母语者和二语者最大的差异在于二语者加工单位的长度小于母语者,这可能是由于二语者的知觉广度范围较窄导致的。汉语的基本加工单位大小基本遵循“长词优先”原则,同时受韵律特征、语素特征、语言水平等因素的影响。国际中文教育区域国别中文教育研究专栏...
李宇明丨汉语语法“本位”论评:兼评邢福义“小句中枢说”
从理论上看,词组、词、语素和句子语气等句法单位,可以通过对小句的切分或再切分得到;复句、句群等超句法单位,可以通过小句的串联得到。以前的“本位”都不能解决超句法的问题。所以,“小句中枢说”的提出,可以说是开始了汉语语法研究史上的第二次重要转折---超句法转折。这种超句法转折具有较大的涵盖面和当代...
文言文阅读高分攻略,高分逆袭必读!
详知译句上下文的含义。逐字对应翻译,做好换、留、删、补、调。抓住句子中关键字词翻译,要与上下文对应,这些字词是得分点。注意词类活用、倒装、通假、偏义复词。复杂句子要作句子成分分析,抓住主干,注意句间关系,注意特殊句式。意译词语根据上下文推导,不拘泥于原文结构,由实到虚。组合成句子,前后通顺。
语言学概论自考复习资料第四章第四节
5.“复杂词组”的组合关系实际是词的组合的层次关系(www.e993.com)2024年10月17日。把复杂词组逐层切分到词为止,或从词开始逐层组合,一直到复杂为止,这叫做“直接成分分析法”或“层次分析法”。6.划分词组的层次原则:层次分析必须依据两条原则:一是“成结构”,即任何时候切分的两边都必须能互相组合成词组结构;二是“有意义”,即任何时候切...
一轮复习结束后——现汉资料整理上
答:1)古代汉语有入声字,这些入声字在现代汉语普通话里已经消失,分别归入阴阳上去四声。2)现代汉语比古代汉语有较多的双音词,主要是名词。许多古代汉语的单音节词成了构词语素。3)现代汉语的修饰语比古代汉语复杂。主要反映在书面语上边,如长修饰语、多项并列的修饰语都是“五四”以后出现的。