11月语言学联合书单|最早的汉语:甲骨文之前的汉语样貌
二语的发展变异指的是第二语言发展中学习者的语言行为在不同时间点发生的习得与磨蚀并存的情况。本书在提出“动态变异观”的动态系统理论的研究视角下,运用纵向历时个案研究法,对第二语言(英语)口语系统的基本分析单位(词汇和句法)发展过程中的变异情况进行研究,以期发现二语口语发展变异规律、提出二语口语提升路径。
...团队开发基于Transformer的语言模型,预测翻译调控并解析疾病变异
在第二种解释性算法中,研究者依赖Translatomer进一步开发出了计算模拟突变(insilicomutation)工具,能够利用Translatomer模型精准预测剪辑突变对所在基因的翻译效率的影响,并利用了Kozak元件和荧光报告系统对计算模拟突变算法的准确性进行了验证。利用该工具,研究团队发现与翻译调控相关的遗传变异在物种进化中受到了选择压...
HFT内部研究 :大语言模型在选股因子挖掘中的深度应用
自然语言描述是用来解释Alpha因子的逻辑和使用场景的。例如,LLM生成的描述可能包含因子背后的金融理论或预测逻辑。通过加入经整合的关于Alpha挖掘的额外知识、信息、文献和数据的知识库模块提高LLM的性能和准确性。示例“这个动量因子基于过去10天的价格变化,结合成交量,预测未来的收益表现。它旨在捕捉短期...
敏感词泛滥网络言论审查边界在哪里?变异语言如何影响年轻一代?
语言不仅是沟通的工具,更是文化的载体。当互联网平台为了规避监管,创造出各种替代“敏感词”的变体时,它们实际上在侵蚀着语言的纯洁性和规范性。微信被称为“绿pp”,QQ被称为“企鹅”,钱被叫做“米”,这种随意的替代不仅让人困惑,更可能导致语言的混乱。尤其是对于正处于语言习得阶段的儿童来说,长期生活在这种充...
美国土安全部发布关键基础设施中安全部署人工智能的开创性框架
据ScienceAI公众号11月16日消息,北京理工大学科研团队开发出首个生成式DNA大语言模型megaDNA,为噬菌体基因组注释和功能序列设计开辟了全新的路径。该模型利用无标注的噬菌体基因组数据进行预训练,不仅能准确预测噬菌体的必需基因,还能生成长达10万碱基对的崭新基因组片段,像写作自然语言一样生成DNA序列。该研究展示了生...
华大基因发布基于大语言模型的新方法用以诊断罕见遗传病
华大基因发布基于大语言模型的新方法用以诊断罕见遗传病华大基因7月23日发布消息称,华大基因AI团队在近期的研究工作中首次应用微调大语言模型来识别罕见遗传疾病的致病变异,开发了大语言模型驱动的新方法GeneticTransformer,相关工作在medRxiv预印(www.e993.com)2024年11月29日。本文源自:金融界AI电报...
寓意于形 形神兼备——谈汉字对语言功能的超越
福”,米缸上“福”字倒贴,倒米时“福”形变正,象征“物去而福至”;百个异体“福”字构成“百福图”,以求“百福降临”……这种利用汉字形体变异、置向移动、笔画增减、排序组合等方式来表情达意的用字现象,被学者称为汉字的“超语符功能”,即汉字可以不跟语符的音义对应,而仅凭形体本身发挥超越语言的表达...
7月9日外媒科学网站摘要:5000多个增加患癌风险的基因变异被确定
为了解决这个问题,芬兰自然历史博物馆的研究者创造了一种名为Phenoscript的特殊语言。这种语言旨在以人类和计算机都能理解的方式描述特征。用Phenoscript描述特征,就像为一个生物体的外观编写计算机代码。Phenoscript使用语义技术,帮助计算机理解单词背后的含义,就像现代搜索引擎如何根据用户的搜索上下文区分水果“苹果”和科...
过去一周,脑科学领域有哪些新发现?| 追问weekly Vol.36
大语言模型模拟人类认知风格宇宙太短,猴子无法随机生成莎士比亚全集调整数据偏见提升AI诊断公平性█大脑健康罕见遗传变异引发儿童智力障碍及脑部畸形心脏病发作后,睡眠质量对心脏愈合至关重要抑制F-肌动蛋白积累延缓大脑衰老苏氨酸或成延长寿命的潜在靶点...
重磅!华大基因发布基于大语言模型的新方法助力罕见遗传病快速诊断
华大基因AI研究团队开创性引入了大语言模型来识别罕见遗传疾病的致病变异,并利用真实临床场景验证展示了其相较于传统工具及遗传病人工筛选的优势,可以更灵活地面向多样化的临床表型信息进行更高效精准的变异筛选及排序、结合RAG技术还可以实现更新更及时的数据库检索功能等,有望解决现有遗传病分析解读的痛点和难点。