“识典古籍”测试版正式上线 古籍要走向活化、大众化
这样不同的名字,会影响搜索结果。文字识别技术演示图相比字节跳动内其他产品,识典古籍可能是用户量最小的一个,但这并没有降低识典古籍在字节内部的地位。整个产品小组的人员主要从字节跳动内部进行招募,其中不少同事对古籍有浓厚的兴趣,个别产品经理本身研究生专业就是古典文献。但这并不意味着开发识典古籍更容...
《围城》人名出处及隐喻
唐晓芙:这个名字意指清晨池塘里初开的荷花,她人如其名单纯美好。也出自《楚辞·九歌》。湘君又唱“采薛荔兮水中,搴芙蓉兮木末”。意思是下河摘旱地生的薛荔,上树找水生的芙蓉,暗示了唐晓芙就是这样的理想主义者。孙柔嘉:出自《诗经·大雅·抑》“敏而威仪,无不柔嘉。”柔嘉,温柔又美好。这或许就是儒家...
北京大学在图数据库和知识图谱上的探索与实践
不同于传统基于关系数据库的知识图谱数据管理方法,gStore原生基于图数据模型(NativeGraphModel),维持了原始RDF知识图谱的图结构;其数据模型是有标签、有向的多边图,每个顶点对应着一个主体或客体。我们将面向RDF的SPARQL查询,转换为面向RDF图的子图匹配查询,利用我们所提出的基于图结构的索引(VS-tree)来加速查询的...
大模型时代的ASR就是不一样!豆包听力水平现场评测,口音直接拿捏!
它能准确转录各种语音信号,识别不同语言、方言、口音。对于人名、生词,Seed-ASR也能结合文本语音等上下文,实现更准确转录。该成果目前已被集成进豆包APP、火山引擎相关服务模块中。本文介绍了Seed-ASR技术亮点——高精度识别、大容量模型、支持多种语言、上下文感知、分阶段训练方法。相关同学还分享了立项动...
CCTV-1 纪录片《文脉春秋·九江》全评述三:诗画之城的天际线
上图中央那两个山尖是双剑峰。九江有一条老街巷,正对着庐山,当年楼房不高的时候,站在街巷中就能远眺那对耸峙的双峰,这就是双峰路名字的由来。未完待续。大型纪录片《文脉春秋》第一季正在CCTV-1重播,周一到周五每晚22:30,九江篇将于周五(12月22日)播出,敬请观看。
大语言模型在企业内部审计中的应用研究
具体而言,大语言模型首先通过无监督学习技术对数据集进行探索性分析,识别出数据中的聚类、异常值及关联规则等;其次利用图网络、关联规则挖掘等算法,深入挖掘数据间的相关性,形成可视化的关联图谱,审计人员可以基于这些图谱,快速定位关键风险点和异常交易模式(www.e993.com)2024年11月3日。
徐自豪|识图记——不寻常的 “带头大哥”
始得毕业。书或容有疏漏,而十余年之心力,瘁于此矣。”(张星烺:《中西交通史料汇编》序言)原来,这位“带头大哥”早已深谙我们看五千人照片找他的艰辛与乐趣。那么套用他的话就是,识图或容有疏漏,而遍览五千余图以寻一人之心力,瘁于此矣!(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
三位年轻人的新冠“后遗症”:心情随着搜到的信息波动,半个月查4次...
三位年轻人的新冠“后遗症”:心情随着搜到的信息波动,半个月查4次心电图,囤药成习惯1月11日,27岁的刘可在阳康后第6次被医生告知:各项检查都没有问题。她开始相信,自己不是心肌炎,也没有白肺。但她确实病了,因为据精神科医生诊断,她正处于焦虑状态。刘可并不是个例。12月末开始,对“新冠后遗症”...
天将降大任于是人还是斯人?“识典古籍”里有参考答案
几轮内测下来收集了大概300多条问题,采取了中间90条进行了迭代,主要是一些体验方面的改进。比如有些古籍名字前后不一样。像《诗经》,它的底本其实名字叫《毛诗》。这样不同的名字,会影响搜索结果。文字识别技术演示图相比字节跳动内其他产品,识典古籍可能是用户量最小的一个,但这并没有降低识典古籍在字节内部...
古籍数字化平台“识典古籍”推出:三年将上线万种儒释道经典
“识典古籍”项目负责人介绍,该平台当前主要使用了三种技术,包括文字识别、自动标点和命名实体识别。文字识别技术,是对古籍的影印版文字进行单个切分,再进行文字识别和顺序识别。自动标点技术,是通过序列标注的方式对古籍自动进行标点划分。命名实体识别技术,则是通过序列标注识别文本中的人名、地名、书籍、时间、官职...