历史与AI的距离|AI在古典学中的应用
Gemini一个显著的劣势在于它暂时无法有效处理残篇、铭文以及通过OCR(光学字符识别)技术从图像中提取的古希腊语文本。残篇往往因为保存状况不佳、书写风格各异或存在模糊、断裂等问题,难以自动识别和分析。Gemini在这方面的不足,限制了其在某些特定研究领域的应用范围。文字识别方面,Gemini对于图片中的拉丁语文字识别较...
合合信息登上《人民日报》,IPO科创属性获关注
人民日报提到,合合信息通过先进的AI技术手段,力求解决文化遗产保护传承中古文字的识别问题。2021年、2022年的世界人工智能大会上,合合信息展现了智能文字识别技术在甲骨文识别、金文(西周钟鼎文)识别方面的应用,展现了AI“看清古籍”的能力。2023年,合合信息针对现有的《西南彝志》、云南贵州一带古彝文字符开展统一编码,...
合合信息IPO观察:被《人民日报》“点赞”,产品坐拥三亿用户
人民日报提到,合合信息通过先进的AI技术手段,力求解决文化遗产保护传承中古文字的识别问题。2021年、2022年的世界人工智能大会上,合合信息展现了智能文字识别技术在甲骨文识别、金文(西周钟鼎文)识别方面的应用,展现了AI“看清古籍”的能力。2023年,合合信息针对现有的《西南彝志》、云南贵州一带古彝文字符开展统一编码,...
AI赋能 合合信息加速推动文化科技深度融合
今年以来,我国入境游火爆,该产品推出“扫描证件——护照”成为外国游客办理签证等业务的首选功能,仅2个月内,“护照”功能在海外地区的使用量已达数十万次。在同业竞争方面,以Adobe、微软为主的美国软件业巨头,也加大了智能文字识别领域的研发力度,并推广“AdobeScan”“MicrosoftOfficeLens”等自研产品,试图夺回...
识别古文字、修复老照片,AI让OCR玩出“新花样”|36氪专访
本次识别钟鼎文,是合合信息继去年在人工智能大会挑战识别甲骨文后追求的新挑战。合合信息扫描全能王事业部负责人曹超阳向36氪表示,古文的识别会涉及到OCR行业两大典型难点——图像优化处理与文字准确识别。图像优化处理方面,古文字的载体与常规平面差异较大。甲骨文与钟鼎文对应的载体是龟壳和青铜器,表面存在不同...
扫描全能王:智能文字识别技术亮相人工智能大会秒级识别不容小觑
据了解,本次大会上合合信息展示的智能文字识别技术主要有三个核心技术层,首先是智能图像处理技术,能对用户拍摄的复杂文档图像进行预处理,有效提升了文档图像质量;其次是基于深度学习的复杂场景文字识别技术,能应对各种复杂场景下文字识别,主要是利用合合信息自主研发的手写印刷混排识别、防强干扰识别、扭曲文字和复杂印章...
能“读懂”古文还可反诈骗 合合信息智能文字识别技术亮相2022WAIC
本次展示的钟鼎文识别项目,是继去年的甲骨文识别之后,合合信息向古文字识别发起的又一次冲锋。大会现场还可使用公司旗下产品“扫描全能王APP”,用“拍图识字”功能一键识别竖排的繁体古籍《桃花源记》,将其转化为易于阅读的横排、简体版本。合合信息技术人员介绍:“选择钟鼎文、古籍等素材来识别,是因为与常规文本...
聚焦2022世界人工智能大会:这届AI“卷”出新高度!
据悉,本次展示的钟鼎文识别项目,是继去年的甲骨文识别之后,合合信息向古文字识别发起的又一次冲锋。与此同时,大会现场还可使用公司旗下产品“扫描全能王APP”,用“拍图识字”功能一键识别竖排的繁体古籍《桃花源记》,将其转化为易于阅读的横排、简体版本。
海外古籍数字化回归:如何做到“为天下人所用”?
他想到了单字识别、再聚类的数据收集方法。也就是说,把一册古籍里的字全部切分开来单个识别,然后把形状、笔画类似的字放入一个类别,再让对古文字有所了解的人对聚类进行审核——拎出不属于这个类别的字。最后给这个类别打上标签,也就是这一类图片字的打印版原型。