汉王科技:积极探索机器人技术及应用,已在视觉识别、图像识别等...
公司回答表示:机器人是人工智能的终极形态之一,无论是物理形态的机器人还是虚拟形态的机器人,公司都将从技术及应用层面展开积极探索;目前,公司在视觉识别、图像识别、NLP自然语言理解、嗅觉识别等感知技术、认知技术、智能人机交互等领域积累了多项底层关键技术。在行业端,依托AI文本图像识别技术、NLP技术、RPA(机器...
视频图像识别技术常见开源算法模型及实践应用方案介绍
1)智慧城市管理:图像识别技术能够帮助实现城市管理的智能化和精细化。例如,在规范地摊经济方面,基于深度学习的图像识别技术可以分时分区检测违规摆摊,提高城市管理的效率和准确性。同时,该技术还可以应用于垃圾分类,通过自动检测避免居民随意丢弃垃圾,促进城市环境的整洁和卫生。2)智慧交通监控:在交通领域,图像识别技术可...
基于多模态大模型的动作识别关键技术研究与应用
为将多模态大模型有效应用于动作识别任务中,中国移动信息技术中心智能AI研发团队采用基于预训练的CLIP多模态大模型,结合目标检测与提示工程技术,实现“零样本”条件下的动作识别。目前,该模型已应用在各类动作识别任务中,取得了理想的效果,超越了传统的人工智能算法。多模型大模型解决动作识别痛点问题动作识别是一类典型...
机器视觉技术在自动化领域应用的研究与展望
在科研领域,机器视觉的相关研究主要集中在缺陷检测和识别方面,研究设计的领域从农业工程逐渐拓宽至工业通用设备、化学金属学、电子学、汽车工业、电力工业、交通运输、航空航天等领域,产生了一批可落地应用的学术成果。例如,凌云研究了静态和动态两种情况下的谷物外观品质检测技术,以此设计和开发了一套适合于我国谷物外观...
人工智能赋能肺癌早期精准诊疗:基于CT图像的AI技术在肺癌诊治中的...
本文总结了人工智能技术在肺癌诊疗领域的应用现状,基于CT图像实现肺结节病灶检测、良恶性分类和基因分子无创预测,基于病理图像进行肺癌组织学分型、分子分型和预后评估,并总结了AI技术在临床应用面临的诸多挑战,推动人工智能技术的临床转化和实践落地。一、研究背景...
张继贤研究员:视觉SLAM环境感知技术现状与智能化测绘应用展望
视觉SLAM环境感知技术研究进展经过30多年的发展,视觉SLAM环境感知技术的理论框架已经逐渐清晰,包括前端、后端、回环检测和制图4个主要的技术环节(www.e993.com)2024年10月7日。前端的任务是估算相邻图像采集时相机的运动和计算局部地图;后端主要是基于回环检测信息对图像位姿和地图信息进行优化;回环检测则是根据图像信息识别已经出现的场景或位置,如果检...
探索向量数据库:技术原理、应用场景与挑战解析
与人工智能技术的融合向量数据库作为一种高效的数据处理工具,可以与人工智能技术进行融合,实现更高级别的智能应用。例如,可以使用向量数据库对图像进行分类和识别,同时使用深度学习技术对图像进行特征提取和识别。未来的研究将需要探索如何将向量数据库与人工智能技术进行融合,以实现更高级别的智能应用。综上所述,...
对话上海交大重庆AI研究院齐鹏团队:目前大模型水平只相当于一个仅...
最直观的应用就是视频生成,用户只需输入文字描述,就能快速生成符合要求的视频内容,提高了视频制作的效率和便捷性。很多时候,技术的发展并不是为了解决某个特定问题而进行的,而是在研究过程中意外发现了强大的解决方法。这种方法一旦成熟,就能够广泛应用于多个领域,解决一系列问题。目前,Sora仍处于测试阶段,并未广泛公开...
南京发布18个人工智能应用场景,欢迎合作!
搭建单位:国网江苏省电力有限公司电力科学研究院场景概述:响应国家“双碳”目标,研发分布式屋顶光伏潜力识别与装机预测系统,充分挖掘全省(市)建筑屋顶资源,分析节能减碳潜力,基于AI技术研发卫星图像的屋顶区域识别模型与装机趋势预测算法,具备速度快、精度高、易推广的优点,可实现屋顶可装机潜力区域的有效识别、装机容量转...
万字长文探索Sora的奥秘:15大视频能力、优缺点、应用场景和对产品...
无论你是AI技术的研究者、视频内容创作者,还是致力于产品创新的经理人,这篇文章都将为你打开一个新世界的大门,带你深入了解Sora的内部机制和外部应用,洞察未来趋势。一、关于SoraSora是OpenAI在2023年2月发布的一款文本到视频生成模型。它能够根据描述性提示生成长达一分钟的视频,同时保持视觉品质并遵循用户提示。