目标检测技术的发展:从R-CNN、YOLO到DETR、DINO
模型体积:随着性能的提升,YOLO模型的体积也越来越大,这对于边缘设备或资源受限的环境来说可能是一个问题。尽管存在上述问题,但YOLO系列模型依然是目标检测领域中非常重要的研究方向之一,随着技术的发展,这些问题正在被逐步解决,比如通过引入更有效的特征提取方法、改进的数据增强技术、以及设计更合理的网络架构等方式来提...
【技术】一种无序无人机影像的三维重建方法
按需匹配对的核心思想是源模型ms的图像数量远少于参考模型mr的图像数量,那么可只使用与源模型图像相关的特征匹配来构建映射关系。如图6所示,源模型和参考模型使用图像i1、i2、i3和i4构建匹配图,其特征匹配的映射关系采用黄线表示。基于建立的匹配图,公共三维点集合CP的查找步骤为:①对于源模型中的每个三维点,找到其...
...科学院化学研究所江剑:用于有机体系大规模分子模拟的高效机器...
此外,现有的MLFF模型在进行有机体系的长时间分子模拟时,容易出现不稳定现象,如原子重叠或非物理构象的发散。这主要是由于训练数据集样本多集中于平衡态附近,而对于远离平衡态(如较长或较短的化学键)的分子构象采样较少,而机器学习模型的泛化能力有限,这使得面对新的分子构象时,容易产生较大预测误差,导致模拟失效。最...
港大发布智能交通大模型全家桶OpenCity!打破时空零样本预测壁垒...
实验结果显示,OpenCity在零样本学习方面取得了显著成效。此外,OpenCity的可扩展性也得到了验证,这表明有望构建一个能够满足所有交通预测需求的系统,并且能够以较低的额外成本适应新的城市环境。概述现有问题C1.空间泛化:现有的交通预测模型在空间泛化方面存在限制,难以适应不同地区因基础设施和人口特征不同而表现...
集成光子封装的双光子3d打印技术,打印微透镜耦合和光子引线键合
实验证明了在75km范围内的总数据速率为784Gbps。总之,PWB是一种高度通用的封装技术,适用于各种多芯片平台19,115,116。自由曲面微光学元件自由曲面光学器件非常适合光学耦合元件,因为它们能够雕刻光波前。然而,传统的散装自由曲面光学器件的广泛采用受到复杂的制造和集成程序以及高成本的阻碍。与简单的球面光学...
【技术】无人机倾斜摄影测量技术标准的初步探讨
摘要:无人机倾斜摄影测量技术在应用过程中,存在模型分辨率不一致、精度不可靠、格式不匹配的问题,但没有现行的标准对任务质量进行评价,这在一定程度上限制了无人机倾斜摄影测量技术进一步发展(www.e993.com)2024年10月4日。本文针对无人机倾斜摄影测量技术的现状,对从航摄准备(硬件)到数据处理应用(软件)整个作业流程的技术标准进行了论述,...
Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效
这是一个PyTorch原生,兼容多个训练框架,支持Checkpoint的高效读写和自动重新切分的大模型Checkpointing系统,相比现有方法有显著性能提升和易用性优势。本文介绍了大模型训练提效中Checkpoint方向面临的挑战,总结ByteCheckpoint的解决思路、系统设计、I/O性能优化技术,以及在存储性能和读取性能测试的实验结果。
Sora:大型视觉模型的背景、技术、局限性和机遇综述 【官方论文】
4.5机器人技术5讨论5.1局限性5.2机遇6结论A相关工作1引言自从2022年11月ChatGPT发布以来,人工智能技术的出现标志着一个重大的转变,重塑了交互方式,并深入融入日常生活和行业的各个方面[1,2]。基于这一势头,OpenAI在2024年2月发布了Sora,一个文本到视频的生成式AI模型,能...
AI经济学 | 第一章:迈入通用模型时代,迎接智能融合浪潮
如果有一种通用模型,能让AI在一致的框架下对不同类型的信息进行处理,从而从信息中刻画事物的联系,那么AI就有可能更全面、更深入地认识世界和总结规律,提高智能水平。(三)新架构“意外”突破,AI迈入通用模型时代不同于前几轮AI热潮,本轮AI的发展在处理不同类型信息的通用模型方面取得了重要的突破。2017年,...
【光电智造】基于多视角影像的大规模场景三维重建技术综述
图1三维重建示例:(左)真实图像(右)三维模型:点云基于神经网络的使用情况,三维重建技术大致分为传统方法和基于学习的方法。此外,根据获取场景信息的方法,这些方法可以进一步分为主动和被动重建方法,如图2所示。图2三维重建方法分类传统方法传统的被动式重建方法中,首先需要对图像中的特征点进行检测与匹配,将...