...看懂”一部电影:智源联合高校开源 Video-XL,打破长视频理解极限
LLaVA-NexT-Video和LongLLaVA都采用了简单的位置信息外推算法,但在输入更多上下文时,仍然难以理解关键信息。虽然LongVA通过微调LLM来处理更长的输入,但高昂的计算成本限制了其在单块80GGPU上处理约400帧的能力。相比之下,Video-XL在相同硬件条件下,以16倍压缩比和2048帧输入,达到了近9...
...智源联合高校开源Video-XL打破长视频理解极限,95%准确率刷爆纪录
LLaVA-NexT-Video和LongLLaVA都采用了简单的位置信息外推算法,但在输入更多上下文时,仍然难以理解关键信息。虽然LongVA通过微调LLM来处理更长的输入,但高昂的计算成本限制了其在单块80GGPU上处理约400帧的能力。相比之下,Video-XL在相同硬件条件下,以16倍压缩比和2048帧输入,达到了近95%的准确率。这表明,Video...
为什么“压缩即智能”?算法信息论与大模型、生命、智能的联系
压缩完成的三元组可以继续用哈夫曼编码继续压缩,再加上一些技巧,最终一起整合成了著名的Deflate算法(PhilKatz1989s)。在Deflate算法的基础上改进的gzip算法是平时更加常用的(gzip,Jean-loupGailly&MarkAdler1993)。信源编码定理(Sourcecodingtheorem)信源编码定理表明,在极限情况下,随着独立同分布随机变...
在新能源浪潮中:传统发动机的技术革新与亮点解析
这一动作巧妙地改变了多连杆系统的几何结构,进而调整了四个气缸活塞的上止点和下止点位置,使得发动机能够灵活地在高效燃烧与高输出功率之间切换,实现从14:1到8:1的压缩比转换。值得一提的是,在从14:1的高压缩比降低至8:1的过程中,活塞上止点的位置下移了6毫米,活塞的行程从88.9毫米增加到了90.1毫米,而发动...
原谅撞倒母亲的外卖小哥?这部影片聚焦算法困住的打工人
事故需要判定责任,生活难以讨论出对错。站在外卖公司高管危力的角度,他正常行驶,是外卖员超速闯了红灯;对于被撞成重伤的外卖员陈金鹏一家而言,这是一桩巨大的悲剧。悲剧背后还隐藏着一个事实:不久前,危力为了业绩提出压缩外卖员的配送时间。算法将外卖员困在系统里,运用算法的人也逃不开被抛弃的结局。车祸...
Nature子刊:张翼/王行环团队开发精确测定单细胞年龄的时钟算法
单细胞测序数据集和考古发掘现场之间存在一种有趣的对偶:从某种意义上来说,它们都是关于历史的压缩快照(www.e993.com)2024年11月4日。化石只有在与相关地层相关联时才具有完全意义,考古发现只有在精确定年后才能解释历史。而现在,研究人员发现了一种隐含在单细胞测序数据中的时间信息:时钟样染色质可及性。利用这种细胞内在的“分子时钟”,我们可以...
...Highlight | 北航等发布「时间特征维护」:无需训练,极致压缩...
不仅以4bit的权重大小实现了目前无损条件下最极限的扩散模型训练后压缩,同时还实现了超过2.38倍真实硬件加速。这一发现再次将Diffusion压缩推向全新的高度。目前,该工作已被CVPR2024高分接收,并被接收为HighlightPoster(Top2.8%)。论文地址:httpsarxiv/pdf/2311.16503...
超万字实录详解如何打造“好用”的自动驾驶智能芯片算法工具链
涉及到在芯片上真正跑这个模型,就会用到算法工具链提供的一整套开发套件。目前展示的这一页就是地平线的算法工具链构成,大概分三个部分:第一部分是训练侧相关的,偏向模型训练端和模型前端,框架去对接的这个部分。我们会对接主流的深度学习框架,同时提供两种方式:...
让摩尔定律走出极限的,会是埃米级芯片吗?
随着芯片上封装的元件数量变得十分庞大,设计和验证过程变得愈发复杂,加之埃米级晶体管数量高达数十亿个之多,在驱动EDA流程的算法中集成人工智能(AI)和机器学习(ML)的作用就凸显出来。人工智能和机器学习能够以比传统EDA解决方案快几个数量级的速度,寻找重复性大型任务中的模式或效率优化空间,并发现极其微小的错误,例如...
信息论、机器学习核心概念:熵、KL散度、JS散度的深度解析及应用
数据压缩:KL散度量化了使用一个概率分布压缩来自另一个分布的数据时的效率损失,这在设计和分析数据压缩算法时极为有用。强化学习:在强化学习中,如近端策略优化(PPO)算法,KL散度用于控制新策略与旧策略之间的偏离程度。数据漂移检测:在工业应用中,KL散度广泛用于检测数据分布随时间的变化。