音乐的指纹:听歌识曲app是怎么识别音乐的?算法原理揭秘
声音本质上是一种振动,在空气或水等介质中传播。被人耳接收后,人耳会把这种振动通过耳膜等组织传导为大脑能识别的信号。机器听歌的原理也类似,它把声音的振动转化为电信号,再把电信号转变成计算机可处理的数字信号。这个把连续的声音波形转化为离散数字信号过程就叫做采样。采样率决定了信号的捕捉效果。采样率越...
潮声丨太阳系考古,对我们意味着什么
专家们分析,“太阳系考古”周期预计将横跨千年,本质仍是对太阳系的探索。其主要有两个重要科学目标:一方面,追溯太阳系演化历史,比如原始星云盘如何演化成如今的太阳系;另一方面,根据“考古”日地关系、位置、质量等,在太阳系近邻恒星的周边寻找“第二个地球”。参与规划研讨的“太阳系考古专家”、中国科学院紫...
太阳系考古,对我们意味着什么
潮新闻记者求证到,“太阳系考古”一词曾出现在太阳系边际探测中,如今,意味着我国空间探测从月球、火星,接着向外拓展到100倍日地距离的太阳系边际。专家们分析,“太阳系考古”周期预计将横跨千年,本质仍是对太阳系的探索。其主要有两个重要科学目标:一方面,追溯太阳系演化历史,比如原始星云盘如何演化成如今的太阳系...
92页的llama 3.1技术报告,我替你们啃下来了
本质上先向量化表示,然后用类似knn方法聚簇,每个簇保留少量图。重采样,目标是保留图片的多样性。思路是文本和图片对应,所以保证文本的多样性就能保证图片的多样性。用n-gram来假设文本的多样性。库里存档的数量少于阈值次数的保留。OCR,将图片中的文本添加进文本中,提高可用性。??还引入了文档数据用来提高以图片形式...
探索智能的几何本质,科学家提出基于黎曼几何的智能数学框架
在智能领域,研究团队提出智能的本质可以被看作是高维空间中的“流形”结构,智能的思维过程则是在这些流形中的曲面上沿着“测地线”流动的过程。通过黎曼几何,研究人员可以捕捉到认知过程中的结构信息和动态变化。在人工智能领域,目前主要专注于静态数据结构的模型有变分自编码器(VAE,VariationalAutoEncoder)和生成对抗...
张潘:复杂世界的规律探寻者
在张潘眼里,用击败量子计算机的方法帮助量子计算机纠错,是因为这些问题本质上非常相似(www.e993.com)2024年11月24日。无论是“悬铃木”采样问题、量子纠错问题,还是物理中常见的水结冰相变问题、人工智能生成模型中对自然语言的建模,背后都有共同的科学难题——多变量联合分布概率。“对于复杂的系统,人们可能意识不到其背后隐藏的概率空间究竟有多庞大...
机器学习里的卷积,到底是什么?
对信号施加窗函数实质是用一个窗函数与采样后的时域信号相乘的过程(当然加窗也可以在频域进行,但时域更为普遍),使得相乘后的信号似乎更好地满足傅里叶变换的周期性要求。虽然窗函数应用在时域,通过对实际捕获的时域信号乘以时域窗函数,但是窗函数的影响在频域更明显。在频域,实际上是频域的实际信号与窗函数谱线的卷...
哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有...
与OpenAI之前的GPT-3等成就一样,大家的共识似乎是,Sora的架构并没有什么真正的突破。正如谢赛宁所说,它实质上是一种适用于视频的DiT,没有额外的花哨功能。因此,Sora在很大程度上是一项工程壮举,也是对扩展能力的又一次证明。技术报告生动地说明了样本质量随着训练计算量的增加而提高。与语言模型一样,某些能力似乎...
填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来
图4:模型预测BPTI亚稳态蛋白质具体例子(真实结构涂色,采样结构灰色)3.力场引导模型采样研究者以快速折叠蛋白中的WWDomain蛋白为例,探究了CONFDIFF在不同程度的力场引导(η)和序列条件(γ)影响下生成构象的效果如图5所示。结果表明,力场引导的模型可以在不显著降低多样性的情况下提高构象稳定...
OpenAI 翁荔提出大模型「外在幻觉」:万字 blog 详解抵抗办法、产...
基于采样的检测Manakul等人2023年提出了依赖于对来自黑盒LLM的多个样本进行一致性检查——SelfCheckGPT,以识别事实性错误。考虑到灰盒事实核查测量需要访问LLM的token级别的logprob,SelfCheckGPT仅需使用不依赖外部知识库的样本,因此黑盒访问就足够了,无需外部知识库。