从大脑到算法,详解2024诺贝尔物理学奖 | 追问观察
其他应用包括减少测量黑洞碰撞产生的引力波中的噪声,或搜寻系外行星。近年来,这项技术还被用于计算和预测分子和材料的特性,例如预测蛋白质分子的结构,这决定了它们的功能,或者研究哪些新材料可以用于更高效的太阳能电池。
科研助攻|“药筛+AI”:AI 算法如何加速药物发现?|MCE
另一个例子是通过使用ML算法发现β-分泌酶(BACE1)的新型抑制剂,BACE1是一种参与阿尔兹海默症的蛋白[4]。在COVID-19大流行期间,AI的潜力显得尤为突出,AI算法被用于分析潜在的大型化合物数据集,并确定了最有可能对抗该病毒的化合物[5][6][7][8][9][10]。本次AI大赛获得一等奖的团队为...
科学家揭示深度神经网络的线性性质,助力催生更优的模型融合算法
在近期一项工作中,他们发现在预训练-微调的范式下,不同的微调模型之间也满足LayerwiseLinearFeatureConnectivity的性质,课题组将其称之为Cross-TaskLinearity。其发现:在预训练-微调的范式下,网络实际上更近似于一个从参数空间到特征空间的线性映射。即Cross-TaskLinearity将LayerwiseLinearFeatureCon...
不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它
可以看到,当维持词汇库大小稳定不变并改变其它句法性质(表4)时,gzip可压缩率依然可以预测Scalinglaw的参数变化情况(相关性甚至强于增加词汇量的设置)。图6则是实证中找到的反例,这表明当句法性质变化范围很大(表5)但这些数据集的最终gzip可压缩率一样时,Scalinglaw参数并不会有显著变化。尽管在...
AI顶会ICML收了一篇论文:没算法没实验
万能逼近性质为了表述本文的新型万能逼近定理,需要给出如下记号:有限词汇表核心是将V称为词汇表,V中的映射称为“词”,V中一个序列的复合称为“句子”,所有“句子”的集合记为HV。记号中的实心点表示的是函数复合,计算时先复合最左边的函数。与常规的复合函数记号相比,有下面的关系:...
这些年背过的面试题——实战算法篇
通过哈希函数分配到100台机器上,然后每一台机器分别统计分给自己的URL中是否有重复的URL,同时哈希函数的性质决定了同一条URL不可能分给不同的机器;或者在单机上将大文件通过哈希函数拆成1000个小文件,对每一个小文件再利用哈希表遍历,找出重复的URL;或者在分给机器或拆完文件之后,进行排序,排序过后再看是否有重复...
目录|《法治实务》集刊2024年第2卷
数据算法研究1.民营企业数据财产权的矩阵式保护作者:朱天阳(华东政法大学经济法学院硕士研究生)内容摘要:民营企业数据财产权的保护问题诞生于数字时代数据财产化趋势加剧、社会主义市场经济新阶段非公有制经济繁荣发展的双重背景之下。囿于在数字技术、数据管理、雇员流动性等多方面的劣势,相较于国企,民企在数据要素市场...
丁道勤:生成式人工智能训练阶段的数据法律问题及其立法建议 |...
总体看来,生成式AI技术在各行业的数字内容相关领域均有发挥空间,其产业链涉及数据、算法、算力、场景等要素。综合来看,生成式人工智能训练阶段的法律问题主要聚集于AI所需的海量训练数据与个人信息和数据保护、版权排他性保护之间的根本性冲突。单就数据法律问题而言,主要存在宏观和微观两个层面的问题,在宏观层面,存在...
自动驾驶一定有ChatGPT时刻,最快明年就降临|MEET2024
因为这是我们谈到自动驾驶真正产品化落地,上层算法是一个部分,但是车端是另外一个部分。在这个阶段里面看传统的自动驾驶技术,我是偏悲观看的。我的悲观集中在大家看现有自动驾驶整个发展过程中,已经非常场景化、专业化了,包括做港口、矿山,或者L4干线,或者说Robotaxi,更多会聚焦在某一个具体场景做自动驾驶。这...
零点有数:公司在数据要素市场中的定位是“数商” 作为数据转化...
4、目前的主要数据来源是哪些?有没有积累比较核心的技术或者算法的能力?答复:公司主要业务是对数据进行分析和洞察,以及形成相应的决策支持服务产品。目前数据分成三个来源,第一类是公司直接采集的数据,用到答对、巡查宝作为采集数据、融合数据的工具。第二类是客户内部的数据,比如客户内部ERP数据,客户本身CRM管理数据,...