掌握PyTorch 张量乘法:八个关键函数与应用场景对比解析

2024年8月13日 - 网易

它能够处理各种不同维度的张量,并根据张量的维度自动调整其操作方式。torch.matmul可以执行以下几种矩阵乘法:二维张量之间的矩阵乘法:-这是经典的矩阵乘法操作。当两个张量都是二维的(即矩阵),进行标准的矩阵乘法操作。-例如:假设是形状为的张量,是形状为的张量,那么结果是一个形状为的张量。torch.matmul...

详情

开源神器!向量、张量、全文搜索一网打尽,打造最强 RAG!

2024年7月29日 - 网易

向量、张量、全文搜索一网打尽,打造最强RAG!作者|张颖峰开源AI原生数据库Infinity0.2release正式发布,提供了2种新数据类型:稀疏向量SparseVector和张量Tensor,在此前的全文搜索和向量搜索之外,Infinity提供了更多的召回手段,如下图所示,用户可以采用任意N路召回(N≥2)进行混合搜索,这...

详情

现代数学有哪些分支学科?(364个分支,超全!)

2024年1月9日 - 新浪财经

“连分数”、“数论函数”、“堆垒数论”、“素数分布”、“数的几何与数论中的逼近”、“超越数”、“丢番图方程”、“二次域的数论”、“代数数域的数论”、“局部域”、“类域论”、“岩泽理论”、“代数K理论”、“算术几何”、“费马大定理”、“代数数域上的代数群”、“自守形式”、“志村(Shimura...

详情

GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?

2024年8月1日 - 腾讯新闻

依据三维仿真结果,他们调整了过孔排列方式,将信号串扰降低到-60dB以下,较上一代降低了50%。并且,通过DOE矩阵式有源仿真,找到了通道所有corner的组合最优解,让算力性能可以得到充分发挥。内存方面,可以说是通用服务器的最大优势了。容量对于4路服务器来说,只需给每颗CPU插上8根32GB内存,就能轻松达到1TB。插...

详情

有钱买卡还不够,10万卡H100集群有多难搭?一文解析算力集群技术要点

2024年6月23日 - 腾讯新闻

在较大参数的训练中,一般有3种不同类型的并行化——数据并行(dataparallelism)、张量并行(tensorparallelism)与流水线并行(pipelineparallelism)。数据并行是其中最简单的并行方式:每个GPU拥有模型权重的全部副本,并分别保存一部分数据。前向计算过程中每个GPU独自工作,梯度更新时将所有GPU计算出的梯度相加,再一起...

详情

发展矩阵半张量积的奠基石:《矩阵半张量积讲义》5卷全部出齐

2024年5月7日 - 网易

计划出五卷(www.e993.com)2024年12月19日。卷一:矩阵半张量的基本理论与算法;卷二:逻辑动态系统的分析与控制;卷三:有限博弈的矩阵半张量积方法;卷四:有限与泛维动态系统;卷五:工程及其他系统的应用。本丛书致力于对这个快速发展的学科分支做一个阶段性的小结,以期对其进一步发展及应用提供一个规范化的基础。

详情

如何定量分析 Llama 3,大模型系统工程师视角的 Transformer 架构

2024年7月28日 - 腾讯网

首先是权重[hidden_size,hidden_size],我们一般使用二维的张量,即矩阵的形式来进行表示。在本次分享中,我们后续会用[H,H]来表示。其次是激活值[batch_size,seq_len,hidden_size],即输入输出值,我们一般使用三维的张量来进行表示。其中batch_size代表批的大小,seq_len代表句子的长度,hidden_si...

详情

斯坦福博士图解AlphaFold 3:超多细节+可视化还原ML工程师眼中的AF3

2024年7月21日 - 腾讯网

-表征学习:给定上一步中创建的张量,使用注意力机制的多种变体来更新这些表征。-结构预测:基于第一部分创建的原始输入以及第二部分改进后的表征,使用条件扩散进行结构预测。在整个模型中,蛋白质复合物有两种表示形式:单一表征(singlerepresentation)和配对表征(pairrepresentation),这两种表示都可以应用于token级别...

详情

斯坦福让“GPU 高速运转”的新工具火了,比 FlashAttention2 更快

2024年6月6日 - IT之家

一个张量内存加速器(TMA)——这是英伟达Hopper架构中的一种新硬件组件,可进行异步地址生成和内存获取,还能促进片上内存网络。4个子单元,每个含:一个warpscheduler;512个向量寄存器(每个包含32个4字节的词);一个用于执行矩阵乘法的张量核心;一组内置指令,如求和、乘法等,这些指令能够并行操作这些向...

详情

再战Transformer!原作者带队的Mamba 2来了,新架构训练效率大幅提升

2024年6月4日 - 百家号

Mamba-2在网络架构上的主要变化是从顺序生成变为并行生成SSM参数，并且Mamba-2更适合张量并行等扩展方法。通过提供状态空间模型的显式矩阵变换形式，研究团队揭示了理解和使用它们的新方法。从计算的角度来看，任何计算状态空间模型前向传播的方法都可以看作是半可分离矩阵上的矩阵乘法算法。半可分离矩阵视角为...

详情

查看更多

张量类型
张量矩阵
张量的rank
张量积矩阵
张量矩阵的乘积和张量点积的矩阵
张量与矩阵的乘积
张量运算与矩阵运算
张量有哪些基本性质
张量矩阵形式有哪些
张量矩阵化