“中国版英伟达”摩尔线程开启IPO之路:今年已有3家芯片独角兽接受...
一方面,华为海思、寒武纪、海光信息、燧原科技、摩尔线程、天数智芯等国产厂商的AI芯片持续迭代升级,推进万卡集群建设;另一方面,阿里巴巴、百度等互联网厂加大发展自研芯片,优化卡间互联、集群建设、软件栈等能力。华西证券研报也提出,未来国产AI芯片有望实现从“能用”到“好用”。不过,从当前国际GPU市场来看,...
“中国版英伟达”摩尔线程开启IPO之路 三巨头仍占据大部分GPU市场...
一方面,华为海思、寒武纪、海光信息、燧原科技、摩尔线程、天数智芯等国产厂商的AI芯片持续迭代升级,推进万卡集群建设;另一方面,阿里巴巴、百度等互联网厂加大发展自研芯片,优化卡间互联、集群建设、软件栈等能力。华西证券研报也提出,未来国产AI芯片有望实现从“能用”到“好用”。不过,从当前国际GPU市场来看,英伟...
摩尔线程完成15亿B轮融资 将推动GPU快速迭代
此前,摩尔线程已经发布了两颗基于其MUSA统一系统架构打造的多功能GPU芯片——“苏堤”和“春晓”,以及系列GPU软件栈与应用工具,并已迅速将多款MTTS系列显卡推向市场,覆盖桌面、边缘和数据中心等多个场景。
加速替代CUDA!摩尔线程开源vLLM-MUSA 加速国产GPU AI
摩尔线程基于vLLMv0.4.2版本,进行了移植适配,使之支持摩尔线程GPU后端Device,并完全开源,开发者可以二次开发、升级vLLM到社区更新版本等。值得一提的是,得益于摩尔线程MUSA架构的先进性、软件栈对CUDA的优良兼容性,通过MUSIFY代码自动转换工具,用户可以快捷地将原有的CUDA代码迁移到MUSA平台,实现替代。同时,CUDA...
Java ZGC 深度剖析及其在构建低延迟流系统中的实践心得
值得说明的是,在JDK16之前,该阶段的耗时和GCRoots(静态变量与线程栈中的局部变量)的数量成正比。因此在JEP376中引入了一种新的算法,将扫描线程栈的操作转移到并发阶段,从而显著减少了该阶段的耗时。(并发)标记与重映射在这个并发阶段,ZGC将遍历整个对象图,并标记所有对象(根据GC周期不同,设置...
从内存泄漏到并发问题:6 个 Java 性能小技巧
随着该工具使用频率的增加,我们开始接收到系统偶尔冻结的报告(www.e993.com)2024年12月19日。通过线程堆栈分析,发现一些线程处于等待状态,形成了锁之间的循环依赖问题。在以下示例中,我们展示了两个线程(thread1和thread2)尝试按不同顺序获取两个锁(lock1和lock2)的情况。这种做法导致了循环等待的问题,从而增加了发生死锁的风险。
“中国版英伟达”要IPO了_澎湃号·湃客_澎湃新闻-The Paper
产品之外,围绕自主研发的MUSA统一系统架构和软件平台,摩尔线程正致力于构建国产GPU应用生态。软件生态是推动GPU计算普及的关键,以MUSA架构为核心,摩尔线程发布了完备的MUSA软件栈,以服务开发者和终端用户。摩尔线程MUSA架构及软件栈对CUDA具备兼容性,通过MUSIFY代码自动转换工具,用户可以快捷地将原有的CUDA代码无缝迁移到...
英特尔?? 至强?? 6处理器:专为云原生和超大规模工作负载打造
利用通用平台基础和共享软件堆栈提有效率所有英特尔??至强??6处理器,无论是P-core(性能核)还是E-core(能效核),都采用相同的指令集、BIOS和内置I/O加速器,包括英特尔??数据保护与压缩加速技术(英特尔??QAT),英特尔??DataStreamingAccelerator(英特尔??DSA),英特尔??In-MemoryAna...
理解Go协程调度的本质
操作系统对线程的调度可以简单的理解为内核调度器对不同线程所使用的寄存器和栈的切换。goroutine调度器调度模型传统线程模型的问题调度上面讲到了线程是操作系统级别的调度单位,通常由操作系统内核管理。切上下文切换的开销通常在微秒级别,且频繁的上下文切换会显著影响性能。
Android Native内存泄漏检测方案详解
介绍获取AndroidNative堆栈的方法,用于记录分配内存时的调用栈。一、代理内存管理函数实现首先我们来介绍一下代理内存管理函数实现的三个方案:InlineHookPLT/GOTHookLD_PRELOAD1.1NativeHook1.1.1方案对比:InlineHook和PLT/GOTHook