再谈“三万亿”英伟达的破绽丨深度科普
SIMT执行方式类似于SIMD,一条指令可以同时对多个数据处理,但是不同的是,由于每个执行的SM都可以有独立的Branch的能力,所以每个thread编程更加灵活,使得我们可以用通用的C语言代码来描述单个thread的执行。正是由于新的架构极其灵活的可编程能力,一个名为CUDA(ComputeUnifiedDeviceArchitecture)的编程框架也跟随着G8x...
点阵液晶屏画竖线算法的优化及应用
编者按:以SBN0064控制的点阵液晶模块TG12864B为例,根据LCM内部显示存储器结构,对画竖线程序进行优化,并给出了具体的C程序代码。测试结果表明,采用优化的竖线程序在绘制竖线、填充矩形、椭圆等常用基本图形时,可以大幅度地提高程序的运行速度,具有较强的实用价值。液晶显示屏(liquidcrystaldisplay,LCD)因具有低功...
99行代码实现冰雪奇缘特效的太极再进化,胡渊鸣团队快手联合打造
每个细胞的「生」或「死」两种状态可以用一个位来表示。在C语言等传统语言中,用户必须使用char(u8)类型来表示细胞状态,除非他们手动打包/拆封这些状态。但在QuanTaichi系统中,用户可以在不修改任何计算代码的情况下将存储效率提升至原来的8倍。OTCA元像素是「生命游戏」中的一种特殊结构,该结构...
GPU深度报告,三大巨头,十四个国内玩家一文看懂 | 智东西内参
相较于OpenGLES,Metal减少了10倍的代码拥挤,提供了更好的解决方案,并将会在苹果设备中取代OpenGL。Metal也支持英特尔HD和IRIS系列GPU、AMD的GCN和RDNAGPU、NVIDIAGPU。Metal也是可以使用Swift或Objective-C编程语言调用的面向对象的API。GPU的全部操作是通过Metal着色语言控制的。2017年,苹果推出了Metal的升级版Meta...
革命性DX11架构!GTX480470权威评测
为了解决这个问题,DirectX11加入了两种新的压缩算法——BC6H和BC7。其中,BC6H是专门针对HDR图像设计的压缩算法,压缩比为6:1;而BC7是专门给高品质RGB[A]纹理设计的压缩算法,压缩比为3:1。上图展示的是图像通过BC6H压缩模式进行压缩的前后效果对比图。其中左边的图像为原始图像,中间的是在压缩过程中损失的一些...
开创DX11宏图霸业!镭HD5870权威评测
AMD由于自家Stream推广不利、支持OpenCL并不意外;Intel即将发布的LarrbeeGPU一大卖点就是强大的计算能力,支持OpenCL有百利而无一害;NVIDIA虽然在大力推广CUDA开发平台,但无奈势单力薄,小有所成但前途未卜,OpenCL虽然与CUDAC语言有交集但并不冲突,是相辅相成的互补关系,NVIDIA自然也大力支持(www.e993.com)2024年11月15日。
王者归来性能翻番 GeForce6技术解析
这里要额外说明几个问题。图形编程虽然属于高级语言,但是仍然需要生成类似于汇编语言的代码。在VertexShader1.0中,对于最终的每个程序的代码长度,DirectX限制是128条。到了VertexShader2.0中,程序的长度增加到了256条。笔者之前在没有得到VertexShader信息的时候,曾经估计VertexShader3.0指令的长度仍然会受到限制,但是将...
万字长文:我是如何把Skia的体积缩小到1/8的?
在探讨之前我觉得有必要定义一下“渲染”这个词。这个词在目前互联网技术上面有诸多含义,带有一定的迷惑性。下文所有提及的“渲染”都和计算机图形学中“渲染”拥有同样的含义,指的是把特定的像素填充对应的颜色,以及围绕这一目的的相关算法。鸟瞰渲染器全貌...