社会焦点

Google深度揭秘TPU:一文看懂内部原理,以及为何碾压GPU(2)

字号+ 作者: 来源: 2017-05-14

GPU的流处理器(SM)就是一种高效的向量处理器,赞单个时钟周期内,可以处理数百到数千次运算。 至于TPU,Google为其设计了MXU作为矩阵处理器,可以在单个时钟周期内处理数十万次运算,也就是矩阵(Matrix)运算。

  GPU的流处理器(SM)就是一种高效的向量处理器,赞单个时钟周期内,可以处理数百到数千次运算。

Google深度揭秘TPU:一文看懂内部原理,以及为何碾压GPU

  至于TPU,Google为其设计了MXU作为矩阵处理器,可以在单个时钟周期内处理数十万次运算,也就是矩阵(Matrix)运算。

  TPU的核心:脉动阵列

  MXU有着与传统CPU、GPU截然不同的架构,称为脉动阵列(systolic array)。之所以叫“脉动”,是因为在这种结构中,数据一波一波地流过芯片,与心脏跳动供血的方式类似。

Google深度揭秘TPU:一文看懂内部原理,以及为何碾压GPU

  如图所示,CPU和GPU在每次运算中都需要从多个寄存器(register)中进行存取;而TPU的脉动阵列将多个运算逻辑单元(ALU)串联在一起,复用从一个寄存器中读取的结果。

  MXU中的权值阵列专门为矩阵乘法运算进行了优化,并不适用于通用计算。

Google深度揭秘TPU:一文看懂内部原理,以及为何碾压GPU

  △脉动阵列中,输入向量与权值矩阵相乘

Google深度揭秘TPU:一文看懂内部原理,以及为何碾压GPU

  △脉动阵列中,输入矩阵与权值矩阵相乘

  MXU的脉动阵列包含256 × 256 = 65,536个ALU,也就是说TPU每个周期可以处理65,536次8位整数的乘法和加法。

  TPU以700兆赫兹的功率运行,也就是说,它每秒可以运行65,536 × 700,000,000 = 46 × 1012次乘法和加法运算,或每秒92万亿(92 × 1012)次矩阵单元中的运算。

Google深度揭秘TPU:一文看懂内部原理,以及为何碾压GPU

  △TPU中的MXU

  我们对CPU、GPU和TPU的每周期算术运算量进行一下对比:

每周期运算量
CPU 数个
CPU (向量扩展) 数十
GPU 数万
TPU 数十万

  这种基于复杂指令集计算(CISC)的矩阵运算设计,实现了出色的性能功耗比:TPU的性能功耗比,比同时期的CPU强83倍,比同时期的GPU强29倍。

Google深度揭秘TPU:一文看懂内部原理,以及为何碾压GPU

  极简&确定性的设计

  极简这一点,在Google之前发布的TPU论文第8页提到过。与CPU和GPU相比,单用途的TPU就是一个单线程芯片,不需要考虑缓存、分支预测、多道处理等问题。

  TPU的设计之简洁,从冲模平面图上就能看出来:

Google深度揭秘TPU:一文看懂内部原理,以及为何碾压GPU

  △黄色代表运算单元;蓝色是数据单元;绿色是I/O,红色是控制逻辑单元。

  与CPU和GPU相比,TPU的控制单元更小,更容易设计,面积只占了整个冲模的2%,给片上存储器和运算单元留下了更大的空间。而且,TPU的大小只有其他芯片的一半。硅片越小,成本越低,良品率也越高。

  而确定性,是单用途带来的另一个优势。CPU和GPU需要考虑各种任务上的性能优化,因此会有越来越复杂的机制,带来的副作用就是这些处理器的行为非常难以预测。

  而用TPU,我们能轻易预测运行一个神经网络、得出预测,需要多长时间,这样,我们能让芯片以吞吐量接近峰值的状态运行,同时严格控制延迟。

  以上面提到的MLP0为例,在同样将延迟控制在7毫秒之内的情况下,TPU的吞吐量是CPU和GPU的15到30倍。

Google深度揭秘TPU:一文看懂内部原理,以及为何碾压GPU

  △各种处理器上每秒可运行的MLP0预测

  下面,是TPU、CPU、GPU在六种神经网络上的性能对比。在CNN1上,TPU性能最为惊人,达到了CPU的71倍。

Google深度揭秘TPU:一文看懂内部原理,以及为何碾压GPU

  总结

  如上文所述,TPU性能强劲的秘诀,是因为它专注于神经网络推断。这使得量化选择、CISC指令集、矩阵处理器和最小设计都成为可能。

  神经网络正推动计算模式的转变,Google预计未来几年中,TPU将成为快速、智能和价格实惠的重要芯片。【完】

  招聘

  量子位正在招募编辑记者、运营、产品等岗位,工作地点在北京中关村。相关细节,请在公众号对话界面,回复:“招聘”。

  One More Thing…

  今天AI界还有哪些事值得关注?在量子位(QbitAI)公众号对话界面回复“今天”,看我们全网搜罗的AI行业和研究动态。笔芯~

  另外,欢迎加量子位小助手的微信:qbitbot,如果你研究或者从事AI领域,小助手会把你带入量子位的交流群里。

  追踪人工智能领域最劲内容

相关阅读:

  • tpu和硅胶哪个好
  • tpu软膜和钢化膜
  • tpu是什么材质
  • tpu缩水率是多少
  • tpu原料价格走势
  • tpu和tpr的区别
  • tpu聚氨酯弹性体耐温等级
  • tpu热熔胶膜
  • 脂肪族tpu红外光谱
  • tpu材质的手机套好吗
  • tpu塑料造粒怎么
  • tpu表带生产标准
  • 相关推荐:

  • 华为史上最美操作系统,你绝对不能错过的EMUI5.0
  • 国产操作系统典范:deepin操作系统
  • 娱乐办公两不误!这个笔记本能把屏幕拔下来写字
  • 斗鱼响应新规加强监管,坚持打造优质精品直播
  • SpaceX 火箭爆炸原因确定:液态氧过冷成了固态
  • 华为Mate9中国版真机秀 你绝对没发现它有两种版本
  • 99%的人都不知道的微信高效使用术?
  • 乐视网一周蒸发88亿元 贾跃亭反思节奏发展过快
  • 似乎已经战胜传统渠道的小米 今年为什么被OPPO、vivo 打败?
  • 优雅商务风,性能一鸣惊人—TCL 950体验评测
  • 转载请注明出处。


    1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

    相关文章