第三代张量处理器

张量处理器(英语:tensor processing unit,缩写:TPU)是Google为机器学习全定制的人工智能加速器专用集成电路,专为Google的深度学习框架TensorFlow而设计。

与图形处理器(GPU)相比,TPU采用低精度(8位)计算,以降低每步操作使用的晶体管数量。降低精度对于深度学习的准确度影响很小,但却可以大幅降低功耗、加快运算速度。同时,TPU使用了脉动阵列英语Systolic array的设计,用来优化矩阵乘法与卷积运算,减少I/O操作。此外,TPU还采用了更大的片上内存,以此减少对DRAM的访问,从而更大程度地提升性能。

Google在2016年的Google I/O年会上首次公布了TPU。不过在此之前TPU已在Google内部的一些项目中使用了一年多,如Google街景服务、RankBrain英语RankBrain以及其旗下DeepMind公司的围棋软件AlphaGo等都用到了TPU。而在2017年的Google I/O年会上,Google又公布了第二代TPU,并将其部署在Google云平台之上。第二代TPU的浮点运算能力高达每秒180万亿次。

世代

第一代

第一代的TPU使用8-bit矩阵乘法引擎,透过PCIe 3.0与CISC指令操作。芯片为28nm制程,die ≤ 331 mm,700 Mhz,功耗在28至40瓦。

第二代

第二代于2017年五月发表。

第三代

第三代于2018年五月发表。

www.zuoweixin.com
问题反馈联系QQ:暂无联系方式,也可发qq邮箱。