第572章 TPU原班团队全新AI架构,晶体管性能提…(1 / 2)

加入书签

2016年底,谷歌TP团队的位核心发者中八位悄离职,办了一名为Grq的机学习系公司。此后的年里,家公司直很低。但最,他们着一款为TSP的芯片构出现公众视里。

TSP的称是TensrStreingPessr,专为机学习等AI相关求打造。该架构单块芯上可以现每秒1000亿(10的15方)次算,是球首个现该级性能的构,其点运算能可达秒250万亿次(TFLOPS)。在摩尔律走向亡的背下,这架构的世标志芯片之从晶体转向架

250TFLOPS点运算能是什概念?前的世第一超计算机Sit,峰值算为200,794.9TFLOPS,它的后是28,000块英伟VltGP。如TSP到了类的效率,仅需803块就以实现样的性

Grq在一白皮书介绍了项全新架构设。此外,他们还在于美丹佛举的第23届国际算高峰坛上展这一成

们为这行业和们的客感到兴,」Grq的联创始人CEOJnthnRss示。「级GP司都在称他们望在未几年向户交付款每秒万亿次算性能产品,Grq在就做了,而建立了个新的能标准。就低延和推理度而言,Grq架构比他任何于推理架构都快许多。我们用户的动证明这一点。」

Grq的TSP架构专为计机视觉、机器学和其他AI相关作负载性能要设计的。「对于大批需深度学推理运的应用说,Grq的解方案是常理想选择,」Grq首席架师DennisAbts示,「除此之,Grq的架构能用于广泛的工负载。的性能简洁性使其成为有高性即数据计算密型工作杂的理平台。」

一款「简单」AI芯架构

Grq的款架构到「软优先」(first)理的启发。它在Grq开发TSP实现,实现计灵活性大规模行计算供了一新的范,但没传统GP和CP构的限和沟通销。

「软件优」的硬设计理

在Grq的架中,Grq编译负责编所有内:数据入芯片,并在正的时间正确的点插入,以确保算实时行,没停顿。行规划软件负,这样可以释出原本用于动指令执的宝贵件资源。

这使Grq芯片性具有确性。编器动态重新配硬件来行每个算,因编译器芯片之没有抽()。于编译了解硬和每条令的速,所以可以准地告诉件做什,什么候做。

在传统体系架中,将据从DRAM移到处理需要大的算力时间,且相同作负载的处理能也是变的。典型的作流中,开发人通过反运行工负载或序来对进行配和测试,以验证度量其均处理能。由处理器收和发数据的式不同,这种处可能会到略有别的结,而开人员的作就是动调整序以达预定的靠性级

了Grq的硬件软件,译器就以准确知道芯的工作式以及行每个算所需时间。译器在确的时将数据指令移到正确位置,样就不有延迟。到达硬的指令是完全排好的,使得处速度更,而且预测。

开发人可以在Grq芯上运行同的模100,每次到的结都完全同。对安全和确性要都非常的应用说(如动驾驶车),种计算的准确至关重

,使用Grq硬设计的统不会到长尾迟的影,AI统可以特定的率或延预算内行调整。

这种件优先设计(编译器定硬件构)理帮助Grq设计了一款单、高能的架,可以速推理程。

↑返回顶部↑

书页/目录