其次,“Anaconda”主機的目標是達到12 teraflops(每秒12萬億次浮點運算)的性能。而普通版主機“Lockhart”的目標是達到4 teraflops(每秒4萬億次浮點運算)。這兩款主機都有8個CPU核心,CPU主頻計劃設定在3.5 GHz。當然了“Anaconda”主機的CPU主頻肯定要比“Lockhart”高一點。
以上的參數(shù)非常重要,盡管外媒并沒有透露“Anaconda”主機的“12萬億次浮點運算”到底是雙精度浮點單元還是單精度浮點單元,但無論是雙精度浮點單元還是單精度浮點單元,“12萬億次浮點運算”這個數(shù)字都是很恐怖的。

讓我們來做一個假設,先保守一點,如果12 teraflops是指單精度浮點單元,這意味著什么呢?

我們知道,英偉達的RTX系列顯卡采用了圖靈架構,帕斯卡架構每個SM陣列集成128個FP32浮點單元,圖靈架構則改成了2個FP64雙精度浮點單元、64個FP32單精度浮點單元、64個INT32整數(shù)單元、8個Tensor核心、一個RT核心。支持浮點和整數(shù)并發(fā)操作,并有新的執(zhí)行數(shù)據(jù)路徑,類似伏特架構匯總的獨立線程調(diào)度。
整體而言,圖靈核心的CUDA陣列可以每秒執(zhí)行14萬億次FP32浮點操作、14萬億次INT32整數(shù)操作。
