比特幣礦機(jī)比“天河二號”超算還快?專用芯片有多強(qiáng)?
之前回答一個問題,做了一點計算和分析,所得到的結(jié)果頗為出人意料:當(dāng)進(jìn)行SHA-256哈希運算(比特幣礦機(jī)所擅長的計算)時,一臺普通的神馬M20礦機(jī)就能比“天河二號”還快了,更不用說更先進(jìn)的礦機(jī),如螞蟻S19/S19 Pro。
本文引用地址:http://www.butianyuan.cn/article/202009/417780.htm一臺礦機(jī)竟然比超算還快?或者說,一臺超算(當(dāng)前世界排名第四)在進(jìn)行某些運算時還不如一臺普通的礦機(jī)?
是這樣的。
礦機(jī)比超算還快
首先要說,這二者其實沒有多少可比性。一個專用、一個通用;一個微小、一個龐大。
“天河二號”造價超過一億美元,占地720平方米,使用超過8萬顆Intel Xeon CPU,包含三百多萬個計算核心??捎糜谕瓿筛鞣N計算。
螞蟻S19比特幣礦機(jī):小小的個頭,售價一萬多元。具備強(qiáng)大的SHA-256哈希算力,只能用于比特幣及相關(guān)幣挖礦。
所以,只能對比這兩者的SHA-256哈希運算速度了:
螞蟻S19礦機(jī):其SHA-256運算速度可達(dá)95TH/s,也就是每秒可完成九千五百萬億次哈希運算
天河二號:每顆12核Intel至強(qiáng)CPU可提供約400MH/s算力,八萬顆Intel至強(qiáng)CPU(12核及57核兩種CPU)共能提供最大52TH/s,也就是每秒可完成五千二百萬億次哈希運算,實際上由于多核調(diào)度關(guān)系,還未必能達(dá)到這一峰值速度
所以,是的,一臺一萬多元的礦機(jī),在進(jìn)行特定哈希運算時,速度比一臺數(shù)億元的超級計算機(jī)還快!
那么,礦機(jī)為什么能這么快呢?
為什么能這么快
礦機(jī)的結(jié)構(gòu)并不復(fù)雜,能算這么快,靠的是大量的專用芯片。
比如螞蟻S19 Pro使用了大量的自研芯片 BM1398運算芯片。一臺礦機(jī)有三塊算法板,每塊算法板上安裝了114顆運算芯片。一臺礦機(jī)就有342顆芯片并行提供算力。
BM1398芯片是采用臺積電7納米工藝生產(chǎn)的,由于該芯片的架構(gòu)和數(shù)據(jù)保密,我們只好用一些開源信息來進(jìn)行估算。
github上有一個開源的SHA-256哈希運算模塊,提供Verilog源代碼,當(dāng)使用40納米工藝實現(xiàn)時,此模塊可以達(dá)到250MH/s(和一顆8核的至強(qiáng)芯片差的不多了),而所占用的面積只有0.0142平方毫米。如果在一顆芯片中排布100個SHA-256運算模塊,面積還不到2平方毫米,而性能已經(jīng)達(dá)到了25GH/s(沒有計算連接、總線等面積開銷)。而這僅僅是40納米工藝而已。
舉這個例子是想說明:芯片中真正用于計算的部分很少,絕大多數(shù)資源都消耗到了調(diào)度、管理等輔助功能上。
當(dāng)我們所用的功能清晰、明確時,就可以使用專用芯片極大的提高運算速度。比如各種數(shù)字幣挖礦(大量的哈希運算),比如4G和5G通信(大量的卷積運算),比如人工智能(大量的卷積運算)
專用芯片的性能往往超過我們的想象,而我們芯片的發(fā)展,也完全可以利用這一點。如果能降低芯片的流片成本,也未必不能復(fù)制PCB(印刷電路板)的發(fā)展歷程。要知道,現(xiàn)在全球的PCB設(shè)計和生產(chǎn),中國都占了一大半的份額,又有誰有本事卡脖子呢?
評論