比特幣礦機(jī)比“天河二號(hào)”超算還快?專用芯片有多強(qiáng)?
之前回答一個(gè)問題,做了一點(diǎn)計(jì)算和分析,所得到的結(jié)果頗為出人意料:當(dāng)進(jìn)行SHA-256哈希運(yùn)算(比特幣礦機(jī)所擅長(zhǎng)的計(jì)算)時(shí),一臺(tái)普通的神馬M20礦機(jī)就能比“天河二號(hào)”還快了,更不用說(shuō)更先進(jìn)的礦機(jī),如螞蟻S19/S19 Pro。
本文引用地址:http://butianyuan.cn/article/202009/417780.htm一臺(tái)礦機(jī)竟然比超算還快?或者說(shuō),一臺(tái)超算(當(dāng)前世界排名第四)在進(jìn)行某些運(yùn)算時(shí)還不如一臺(tái)普通的礦機(jī)?
是這樣的。
礦機(jī)比超算還快
首先要說(shuō),這二者其實(shí)沒有多少可比性。一個(gè)專用、一個(gè)通用;一個(gè)微小、一個(gè)龐大。
“天河二號(hào)”造價(jià)超過一億美元,占地720平方米,使用超過8萬(wàn)顆Intel Xeon CPU,包含三百多萬(wàn)個(gè)計(jì)算核心??捎糜谕瓿筛鞣N計(jì)算。
螞蟻S19比特幣礦機(jī):小小的個(gè)頭,售價(jià)一萬(wàn)多元。具備強(qiáng)大的SHA-256哈希算力,只能用于比特幣及相關(guān)幣挖礦。
所以,只能對(duì)比這兩者的SHA-256哈希運(yùn)算速度了:
螞蟻S19礦機(jī):其SHA-256運(yùn)算速度可達(dá)95TH/s,也就是每秒可完成九千五百萬(wàn)億次哈希運(yùn)算
天河二號(hào):每顆12核Intel至強(qiáng)CPU可提供約400MH/s算力,八萬(wàn)顆Intel至強(qiáng)CPU(12核及57核兩種CPU)共能提供最大52TH/s,也就是每秒可完成五千二百萬(wàn)億次哈希運(yùn)算,實(shí)際上由于多核調(diào)度關(guān)系,還未必能達(dá)到這一峰值速度
所以,是的,一臺(tái)一萬(wàn)多元的礦機(jī),在進(jìn)行特定哈希運(yùn)算時(shí),速度比一臺(tái)數(shù)億元的超級(jí)計(jì)算機(jī)還快!
那么,礦機(jī)為什么能這么快呢?
為什么能這么快
礦機(jī)的結(jié)構(gòu)并不復(fù)雜,能算這么快,靠的是大量的專用芯片。
比如螞蟻S19 Pro使用了大量的自研芯片 BM1398運(yùn)算芯片。一臺(tái)礦機(jī)有三塊算法板,每塊算法板上安裝了114顆運(yùn)算芯片。一臺(tái)礦機(jī)就有342顆芯片并行提供算力。
BM1398芯片是采用臺(tái)積電7納米工藝生產(chǎn)的,由于該芯片的架構(gòu)和數(shù)據(jù)保密,我們只好用一些開源信息來(lái)進(jìn)行估算。
github上有一個(gè)開源的SHA-256哈希運(yùn)算模塊,提供Verilog源代碼,當(dāng)使用40納米工藝實(shí)現(xiàn)時(shí),此模塊可以達(dá)到250MH/s(和一顆8核的至強(qiáng)芯片差的不多了),而所占用的面積只有0.0142平方毫米。如果在一顆芯片中排布100個(gè)SHA-256運(yùn)算模塊,面積還不到2平方毫米,而性能已經(jīng)達(dá)到了25GH/s(沒有計(jì)算連接、總線等面積開銷)。而這僅僅是40納米工藝而已。
舉這個(gè)例子是想說(shuō)明:芯片中真正用于計(jì)算的部分很少,絕大多數(shù)資源都消耗到了調(diào)度、管理等輔助功能上。
當(dāng)我們所用的功能清晰、明確時(shí),就可以使用專用芯片極大的提高運(yùn)算速度。比如各種數(shù)字幣挖礦(大量的哈希運(yùn)算),比如4G和5G通信(大量的卷積運(yùn)算),比如人工智能(大量的卷積運(yùn)算)
專用芯片的性能往往超過我們的想象,而我們芯片的發(fā)展,也完全可以利用這一點(diǎn)。如果能降低芯片的流片成本,也未必不能復(fù)制PCB(印刷電路板)的發(fā)展歷程。要知道,現(xiàn)在全球的PCB設(shè)計(jì)和生產(chǎn),中國(guó)都占了一大半的份額,又有誰(shuí)有本事卡脖子呢?
評(píng)論