一個時代有一個時代的計算架構(gòu)
Can Machines Think?
這是阿蘭·圖靈在1950年論文《計算機(jī)器和智能》中的經(jīng)典提問,圍繞著圖靈的目標(biāo),軟件和硬件開啟了分頭行動。
軟件,以算法為核心,衍生出了神經(jīng)網(wǎng)絡(luò),并在深度學(xué)習(xí)的加持下,讓人工智能浪潮實現(xiàn)全面洶涌。
硬件,以芯片為載體,從CPU、GPU到各類AI芯片,從執(zhí)行人的計算程序,到像人一樣計算。芯片和AI,硬件和軟件,一個源頭流出的兩條大河,終于在此刻合流交匯。
但背后的驅(qū)動力也越來越明顯:
一個時代有一個時代的架構(gòu)。
現(xiàn)在,面向AI時代的計算架構(gòu),呼之欲出。
讓機(jī)器執(zhí)行人的思考和計算:從CPU到GPU要想知道未來到哪去,必先知道自己從哪兒來。
今天,一切智能機(jī)器無論大小,都少不了一塊CPU。正是這個好比“大腦”的東西,讓大大小小的硬件可以執(zhí)行人寫好的規(guī)則,實現(xiàn)各式各樣的功能。
世界首塊CPU誕生于1971年,但它的概念可以追溯到世界上第一臺具有現(xiàn)代意義的通用計算機(jī)——EDVAC身上。
EDVAC是ENIAC(世界第一臺電子計算機(jī))的小老弟,由馮·諾伊曼設(shè)計。EDVAC最大的改變之一,就是將計算機(jī)劃由運算器、控制器、存儲器、輸入和輸出這五個部分組成。
這就是著名的馮·諾伊曼架構(gòu)。從這個架構(gòu)里,我們就可以看到CPU的雛形。
——從彼時至今,無論CPU的具體實現(xiàn)怎么變、晶體管數(shù)量翻多少番,它的構(gòu)成始終由運算器、控制器和寄存器這三大部分組成。
其中,運算器也叫算術(shù)邏輯單元(ALU),負(fù)責(zé)算術(shù)運算和邏輯運算。寄存器細(xì)分為指令寄存器和數(shù)據(jù)寄存器等,負(fù)責(zé)暫存指令、ALU所需的操作數(shù)、ALU算出的結(jié)果等。
控制器則負(fù)責(zé)整體調(diào)度工作,包括對要執(zhí)行的指令進(jìn)行譯碼、從內(nèi)存中調(diào)取數(shù)據(jù)給寄存器、向運算器和寄存器發(fā)出具體操作指令等。
從上面這個分工我們也能看出CPU的大概工作流程,簡單來說就是這四步:
1、從內(nèi)存提取指令;2、解碼;3、執(zhí)行;4、寫回。
其中寫回到寄存器的結(jié)果,可供后續(xù)指令快速訪問。
看起來,整個流程沒有什么bug。
但仔細(xì)回看一下CPU三大組成的各自分工,可以發(fā)現(xiàn)控制器和寄存器是這里面要負(fù)責(zé)的東西最多、要存的東西最多的兩部分。
從下面這張CPU的簡略架構(gòu)圖也能看出,運算器“偏居一隅”,幾乎80%的空間都被控制單元和存儲單元占據(jù)。
這樣的設(shè)計就造成CPU最擅長的是邏輯控制,而非計算。
同時,依照馮·諾依曼架構(gòu)“順序執(zhí)行”的原則,“古板”的CPU只能執(zhí)行完一條指令再來下一條,計算能力進(jìn)一步受限。
當(dāng)然,你說CPU靈活性高、通用性強,我們可以將它進(jìn)行同構(gòu)并行。
但別忘了,單個CPU的性能上限就那么高、能容納的核數(shù)也有限,這種方法能挖掘的潛能實在有限。
所以,要是讓CPU來完成計算量動輒上億的AI任務(wù),實在是“愛莫能助”。就比如在自動駕駛領(lǐng)域,系統(tǒng)需要同時查看人行道、紅綠燈等路況,如果交給CPU來計算,總不能車都撞上了還沒算出來結(jié)果吧。
所以,針對CPU“拉垮”的計算能力,GPU站在了浪潮之巔。
正如其全稱“圖形計算單元”,GPU的初衷主要是為了接替CPU進(jìn)行圖形渲染的工作。
因為圖像上的每一個像素點都需要處理,這項任務(wù)計算量相當(dāng)大。尤其遇上一個復(fù)雜的三維場景,就需要在一秒內(nèi)處理幾千萬個三角形頂點和光柵化幾十億的像素。
不過,由于每個像素點處理的過程和方式相差無幾,這項艱巨的任務(wù)可以靠并行計算來化解。
而這恰好就是GPU最得天獨厚的優(yōu)勢,尤其以處理這種邏輯簡單、類型統(tǒng)一的瑣碎計算任務(wù)為甚。
GPU之所以擅長并行計算,從其架構(gòu)里就決定了。
GPU幾乎主要由計算單元ALU組成,僅有少量的控制單元和存儲單元。
這也就意味著,GPU可以擁有數(shù)百、數(shù)千甚至上萬核心來同時處理計算任務(wù),使計算的并行度得到成千上萬倍的提升——相比現(xiàn)在普通電腦最多8核CPU同時工作,這是一個多么恐怖的數(shù)字。
再舉一個最簡單的例子來直觀感受一下。
比如現(xiàn)在我們來計算一下5000個數(shù)相加之后的總和。
如果我們用CPU來算,即使派上8核CPU,每個核也需要計算625個數(shù);假設(shè)每計算一個數(shù)需要1s,即使8核并行計算,總共也需要625s。(這里暫時不考慮支持向量指令的CPU)而GPU,核心數(shù)成千上萬,計算5000個數(shù)字只需每核算1個數(shù),1s就能搞定。
625sVS1s,這是何等的差距。
除了并行計算能力,GPU的內(nèi)存帶寬也是CPU的幾十倍 ,決定了它將數(shù)據(jù)從內(nèi)存移動到計算核心的速度更快,整體計算性能更加讓CPU望塵莫及。
由于GPU的設(shè)計并沒有專門跟圖形綁定的邏輯,屬于一種通用的并行計算架構(gòu),所以除了圖像處理,它其實也非常適用于科學(xué)計算,乃至復(fù)雜的AI任務(wù)。
所以在2012年,當(dāng)Hinton及其弟子Alex Krizhevsky將其作為深度學(xué)習(xí)模型AlexNet的計算芯片,一舉贏得Image Net圖像識別大賽之后,GPU在AI領(lǐng)域的名聲就一炮打響。
而早就基于自家GPU推出了CUDA系統(tǒng)的英偉達(dá),又憑借著三年時間里將GPU性能提升65倍,并提供后端模型訓(xùn)練和前端推理應(yīng)用的全套深度學(xué)習(xí)解決方案,奠定了自己在該領(lǐng)域的王者地位。
直到今天,GPU也還是AI時代算力的核心、人工智能硬件領(lǐng)域的霸主。
然而,GPU屬于通用計算芯片和架構(gòu),并非專門為AI打造,無法實現(xiàn)性能和功耗的統(tǒng)一。它的計算能力越強代表核心越多,功耗也就越大。
比如RTX 4090,450W;比如今年9月剛上市的H100,直接史無前例,700W。這種情況還大有逐年攀升之勢。
還是拿自動駕駛舉例,在電車基本成為主流的當(dāng)下,如此高的功耗勢必對續(xù)航里程造成困擾。更別提越來越多的終端也開始具備AI能力(比如手機(jī)、智能音箱),它們不僅要求計算能力,對功耗的要求也更加嚴(yán)格,再強的GPU在這里也顯得很弱勢。
另外,一些更復(fù)雜的AI場景(如云端推理、模型訓(xùn)練等),常常動輒就需要上百塊GPU一起運算,這讓整個計算平臺的功耗控制也是相當(dāng)棘手。很多機(jī)構(gòu)不得不考慮能源和環(huán)保問題。
這不,今年7月誕生的目前最大的多語言開源模型BLOOM,就動用了384塊A100煉成,釋放的熱量最終都用來給學(xué)校供暖了。
所以,綜上來看,CPU和GPU的出現(xiàn),雖然幫助機(jī)器擁有了執(zhí)行人的思考和計算的能力,尤其后者讓AI計算任務(wù)得到了相當(dāng)大的加速,但一些缺點還是讓它們無法大展身手。
因此要想讓機(jī)器像人一樣思考和計算,通用計算芯片的架構(gòu)決定了不會是最佳方案。
讓機(jī)器像人一樣思考和計算:AI芯片大爆發(fā)數(shù)據(jù)驅(qū)動的方式方法,讓機(jī)器像人一樣思考和計算展現(xiàn)了可能。
但背后的計算需求,也讓過去的計算架構(gòu)越顯強弩之末。
據(jù)統(tǒng)計,光是在2012年到2018年的六年時間里,人們對于算力的需求增長了就超過30萬倍。也就說,每3.5個月AI算力就大約翻一倍。如今這個數(shù)字還在繼續(xù)攀升。
所謂“通不如精”,以CPU和GPU為代表的通用計算芯片架構(gòu),已經(jīng)無法很好地匹配和滿足這一需求,所以在各類新AI技術(shù)層出不窮的同時,新計算、新架構(gòu)、新芯片在過去幾年也迎來了前所未有的大爆炸。
因此這幾年,我們看到了很多除了CPU和GPU以外的各種“xPU”,諸如谷歌TPU、Graphcore IPU、特斯拉NPU、英偉達(dá)DPU……
盡管它們的分類不同,有的屬于半定制化的FPGA,有的屬于全定制化的ASIC,有的應(yīng)用于終端,有的應(yīng)用于云端……但作為專門為AI任務(wù)和需求而生的新芯片,它們都有著比CPU/GPU功耗低、計算性能高、成本更低等優(yōu)勢,落地到哪里就給哪里帶去了翻天覆地的變化,比如最近幾年的智能手機(jī)、自動駕駛、機(jī)器人、VR等領(lǐng)域。
按照能力和用途,這些AI芯片們在這個過程中上演了這樣兩個階段:
首先是僅作為加速器,輔助CPU完成HPC、模型訓(xùn)練/推理等AI任務(wù)。
(AI芯片幾乎都不具有圖靈完備,所以必須要和CPU一起搭配使用,這也是所謂的“異構(gòu)融合”大趨勢。)
它們的結(jié)構(gòu)類似串聯(lián),可以用“CPU+xPU”這樣的公式來表達(dá)。
這一組合最經(jīng)典的其實就是CPU+GPU,它倆到現(xiàn)在其實也還在流行。
只不過如前面所說,GPU不算專門為AI設(shè)計的芯片,無法在這一領(lǐng)域發(fā)揮出極致的性能,所以這里的xPU更多的指TPU、IPU、DPU等AI加速芯片。
(當(dāng)然,GPU還是自有它的用處,所以它有時也會加入進(jìn)來,形成“CPU+GPU+xPU”的結(jié)構(gòu)。)
這一模式最大的特點就是,CPU只負(fù)責(zé)少量的計算,一般為那些情況比較復(fù)雜、計算難度不確定、靈活性要求高的部分;大部分“臟活累活”都由計算能力超強、能耗又沒那么高的xPU來完成。
就如下圖所示,在實際情況中,它們的分工很可能遵守“二八定律”——xPU負(fù)責(zé)整個系統(tǒng)80%的計算任務(wù),剩下的20%由CPU+GPU分擔(dān),其中GPU的比例又高達(dá)16%,留給CPU的只剩下4%。
如果進(jìn)行軟硬件融合的進(jìn)一步優(yōu)化,三者之間的比例還可能變動為90%、9%和1%。
這樣各司其職、各揮所長的安排可以保證最極致的性能和性價比,做到從前CPU和GPU單上無法企及的高度。
其次,AI芯片作為專用芯片,針對專門的領(lǐng)域推出,負(fù)責(zé)某一特定AI任務(wù)的計算。
(說通俗點,就是某一塊專用芯片能在自動駕駛領(lǐng)域使用,換了機(jī)器人領(lǐng)域就不行)。
在這種模式下,各xPU已成為各系統(tǒng)的主角,決定該系統(tǒng)的整體性能和效果。
這就導(dǎo)致一些自動駕駛公司,在宣傳它們的技術(shù)時,只把xPU拉出來大肆宣傳,基本不提CPU和GPU的事兒了。
那么CPU在干嘛?當(dāng)然是利用自己擅長的邏輯控制來把控整個流程。
因此此時,CPU和AI芯片的關(guān)系更像一種并聯(lián)結(jié)構(gòu),我們就可以用“CPU、xPU”的公式來表達(dá)(當(dāng)然,GPU也仍然可能參與其中)。
如前面所說,由于CPU基本不決定計算性能,我們也就不用再寄希望于CPU的戰(zhàn)斗力有多強。
進(jìn)一步地,我們可以認(rèn)為,這種模式其實是將通用計算芯片的核心地位削減了——CPU的地位又變了。
那么,成為“中流砥柱”的AI芯片們究竟有多大威力?我們來看3個案例。
首先是云端。
在這個領(lǐng)域,互聯(lián)網(wǎng)巨頭們有著“本土作戰(zhàn)”的優(yōu)勢,因此大多可以不依賴英偉達(dá)等傳統(tǒng)巨頭。
如谷歌2015年就推出了自己的云端加速AI芯片TPU。
它的中文名叫張量處理器,屬于ASIC芯片的一種,專為加速深度學(xué)習(xí)框架TensorFlow而設(shè)計。
得益于用量化技術(shù)進(jìn)行8位整數(shù)運算、脈動陣列、基于復(fù)雜指令集(CISC)等設(shè)計,它與同期的CPU和GPU相比(英特爾至強E5-2699 v3與Tesla K80 GPU),可以提供大約15-30倍的性能提升。
如下圖所示,當(dāng)將延遲全部控制在7毫秒之內(nèi)時,TPU每秒可運行的MLP0預(yù)測可達(dá)22.5萬次。同等情況下,CPU只有5000多,GPU也僅為1.3萬+。
效率方面(性能/瓦特)的提升也高達(dá)30-80倍:
(谷歌第一代TPU功耗約為40W,性能最強的第四代也只有175W,而同時期的A100已達(dá)400W。)
這樣的成績意味著它既可以大規(guī)模運行于最先進(jìn)的神經(jīng)網(wǎng)絡(luò),也可以同時把成本控制在可接受的程度上。
△ TPU在以上6種神經(jīng)網(wǎng)絡(luò)中的CNN1上表現(xiàn)最好,性能是GPU的26倍它的出現(xiàn),不僅打破了深度學(xué)習(xí)硬件執(zhí)行的瓶頸,也在一定程度上撼動了英偉達(dá)等傳統(tǒng)巨頭的地位。
谷歌也對它重用有加,搜索、街景、照片、翻譯等服務(wù)以及AlphaGo背后的神經(jīng)網(wǎng)絡(luò)計算,都交由它來完成。TPU的出現(xiàn),成為了AI時代云端計算需求的代表性解決方案。
終端方面,最具代表性的場景是AI司機(jī)變革下的汽車領(lǐng)域,即自動駕駛。
目前,自動駕駛芯片有兩條主要技術(shù)路線:
一是英偉達(dá)Orin靠“魔改”GPU所走的通用架構(gòu)路線;另一個是特斯拉、高通、Mobileye等青睞的專用芯片技術(shù)路線,也就是CPU+(GPU)+xPU的形式。
比如特斯拉FSD芯片就是主要由CPU、GPU和NPU組成。
△ 圖源wikichip,特斯拉FSD芯片die shot圖其中,NPU是里面占比最大的處理器,是整個架構(gòu)的重點。
它是由特斯拉硬件團(tuán)隊自研的一種ASIC芯片,主要用來對視覺算法中的卷積運算和矩陣乘法運算進(jìn)行有效加速。
具體來看,每塊NPU的運行頻率為2GHz,峰值性能可達(dá)每秒36.86萬億次運算(TOPs),總功耗卻僅為7.5W。
所以,正是從特斯拉開始,專為自動駕駛所需的神經(jīng)網(wǎng)絡(luò)打造的NPU開始成為汽車芯片的主要組成部分,傳統(tǒng)的通用芯片CPU、GPU開始退居輔助位置。
國內(nèi)方面,唯一實現(xiàn)車載智能芯片大規(guī)模前裝量產(chǎn)的地平線,其代表芯片征程系列,也是采用“CPU+ASIC”的技術(shù)路線,ASIC部分用的是自研的BPU。
它的使用使最新的征程5芯片算力達(dá)到了128TOPS,功耗也只有30W。
由此,征程5靠4.3TOPS/W能耗比,一舉超過了特斯拉FSD(2TOPS/W)、也超過了2022年高端智能電動車標(biāo)配的英偉達(dá)Orin(3.9TOPS/W)。
這種性能和功耗展現(xiàn)出的對比,甚至是標(biāo)志性的。背后是芯片架構(gòu)在AI時代正在發(fā)生的變化趨勢:
CPU在其中的作用和地位一直在變化,而這其實反映的是AI時代計算架構(gòu)客觀需求的進(jìn)化——
一開始是完全規(guī)則驅(qū)動,只有CPUGPU等通用計算芯片進(jìn)行發(fā)力,但由于架構(gòu)的規(guī)則都是被寫死的,無法適應(yīng)越來越快的算力需求;
于是開始了半規(guī)則驅(qū)動,CPUGPU等通用計算芯片的核心能力繼續(xù)發(fā)力,但已開始有專用芯片的介入,讓AI計算架構(gòu)不再依賴于完全寫死的規(guī)則,相對靈活地發(fā)揮出價值;
再到后來,便開啟了自定義規(guī)則驅(qū)動的階段,此時專用型AI芯片占據(jù)核心地位,CPU/GPU僅僅作輔助之用,AI計算架構(gòu)獲得最大的自由度。
而我們的機(jī)器也終于能夠從執(zhí)行人的思考和計算,越來越接近像人一樣思考和計算。
但這還不是終點。
終極計算架構(gòu):Neural Computing終點是什么?不同視角會有不同的答案。
最近正在被更多人認(rèn)同的是:Neural Computing,神經(jīng)網(wǎng)絡(luò)架構(gòu),或者說神經(jīng)網(wǎng)絡(luò)統(tǒng)一架構(gòu)。
即一個大一統(tǒng)的神經(jīng)網(wǎng)絡(luò)計算架構(gòu),一套架構(gòu)驅(qū)動所有場景、領(lǐng)域或任務(wù),比如圖像處理、視頻編解碼、圖像的生成、渲染,只需要很少的一點點改動或者一點點算法的調(diào)優(yōu),就能解決各式各樣的問題。
其特點,就是用技術(shù)驅(qū)動的方式去集成少量的規(guī)則,讓硬件因軟件而打造,軟件為實現(xiàn)算法而生,這樣更符合AI算法模型和任務(wù)的特點,也才能真正讓模型躍遷驅(qū)動性能躍遷。而不再是傳統(tǒng)的用硬件迭代解決問題。
而且這種方法論,不只是單純的展望,因為正在被實踐。
比如智能車載芯片,不僅用神經(jīng)網(wǎng)絡(luò)做了分割、檢測和識別等語義級信息,而且能夠清晰地看到一個趨勢,包括ISP(Image Signal Processing)這樣的圖像處理任務(wù),也都能夠用神經(jīng)網(wǎng)絡(luò)實現(xiàn)了。
而業(yè)內(nèi),視頻編解碼相關(guān)的方法,神經(jīng)網(wǎng)絡(luò)也比傳統(tǒng)方式實現(xiàn)得更好,信噪比更優(yōu)異。
這兩年火爆的NeRF,涉及到過去非??简炗布芰Φ膱D像渲染,需要基于光線追蹤等等圖形學(xué)理論建立復(fù)雜規(guī)則的算法,也都被證明神經(jīng)網(wǎng)絡(luò)可以做得更好。
甚至用的還是很簡單的神經(jīng)網(wǎng)絡(luò)計算方法,通過學(xué)習(xí)再推理的方式重構(gòu)整個過程,把過去花費大力氣求解的3D點云恢復(fù)重建等問題,更直接高效解決,實力和潛力,都不言自明了。
更重要的是,這種實踐被放到了一個更具時代變革的趨勢上:計算架構(gòu)領(lǐng)域到了一個分久必合的時候,到了一個傳統(tǒng)馮諾依曼架構(gòu)亟待突破的時候。
這是兩個時代的劃分,背后是人與機(jī)器關(guān)系的兩種范式。
1.0時代,依賴于經(jīng)驗和規(guī)則,把人類理性分析轉(zhuǎn)換成計算機(jī)可具體執(zhí)行的規(guī)則代碼,不僅定義目標(biāo),也定義整個執(zhí)行的過程。
這個時代里有很多經(jīng)典的算法排序,會告訴機(jī)器每一步做什么,以及怎么做。CPU和GPU都是這個時代里的集大成者。
2.0時代,依靠的是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和迭代,人類提目標(biāo)、要求,有時目標(biāo)甚至?xí)且粋€大致的方向和框架,但機(jī)器會在神經(jīng)網(wǎng)絡(luò)驅(qū)動下,搞清楚如何去執(zhí)行,如何圍繞目標(biāo)求解最優(yōu)解——機(jī)器有了自主性。于是就得從算法、架構(gòu)到芯片確保機(jī)器的這種自主性。
1.0時代可以很多精細(xì)的規(guī)則、后處理、后融合,把所有人類對于具體場景任務(wù)的know-how變成計算機(jī)可嚴(yán)格執(zhí)行的代碼,再與“摩爾定律”和硬件革新配合,做到極致的高效。
然而AI模型范式下對數(shù)據(jù)的需求,以及先進(jìn)制程的瀕臨極限,摩爾定律失效已然是再明顯不過的事實。
所以計算架構(gòu)和范式,一定會進(jìn)入2.0時代,人類架構(gòu)的是神經(jīng)網(wǎng)絡(luò)模型,模型自己去求解目標(biāo)和結(jié)果,整個過程不再依賴人寫死的規(guī)則和經(jīng)驗。這會是軟件、硬件到認(rèn)知方法方方面面的根本性改變——傳統(tǒng)的計算架構(gòu)不再適用。
這種對自主機(jī)器到來的判斷,實際也能理解很多新現(xiàn)象。
比如馬斯克為什么把特斯拉的下一步,定在機(jī)器人形態(tài)上。
百度創(chuàng)始人李彥宏,把自動駕駛、智能車,放在了“汽車機(jī)器人”的維度上思考和談?wù)摗?/p>
以及當(dāng)前以智能車載芯片知名的地平線,全名里為啥是“機(jī)器人技術(shù)”。
因為一旦沿著AI落地展開思考和推演,最后能作為獨立品類、物種展現(xiàn)AI核心變革力的,有且只有機(jī)器人,或者說就是自主機(jī)器人。
它可以是家里掃地的那種,可以是提供自動駕駛出行的那種,也可以是仿照人類形體而生的那種——從感知到控制都有自主權(quán),會是邊緣的而非云端的,會是去中心化的而非中心化的。
而既然自主機(jī)器人是AI最終的歸屬,那更本質(zhì)的要打造的產(chǎn)品,就是驅(qū)動這個自主機(jī)器人的大腦,就是處理器,或者更本質(zhì)地說是計算架構(gòu)。
這個本質(zhì)問題的搞清楚,也能理解整個芯片半導(dǎo)體、信息計算產(chǎn)業(yè)的興衰規(guī)律。
按照經(jīng)濟(jì)學(xué)的觀點說,需求決定了供應(yīng),經(jīng)濟(jì)基礎(chǔ)決定了上層建筑。
這也是為什么一個時代會有一個時代的芯片,因為一個時代會有一個時代的計算架構(gòu)。
既然神經(jīng)網(wǎng)絡(luò)已經(jīng)開啟了“機(jī)器像人一樣思考和計算”的變革,那固化執(zhí)行人類思考和計算過程的架構(gòu),注定讓出中心地位,通用計算芯片也會逐漸失去主導(dǎo)權(quán)。
One more thing這種無情的歷史變遷,也讓另一個知名類比更具現(xiàn)實骨感。
在AI浪潮洶涌的熱潮中,CPU一而再被質(zhì)疑,一而再被挑戰(zhàn),后來英特爾的高管給出了極具中國色彩的比喻——
“CPU是所有XPU平臺的中央神經(jīng)系統(tǒng),這就有點像中國人的主食米飯,別的XPU都是菜,不同地方的人喜歡不同的菜,但他們都需要和大米來搭配?!?/strong>
這個類比,彼時彼刻,不得不承認(rèn)既形象又巧妙。
只是比喻后來也跟此時此刻一樣精準(zhǔn):追求低碳水的新時代里,誰也沒想到,米飯竟然不再必要了。
來源:量子位
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。