應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

晶圓級新芯片會引領(lǐng)一個新時代嗎?

2020-11-25 09:32 半導體行業(yè)觀察

導讀:?計算機芯片的歷史是是一段激動人心的微型化的歷史。

眾所周知,數(shù)字世界催生了一種趨勢,規(guī)模越小越好。那么,為什么在地球上有些人想逆轉(zhuǎn)航向,并使用大芯片呢?當然,我們沒有特別充分的理由在一個iPad中用一個iPad大小的芯片,不過這樣的大芯片可能被證明是具有更具體的用途,如人工智能和物理世界的模擬。

至少,這就是世界上最大的計算機芯片制造商Cerebras所希望的。

Cerebras晶圓級引擎無論以何種方式進行切割都非常龐大。該芯片的是8.5英寸,并裝有1.2萬億個晶體管。而排名第二大的芯片是NVIDIA的GPUA100,只有一英寸,晶體管數(shù)量也只有540億個。前者是新的芯片類型,基本上未經(jīng)測試,到目前為止,他們推出的芯片也是唯一的一款。后者廣受喜愛,已大量生產(chǎn),并在過去十年中接管了AI和超級計算的世界。

新芯片會引領(lǐng)一個新時代嗎?讓我們來細看一下。

超越人工智能的大芯片

去年,當 Cerebras的芯片首次脫穎而出時 ,該公司表示其將大大加快深度學習模型的訓練速度。

從那時起,WSE進入了少數(shù)超級計算實驗室,該公司的客戶正在不斷努力。其中一個實驗室,即國家能源技術(shù)實驗室,正在尋找它在人工智能之外還能做什么。

因此,在最近的一項試驗中,研究人員將芯片與流體動力學模擬中的超級計算機相提并論,該芯片位于一個稱為CS-1的一體式系統(tǒng)中。模擬流體的運動是一種通用的超級計算機應(yīng)用程序,可用于解決諸如天氣預報和飛機機翼設(shè)計之類的復雜問題。

該試驗由Cerebras的Michael James和NETL的Dirk Van Essendelft領(lǐng)導的團隊進行,在他們撰寫的預印本論文作了描述,并在本周的 SC20 超級計算會議上發(fā)表。研究小組說,CS-1完成了電廠的燃燒模擬,任務(wù)的速度比Joule 2.0超級計算機快200倍。

CS-1實際上比實時更快。正如 Cerebrus在博客文章中寫道: “它可以告訴您未來將發(fā)生什么,而物理定律不會產(chǎn)生相同的結(jié)果?!?/p>

研究人員說,CS-1的性能是任何數(shù)量的CPU和GPU都無法比擬的。該公告首席執(zhí)行官兼聯(lián)合創(chuàng)始人 Andrew Feldman 告訴 VentureBeat ,“無論超級計算機有多大,該理論都是正確的”。在某種程度上,對像Joule這樣的超級計算機進行擴展在這種問題上不再產(chǎn)生更好的結(jié)果。因此, Joule的仿真速度達到 了16,384個內(nèi)核的 峰值 ,但這只是其全部86,400個內(nèi)核的一小部分。

通過 對兩臺機器的比較,可以得出 結(jié)論。Jouel是世界上第 81快的超級計算機 ,占用數(shù)十個服務(wù)器機架,消耗高達450千瓦的功耗,并且需要數(shù)千萬美元的建造費用。相比之下,CS-1安裝在服務(wù)器機架的三分之一中,消耗20千瓦的功耗,售價僅為幾百萬美元。

盡管這項任務(wù)非常小巧(但很有用),而且問題非常適合CS-1,但它仍然是一個非常驚人的結(jié)果。那他們怎么做到的呢?這t全部都體現(xiàn)在設(shè)計中。

減少通信

計算機芯片的生命始于一個稱為晶圓的大硅片上。將多個芯片蝕刻到同一晶圓上,然后將晶圓切割成單個芯片。當WSE也被蝕刻到硅晶圓上時,該晶圓將作為一個單獨的操作單元完整保留。該晶圓級芯片包含近40萬個處理核心。每個內(nèi)核都連接到其自己的專用存儲器及其四個相鄰內(nèi)核。

將這么多內(nèi)核放在一個芯片上并為其提供自己的內(nèi)存是WSE能做到這么大的原因。這也是為什么在這種情況下,芯片表現(xiàn)更好的原因。

大多數(shù)大型計算任務(wù)都依賴于大規(guī)模并行處理。研究人員在數(shù)百或數(shù)千個芯片中分配任務(wù)。這些芯片需要協(xié)同工作,因此它們之間保持著不斷的通信,來回傳遞信息。當信息在進行計算的處理器內(nèi)核和共享內(nèi)存之間存儲信息時,每個芯片內(nèi)部都會發(fā)生類似的過程。

這是一個d帶點兒懷餓舊公司,在紙上做它的所有業(yè)務(wù)。

該公司使用快遞公司從鎮(zhèn)上其他分支機構(gòu)和檔案中發(fā)送和收集文檔??爝f員知道穿過城市的最佳路線,但行程只需要最少的時間,具體取決于分支機構(gòu)和檔案館之間的距離,快遞員的最高速度以及路上有多少其他快遞員。簡而言之,距離和交通會減慢速度。

現(xiàn)在,想象一下公司正在建造一座嶄新的閃亮摩天大樓。每個分支機構(gòu)都搬進了新大樓,每個工人在辦公室里都有一個小的文件柜來存儲文件?,F(xiàn)在,他們需要的任何文檔都可以在跨辦公室或穿過大廳到達鄰居辦公室所需的時間進行存儲和檢索。信息通信幾乎消失了,因為一切都在同一個房子里。

Cerebras的巨型芯片有點像那座摩天大樓。與需要聯(lián)網(wǎng)大量傳統(tǒng)芯片的傳統(tǒng)超級計算機相比,它傳遞信息的方式(通過其專門定制的編譯軟件進一步輔助)更加高效。

模擬世界的發(fā)展

值得注意的是,該芯片只能處理足夠小的問題以適合晶圓。但是,由于機器能夠?qū)崟r進行高保真模擬,因此此類問題可能具有相當實際的應(yīng)用。作者指出,該機器在理論上應(yīng)該能夠準確地模擬試圖降落在駕駛艙上的直升機周圍的氣流,并使該過程半自動化-這是傳統(tǒng)芯片無法做到的。

他們指出,另一個機會是使用模擬作為輸入來訓練也駐留在芯片上的神經(jīng)網(wǎng)絡(luò)。在一個引人入勝的相關(guān)示例中,最近 證明 ,加州理工學院的機器學習技術(shù)在求解相同種類的偏微分方程以模擬流體動力學時, 速度快 了 1000倍 。

他們還指出,芯片的改進(以及其他類似的產(chǎn)品,如果有的話)將可完成工作的極限繼續(xù)往前推進。Cerebras已經(jīng)搶先 發(fā)布了其下一代芯片 ,該 芯片 將具有2.6萬億個晶體管,850,00個內(nèi)核以及兩倍以上的內(nèi)存。

當然, 晶圓級計算 是否 真正起飛 還有待觀察。這個想法已經(jīng)存在了幾十年,但是Cerebras是第一個認真追求它的人。顯然,他們相信他們已經(jīng)以一種有用且經(jīng)濟的方式解決了這個問題。

其他新架構(gòu)也正在實驗室中進行研究。例如, 基于憶阻器的神經(jīng)形態(tài)芯片 通過將處理和記憶放入單個類似晶體管的組件中來模仿大腦。當然,量子計算機位于單獨的通道中,但是可以解決類似的問題。

可能其中一種技術(shù)最終興起來統(tǒng)治所有這些技術(shù)?;蛘撸@似乎很有可能,計算可能會分裂成一堆怪異的基本芯片,根據(jù)情況將它們?nèi)糠庋b在一起以充分利用每個芯片。