下一代AI半導體競爭激烈,新興企業追趕英偉達
2024/01/08
在半導體領域,探索作為生成式AI(人工智慧)運算基礎的圖形處理器(GPU)的替代技術的動向正在加強。這是因為GPU原本是面向遊戲而發展的,存在電力消耗大的課題。加拿大和美國的新興企業開發出適合生成式AI的半導體,向GPU領域約佔80%份額的美國英偉達發起挑戰。
「希望成為第一個客戶」,力爭在日本代工最尖端半導體的日本Rapidus的社長小池淳義于11月宣佈,作為開拓客戶的第一步,將與設計開發AI半導體的加拿大Tenstorrent展開合作。在美國聖荷西市的聯合記者招待會上送出秋波的是Tenstorrent的首席執行官(CEO)吉姆·凱勒。
吉姆·凱勒(左)與小池淳義握手(11月,美國聖荷西市) |
凱勒先後任職於蘋果、特斯拉和AMD等美國企業,在各家企業參與了主力半導體的設計。在矽谷被稱為「傳説中的半導體工程師」。小池強調稱「被他選中在行業內具有重大意義」。
Rapidus計劃加深與無廠企業Tenstorrent的關係,在2025年投産的北海道千歲市的工廠承接後者設計開發的AI半導體的生産。希望重現過去英偉達和最大的半導體代工企業台積電(TSMC)借助分工體製取得的飛躍。
GPU有「弱點」
崇拜凱勒的技術人員陸續從大企業轉移到2016年成立的Tenstorrent,目前該公司有350名員工負責開發專門針對AI的半導體。2023年從南韓三星電子旗下的投資基金和現代汽車集團等成功籌集了1億美元資金。
對於英偉達具備優勢的GPU,凱勒斷言稱「不是為AI而設計的」。英偉達的GPU雖然擅長大量數據的並行處理,但原本是面向遊戲處理超高清圖像而開發的,要嵌入作為生成式AI基礎的數據中心的伺服器,存在很多弱點。
最大的問題是電力效率低下。由於在晶片上負責運算的運算器和存儲資訊的記憶體相互分離,GPU在數據交換方面耗費大量電力,而不是運算本身。有估算稱,被認為使用數萬個英偉達GPU的生成式AI「ChatGPT」每天的電費等運營成本按日元換算達到1億日元。
Tenstorrent正在開發的AI半導體通過讓運算器和記憶體位置靠近,縮短了數據的移動距離,減少了電力浪費。凱勒比喻稱,「在AI中,就像運算器相互對話一樣,將運算結果直接傳遞到下一個運算是很自然的事情」。
英偉達在決定半導體運作的「指令集」上使用英國ARM的技術,而Tenstorrent則採用了任何人都可以免費使用和修改的開源的「RISC-V」。目的在於控制授權費支出,同時也方便根據客戶的需求靈活變更半導體的設計。
凱勒表示,「對於想要開發價值數百萬日元的機器人的企業來説,數百萬日元的GPU就太貴了」。該公司正力爭開發除了節電性能之外、在價格方面也足以對抗英偉達的新一代AI半導體。
通過記憶體運算
目前生成式AI 處於發展階段,開發企業將大部分運算資源用在提高精度的「學習」上。今後,隨著ChatGPT等各種服務進入全面普及期,AI輸出問題答案等「推理」的運算所消耗的電力比重或將提高。還出現了專注於這一推理領域、致力於改善GPU課題的初創企業。
版權聲明:日本經濟新聞社版權所有,未經授權不得轉載或部分複製,違者必究。
報道評論
HotNews
・日本經濟新聞社選取亞洲有力企業為對象,編制並發布了日經Asia300指數和日經Asia300i指數(Nikkei Asia300 Investable Index)。在2023年12月29日之後將停止編制並發布日經Asia300指數。日經中文網至今刊登日經Asia300指數,自2023年12月12日起改為刊登日經Asia300i指數。