下一代AI半導體競爭激烈,新興企業追趕英偉達

2024/01/08


      在半導體領域,探索作為生成式AI(人工智慧)運算基礎的圖形處理器(GPU)的替代技術的動向正在加強。這是因為GPU原本是面向遊戲而發展的,存在電力消耗大的課題。加拿大和美國的新興企業開發出適合生成式AI的半導體,向GPU領域約佔80%份額的美國英偉達發起挑戰。

 

       「希望成為第一個客戶」,力爭在日本代工最尖端半導體的日本Rapidus的社長小池淳義于11月宣佈,作為開拓客戶的第一步,將與設計開發AI半導體的加拿大Tenstorrent展開合作。在美國聖荷西市的聯合記者招待會上送出秋波的是Tenstorrent的首席執行官(CEO)吉姆·凱勒。

 

吉姆·凱勒(左)與小池淳義握手(11月,美國聖荷西市)

 

       凱勒先後任職於蘋果、特斯拉和AMD等美國企業,在各家企業參與了主力半導體的設計。在矽谷被稱為「傳説中的半導體工程師」。小池強調稱「被他選中在行業內具有重大意義」。

 

       Rapidus計劃加深與無廠企業Tenstorrent的關係,在2025年投産的北海道千歲市的工廠承接後者設計開發的AI半導體的生産。希望重現過去英偉達和最大的半導體代工企業台積電(TSMC)借助分工體製取得的飛躍。

 

       GPU有「弱點」

 

       崇拜凱勒的技術人員陸續從大企業轉移到2016年成立的Tenstorrent,目前該公司有350名員工負責開發專門針對AI的半導體。2023年從南韓三星電子旗下的投資基金和現代汽車集團等成功籌集了1億美元資金。

 

       對於英偉達具備優勢的GPU,凱勒斷言稱「不是為AI而設計的」。英偉達的GPU雖然擅長大量數據的並行處理,但原本是面向遊戲處理超高清圖像而開發的,要嵌入作為生成式AI基礎的數據中心的伺服器,存在很多弱點。

 

       最大的問題是電力效率低下。由於在晶片上負責運算的運算器和存儲資訊的記憶體相互分離,GPU在數據交換方面耗費大量電力,而不是運算本身。有估算稱,被認為使用數萬個英偉達GPU的生成式AIChatGPT」每天的電費等運營成本按日元換算達到1億日元。

 

 

       Tenstorrent正在開發的AI半導體通過讓運算器和記憶體位置靠近,縮短了數據的移動距離,減少了電力浪費。凱勒比喻稱,「在AI中,就像運算器相互對話一樣,將運算結果直接傳遞到下一個運算是很自然的事情」。

 

       英偉達在決定半導體運作的「指令集」上使用英國ARM的技術,而Tenstorrent則採用了任何人都可以免費使用和修改的開源的「RISC-V」。目的在於控制授權費支出,同時也方便根據客戶的需求靈活變更半導體的設計。

 

       凱勒表示,「對於想要開發價值數百萬日元的機器人的企業來説,數百萬日元的GPU就太貴了」。該公司正力爭開發除了節電性能之外、在價格方面也足以對抗英偉達的新一代AI半導體。

 

       通過記憶體運算

 

       目前生成式AI 處於發展階段,開發企業將大部分運算資源用在提高精度的「學習」上。今後,隨著ChatGPT等各種服務進入全面普及期,AI輸出問題答案等「推理」的運算所消耗的電力比重或將提高。還出現了專注於這一推理領域、致力於改善GPU課題的初創企業。

 


 

       美國英特爾出身的CEO Sid Sheth等人在2019年設立的d-Matrix就是其中之一。該公司提出的目標是,使用一種讓記憶體具備運算功能的「記憶體運算」技術,大幅減少數據中心的伺服器在推理運算中消耗的電力。

 

       從該公司將於2024年開始供貨的AI半導體「Corsair」來看,相同成本的運算量是英偉達主力GPU13倍以上,運算速度是9倍以上。d-Matrix Sid Sheth預測稱,「在有的用途上,GPU的性能過高」。他預測稱「一家企業持續壟斷市場是不可能的」。

 

 

       在d-Matrix涉足的記憶體運算領域,美國OpenAICEO山姆·奧特曼以個人身份出資的2017年設立的美國Rain AI也被認為很有競爭力。美國媒體報導稱,Rain AI有可能負責向OpenAI供應半導體。

 

       由於生成式AI熱潮,GPU的需求非常緊張,價格一直居高不下。英偉達2023810月的營業利潤率達到半導體相關領域罕見的57%。據分析,該公司以市場支配力為基礎,在價格上增加了很大的利潤空間,這是生成式AI的開發成本上升的主要原因。

 

       一直依賴英偉達GPU的生成式AI開發企業也越來越關注替代技術。2023年,美國微軟旗下的風險投資公司與新加坡主權財富基金等一起向d-Matrix投資了1.1億美元。Sid Sheth表示,除了微軟之外,美國Meta也已經啟動初期的産品評估,有意在自己的生成式AI上採用。

 

 

       繼美國谷歌先於其他企業在2016年發佈自主開發的AI半導體之後,微軟最近也自主設計了最適合ChatGPT等運作的半導體。美國亞馬遜也在11月推出了專門面向AI學習的新型半導體。

 

       被追趕的英偉達將努力鞏固領先地位。2023年冬季,該公司CEO黃仁勳參加了美國亞馬遜網路服務(AWS)等雲技術企業的技術活動,向匯聚一堂的技術人員等推銷了將於2024年投入使用的新型GPU

 

       美國調查公司Gartner預測稱,AI半導體的市場規模到2027年將擴大到1194億美元,達到2022年的2.7倍。憑藉現有技術掌握主導權的英偉達與試圖通過技術創新瓦解該公司大本營的新勢力之間的攻防戰將日趨激烈。

 

       日本經濟新聞(中文版:日經中文網)山田遼太郎 矽谷

 

版權聲明:日本經濟新聞社版權所有,未經授權不得轉載或部分複製,違者必究。