Google Cloud Next年度盛會4/22起在拉斯維加斯登場,此次重頭戲是一口氣推出兩款新自研晶片TPU 8t與8i,比起先前一年一款新晶片更具企圖心。供應鏈傳合作的IC設計業者為博通(Broadcom)與聯發科,但邁威爾(Marvell)也正積極切入成為第三勢力。
凱基投顧的報告指出,Google TPU 2026年出貨量估將增至430萬顆,其他供應鏈業者涵蓋PCB、電源、散熱、伺服器組裝廠等也將受惠,預計相關業者在2026年下半年將有更亮眼的表現。
Google每年最重要的三大活動是四月舉辦的Google Cloud Next、五月登場的I/O開發者大會、秋季舉辦的Made by Google硬體產品發表會。其中,由雲端團隊主導的Next大會,常是新款TPU問世、展示基礎設施火力的舞台。
大會正式開始前,Google Cloud執行長Thomas Kurian先於線上記者會指出,以往AI模型多被用來回答問題、生成文字或圖片影音內容,近期新趨勢則是讓AI代理可調用工具、執行多個步驟的任務。
為賦能企業部署AI代理,Google強化了AI技術堆疊的每一階層,涵蓋晶片/網通/儲存等基礎設施、AI模型、資料管理、資安防護、工具調用及推論平台、AI代理應用平台,等於是軟硬體一把抓。
Google一口氣推出兩款新晶片!TPU 8t與8i,有什麼不一樣?
最受市場矚目的即是新一代TPU晶片問世,此次Google一口氣推出兩款新晶片TPU 8t與8i,比以往一年一款更顯積極。2025年推出第七代TPU Ironwood時,強調專為AI推論打造。此次兩款新晶片則分流為訓練及推論用,背後原因耐人尋味。
此次Google還在大會前夕舉辦TPU雞尾酒特別活動,由Google AI及基礎設施資深副總Amin Vahdat與當紅科技類Podcast節目The Acquired主持人同台對談,以爐邊對談的方式淺談TPU超過十年的發展歷程,並在場邊展示第一代至第八代的TPU晶片。
Vahdat透露,第八代TPU費時兩年打造,當時外界可能還沒有人在談AI代理,但Google內部已在討論。
TPU 8t與8i都是各自從頭打造,而不是一款晶片衍生另一款。需要強大訓練算力的用戶可選擇8t晶片,而需要加速推論效率者,則可選擇8i晶片。兩款晶片將於2026年稍晚對外開放使用。
Google AI及基礎設施資深副總Amin Vahdat分享第八代TPU 8t、TPU 8i的規格。
博通、聯發科...Google第八代TPU,2026供應鏈誰受惠?
供應鏈傳出,第八代TPU合作的晶片設計業者是博通與聯發科,博通負責訓練用的8t,聯發科則負責推論用的8i。同時,邁威爾正積極切入成為第三勢力。不過,隨後也有傳聞指出,訓練用晶片是由聯發科奪單。Google官方則未回應任何供應鏈傳聞。
Google資料顯示,TPU 8世代的每瓦效能都比前一代TPU提升2倍。訓練算力、推論延遲、記憶體容量也有大幅改善。
TPU 8t組成的單一叢集可擴展至9,600顆晶片(前一代為9,216顆),算力高達121 ExaFlops(百萬兆次浮點運算),共享高頻寬記憶體(HBM)約2 Petabytes。同時使用光路交換技術(OCS),可提升資料傳輸及隔離故障節點。
而TPU 8i單一叢集最多可擴展至1,152顆,為減少調用外部記憶體的傳輸延遲、即所謂的「記憶體之牆」,將288GB HBM與384MB晶片上記憶體SRAM整合,SRAM容量是前一代的三倍。
同時,Google表示每台伺服器部署的CPU數量增加一倍,採用名為Axion、基於Arm架構的自研CPU。這部分也呼應近期市場所注意到的,AI代理應用增加,任務調度所需的CPU數量隨之擴增。
TPU能取代GPU?NVIDIA和Google的競合關係
凱基投顧4/17出具的「電子硬體產業」報告顯示,NVIDIA GPU仍為AI伺服器應用的晶片主流,但Google TPU出貨量也有明顯增長趨勢。伺服器需求強勁,記憶體及CPU供應吃緊為主要瓶頸。
美銀先前估計,2025年TPU出貨量230萬顆,2026年將增至460萬顆。凱基則估計,TPU 2026年出貨量為430萬顆,多數供應鏈業者將在2026年下半年出貨,預計交換機、主動式電纜(AEC)、印刷電路板(PCB)、銅箔基板(CCL)、液冷散熱業者、伺服器組裝廠等,將有更亮眼的表現。
值得注意的是,Google Cloud仍提供客戶選用NVIDIA GPU算力,宣布推出NVIDIA VR200支援的雲端虛擬機器。換言之,Google與NVIDIA維持既合作、又在某些領域競爭的局面。Google持續推進自研晶片,內部模型訓練皆用自家TPU,即被視為降低對NVIDIA依賴的策略。
Google也持續強化網通及儲存系統的調度效率。新一代網通系統Virgo Network可連結單一資料中心的134,000顆TPU、跨越數個資料中心的超過百萬顆TPU。Virgo Network也可用來管理GPU,單一資料中心最多可連結80,000顆GPU,跨資料中心可連結960,000顆GPU。為降低耗電量,系統也配置動態電源管理等措施。
其他重要新服務還包括訴求企業應用的Gemini Enterprise Agent Platform、跨雲管理的資料倉儲Cross Cloud Lakehouse、以及併購資安業者Wiz後強化的AI資安方案等。