在今天看見明天
熱門: 台積電 兆豐金配息 股票抽籤 00929 航運股走勢

全球首款地端AI晶片 Skymizer28奈米單卡也能跑兆級大語言模型

全球首款地端AI晶片 Skymizer28奈米單卡也能跑兆級大語言模型

政府熱焦點

科技

資策會提供

2026-06-03 15:00

當全球AI晶片廠商一窩蜂追逐五奈米、三奈米先進製程,台灣發展軟體科技(Skymizer) 反其道而行,選擇以台積電二十八奈米成熟製程,打造全球首款「地端AI推論」設計晶片HTX301,並在二○二六Computex展前夕亮相。HTX301最大優勢是不需要搭載昂貴的高速互聯和HBM,也無需複雜液冷散熱,單卡即可執行接近兆級參數的超大型語言模型,瞄準企業私有化AI部屬的龐大市場,宣示台灣半導體業者在AI時代的創新突圍路徑。

瞄準企業導入生成式AI所面臨的成本與資安痛點,國內AI新創企業 Skymizer去年首度對外發表自行研發的AI IP「HyperThought」IP與指令集架構「LISA」,在董事長賴俊豪帶領下,長期深耕AI編譯器與軟體最佳化技術,今年進一步將相關技術落地為實體晶片,完成首顆AI推論晶片HTX301開發,目前工程樣品已進入驗證階段,並在Computex展公開實機運作成果。

 

賴俊豪分析,當市場普遍聚焦先進製程競賽之際,Skymizer選擇28奈米成熟製程,是基於公司深厚軟體底蘊實力所做出的策略性決定。他強調:「我們的核心理念是軟硬體協同設計(Hardware-Software Co-design),將大量效能最佳化的工作交由軟硬體協同完成,取代在硬體端一味堆疊電晶體數,同樣能達到企業所需的AI推論效能。」差異化設計讓Skymizer得以迴避對HBM高頻寬記憶體與CoWoS先進封裝的依賴,大幅降低系統建置門檻。

 

◎單卡512GB兆級參數 打破大模型仰賴雲端限制

 

HTX301採用八核心架構,搭配標準DDR記憶體,以標準BGA封裝出貨,事實上Skymizer的設計哲學是「先求放得下,再求算得快」,現行AI伺服器最昂貴的成本,往往來自跨卡溝通頻寬(如NVLink等機制),因此HTX301致力於將超大型模型濃縮在單張卡上完整執行,從根本消除跨卡通訊的效能瓶頸與建置成本。

 

在產品規格上,Skymizer規劃三種配置方案。針對30B中型模型採取一卡一套版本;針對397B大模型、搭載四顆晶片、提供256GB記憶體的標準版方案;以及旗艦款的一卡八套客製版本,單卡搭載八顆HTX301晶片,提供高達512GB記憶體空間,可直接運行如DeepSeek-R1(671B參數)這類接近兆級參數的超大型模型,預期解碼速率可達每秒近20Token。

 

HTX301更令人外界矚目的是其功耗表現,以執行DeepSeek-R1為例,傳統GPU方案通常需要一台配備八張H100的伺服器,整體功耗高達10kW,建置成本動輒千萬元起跳,相比下,HTX301一卡八套方案的晶片總功耗僅約325W,搭配基礎伺服器整機耗能僅需約1.3kW,不需要複雜的水冷設備,可靠一般風扇散熱。這也意味著,企業可在一般辦公桌上的主機中部署兆級大模型,真正實現資料自主可控的私有AI環境。

 

◎瞄準企業三大痛點 攜資策會推國產化生態系

 

Skymizer指出,HTX301鎖定企業導入生成式AI所面臨的 資料安全、雲端訂閱成本,以及硬體建置與能耗負擔三大核心痛點。在資安上,合作夥伴交大人工智慧系統檢測中心主任陳添福教授表示,園區半導體與電子業者在進行RTL設計、IC開發及機密文件分析時,往往不願將敏感資料上傳至公有雲平台;同時在成本端,主流雲端AI服務多採Token計費,企業若大量使用生成式AI工具,累積費用相當可觀,若能透過本地部署方式執行大模型,不僅可杜絕資料外流風險,更能擺脫Token使用限制,有效控管長期營運成本。

 

在生態系建構上,Skymizer攜手財團法人資訊工業策進會(資策會),共同推動台灣AI應用由「Edge AI」全面升級至「企業級地端AI(Enterprise On-Premise AI)」的關鍵轉型。資策會將以其主導研發的快接中介層與異質資源調度技術,搭配HTX301,從Edge端單一裝置出發,向上延伸至企業地端機櫃,再擴展至廠區級Mini Data Center與集團級叢集,實現全方向Scale-out。

 

日前雙方宣布以「新北捷運知識管理地端應用」作為首發示範案例,展示國產地端方案在資料主權、毫秒級即時響應與規模化擴充的競爭優勢。在次世代技術藍圖上,Skymizer也透露Scale out擴充架構規劃,即將推出的LISA v4架構,可將LLM張量平行處理所需的跨晶片頻寬,大幅縮減至傳統教科書要求的1/500乃至1/4000,代表未來不需特殊Switch架構,僅依靠標準SerDes接口(如UCIe、PAM4等)即可無痛串接多顆晶片,架設規模化推論叢集。

 

展望未來,賴俊豪表示,二十八奈米版本的HTX301僅是起點,公司已規劃於明年與夥伴推出12奈米與6奈米先進製程晶片,其中12奈米版本最多可串接十六顆晶片(1,024核心),6奈米版本更可支援高達六十四顆晶片串接(4,096核心),目標是以極低功耗達到足以比肩現有三奈米至二奈米晶片的效能表現,全力搶進Neo Cloud與On-Premise Enterprise AI市場的龐大商機。

 

延伸閱讀
每月1萬買0050、009816,20年後差多少?台股4萬點了怎麼買?這樣做多賺800萬!3個加碼關鍵一次說清楚
每月1萬買0050、009816,20年後差多少?台股4萬點了怎麼買?這樣做多賺800萬!3個加碼關鍵一次說清楚

2026-05-07

00919賺太慢,該換009816?不配息、低費用,長期真能打贏0050?達人揭關鍵:為何動能分配恐成雙面刃
00919賺太慢,該換009816?不配息、低費用,長期真能打贏0050?達人揭關鍵:為何動能分配恐成雙面刃

2026-05-19

幫小孩存股選哪檔?從00922、0050到009816...小資爸3年實測:大賺91%!20歲能滾出500萬?布局策略快看
幫小孩存股選哪檔?從00922、0050到009816...小資爸3年實測:大賺91%!20歲能滾出500萬?布局策略快看

2026-05-13

00403A重返10元,下一步暴衝關鍵?達人拆解「保留20%現金」背後:除了績效,挑主動ETF最重要的是?
00403A重返10元,下一步暴衝關鍵?達人拆解「保留20%現金」背後:除了績效,挑主動ETF最重要的是?

2026-05-21

0050升級版、10元的00403A閉眼買就好?和00991A差在哪?主動汰弱留強真能戰勝大盤?一文拆解關鍵數據
0050升級版、10元的00403A閉眼買就好?和00991A差在哪?主動汰弱留強真能戰勝大盤?一文拆解關鍵數據

2026-04-29