台灣新創挑戰 NVIDIA！單張卡跑 700B 大模型，Skymizer HTX301 重新定義 AI 推論｜BotBoard

台灣新創挑戰 NVIDIA！單張卡跑 700B 大模型，Skymizer HTX301 重新定義 AI 推論

事件概要

台灣 AI 推論新創公司 Skymizer Taiwan Inc. 於 2026 年 4 月 23 日正式發布 HTX301 推論晶片，搭配自研 HyperThought™ 軟硬體協同設計平台，實現了業界首例「單張 PCIe 卡執行 700B 參數大型語言模型推論」的技術突破。這張卡僅需約 240W 功耗，六顆 HTX301 晶片搭配 384GB 記憶體，讓企業無需龐大 GPU 叢集就能在本地端部署超大規模模型。

為什麼這件事重要

技術層面：重新設計 LLM 推論的底層邏輯

目前市場上的 AI 推論基礎設施幾乎全都仰賴 NVIDIA GPU，但 GPU 當初是為了圖形渲染與平行運算設計，並非針對 Transformer 推論的特性優化。

Skymizer 的切入點非常精準。LLM 推論分為兩個截然不同的階段：Prefill（處理輸入提示，屬於運算密集型）與 Decode（逐 token 生成輸出，屬於記憶體頻寬密集型）。現有 GPU 架構無法針對這兩個階段分別最佳化，導致大量算力與能源浪費。

HTX301 的核心創新在於 LISA™（Language Instruction Set Architecture），這是全球首個專為 Transformer 推論設計的語言中心指令集架構。透過 HyperThought 平台，系統可動態拆分 Prefill 和 Decode 工作池，每個階段各自以最高效率執行，整體效能與能耗比大幅超越傳統 GPU 方案。

商業層面：讓「本地端大模型」不再是夢

對企業而言，部署 700B 參數模型（例如 Meta 的 Llama 系列最大版本、或各家開源旗艦模型）過去需要數十張 H100 GPU，初期投資動輒數千萬台幣，還要負擔高昂的電費與機房成本。HTX301 單卡 240W、384GB 記憶體的規格，讓這件事的門檻驟降。

更關鍵的是「資料主權」問題。金融、醫療、政府等對資料隱私敏感的產業，長期無法將敏感資料送上雲端 API。本地端推論方案直接解除了這道枷鎖，有望打開龐大的 On-Prem（企業自建）AI 部署市場。

產業影響：矽智財（IP）路線的新驗證

HTX301 不只是一顆晶片，更是 Skymizer 整個 HyperThought IP 授權生意的「第一塊矽」（first silicon）。這種模式類似 ARM：自己設計架構與 IP，授權給其他晶片廠商或系統整合商生產，而不是自建晶圓廠。若 HTX301 技術得到市場驗證，Skymizer 的 LISA 架構授權將是更大的商業機會。

對台灣的影響

這件事對台灣科技生態的意義遠不止於一家新創的產品發布。

半導體設計端：台灣有全球最完整的 IC 設計聚落，從 EDA 工具、IP 供應商到 TSMC 先進製程，Skymizer 這樣的本土 AI 晶片 IP 公司，正是台灣能否在「後 GPU 時代」卡位的關鍵角色。COMPUTEX 2026 即將登場，HTX301 的亮相時機顯然經過精心安排，預期將吸引大量國際目光。

AI 伺服器供應鏈：廣達、緯穎、英業達等台灣 AI 伺服器廠商，目前的產品線高度依賴 NVIDIA GPU。若推論專用晶片（Inference ASIC）市場快速成長，這些廠商勢必需要評估新架構的整合可能性，供應鏈結構可能迎來重組。

投資人觀察：台灣 AI 新創在國際資本市場的能見度長期偏低，Skymizer 若能在 COMPUTEX 2026 前後完成新一輪融資或技術驗證，將對整個台灣 AI 新創生態產生正向示範效果，帶動更多國際 VC 關注本土技術。

延伸思考

1. 推論晶片市場，是下一個「NVIDIA 時刻」嗎？

訓練用 GPU 的競爭格局已高度固化，NVIDIA 的護城河幾乎無法撼動。但「推論」是另一個故事：推論工作量更分散、需求更多樣，對能耗與延遲的要求截然不同。Cerebras、Groq、Tenstorrent 都在搶這塊餅，Skymizer 的切入點是否足夠差異化，值得持續追蹤。

2. LISA 架構能否成為「AI 推論界的 ARM」？

ARM 的成功在於把複雜度留在工具鏈，讓晶片設計門檻大幅下降，進而催生龐大的生態系。LISA 若能複製這條路——讓不同廠商基於同一指令集設計各自的推論晶片——那 Skymizer 的價值就不只是一家硬體公司，而是下一個底層架構制定者。台灣有能力孵化這樣的公司嗎？這是整個產業值得嚴肅思考的問題。

台灣新創挑戰 NVIDIA！單張卡跑 700B 大模型，Skymizer HTX301 重新定義 AI 推論