【AI】Anthropic 內部文件外洩:Claude Mythos 曝光——最強模型為何「不敢公開」?

事件摘要

2026 年 3 月 26 日,Anthropic 因內容管理系統(CMS)配置錯誤,意外將其下一代旗艦模型「Claude Mythos」的相關文件暴露在公開網域。流出內容包括近 3,000 份未發布的資產(圖片、PDF、內部文件)以及一份完整的部落格草稿。
Anthropic 已證實此事,歸因於「人為設定失誤」,並確認 Mythos 是一款正在測試中的新型通用模型。

為什麼重要

1. 能力躍進:Anthropic 史上最強

根據外洩文件,Claude Mythos 在多項指標顯著超越 Claude Opus 4.6,特別是在:
  • 軟體工程程式設計(software programming)
  • 學術推理(academic reasoning)
  • 網路安全(cybersecurity)——被形容為「大幅超越所有現有 AI 模型」
若數據屬實,這是 Anthropic 成立以來最大幅度的單代能力跳躍。

2. 「雙用途」風險:能幫防禦,也能強化攻擊

外洩的部落格草稿明白警告:Mythos 能夠在正式環境的程式碼庫中,自動發現先前未知的資安漏洞。這個能力是「雙面刃」——同樣可用來強化駭客攻擊,也可用來加固資安防線。
Anthropic 據此決定不對一般公眾開放。

3. 市場已即時反應

比特幣與軟體類股在消息流出後同步走跌,顯示市場立即認知到「更強大的 AI 黑客工具」對虛擬資產與軟體產業的潛在威脅。

4. 誰能先用?封閉生態的策略

Anthropic 規劃 Mythos 初期僅提供給少數早期客戶,聚焦在「區塊鏈資料保護」與「虛擬資產防禦」場景。同時,執行長 Dario Amodei 規劃在英國舉辦一場僅限受邀企業 CEO 參加的閉門展示會,向歐洲高管演示功能。

對誰重要

對象影響
資安產業將出現史上最強的主動漏洞挖掘工具;將重塑滲透測試、紅隊演練的技術基準
區塊鏈 / 虛擬資產Mythos 被設定為直接防守用途,但比特幣市場已對「AI 駭客工具」產生聯想而下跌
軟體開發能自動發現零日漏洞的能力,是威脅也是機會;開發者需重新評估 AI 輔助工具的安全邊界
競爭對手OpenAI、Google、微軟將被迫回應 Mythos 的 benchmark 表現;模型軍備競賽進入新維度
監管機構已暴露的「雙用途風險」將加速 AI 安全與出口管制相關立法討論

延伸分析

為何 Anthropic 選擇封閉策略?

過往 Anthropic 傾向逐步開放模型(從 Claude.ai 訂閱到 API),但 Mythos 的策略轉向「先封閉、再定向授權」,反映出 AI 安全思維的根本轉變:
  • 能力太強,無法冒著被濫用的風險全面開放
  • 聚焦 B2B 資安防御場景,變現路徑更清晰
  • 透過閉門展示會建立高層決策者網絡,為企業級銷售鋪路

這次洩漏是「意外」還是「有意」?

消息首先由 Fortune 記者 Bea Nolan 發現,隨後由獨立資安研究員 Alexandre Pauwels 與 Roy Paz 分別驗證。Anthropic 快速承認並說明為「人為設定失誤」,姿態相對坦承。但以一家以「AI 安全」為核心價值的公司而出現此失誤,值得觀察後續內部調查結果。

風險與不確定性

  • 規格未經獨立驗證:所有 benchmark 數字來自外洩文件,尚未獲 Anthropic 官方確認
  • 雙用途風險真實存在:即便鎖定防御市場,模型最終如何被使用難以完全控制
  • 洩漏範圍不明:近 3,000 份資產中有多少已流出、是否包含模型權重或訓練資訊,仍未確定
  • 歐洲監理壓力:Dario Amodei 英國展示行程若觸發監管機構關切,可能影響 Mythos 落地節奏

Reference

  1. Fortune - Exclusive: Anthropic Mythos AI model representing step change in power revealed in data leak
  2. Fortune - Anthropic accidentally leaked details of a new AI model that poses unprecedented cybersecurity risks
  3. Fortune - Exclusive: Anthropic left details of an unreleased model, an upcoming exclusive CEO event, in a public database
  4. CoinDesk - Bitcoin price slides alongside software stocks following leak of new Anthropic model
  5. The News Pakistan - Anthropic accidentally reveals Claude Mythos model: The next frontier in AI power
  6. Firstpost - Anthropics Claude Mythos leak reveals powerful new AI model with serious cyber risks
  7. Polymarket - Claude Mythos released by…? Predictions & Odds