【AI】Anthropic 內部文件外洩:Claude Mythos 曝光——最強模型為何「不敢公開」?
事件摘要
2026 年 3 月 26 日,Anthropic 因內容管理系統(CMS)配置錯誤,意外將其下一代旗艦模型「Claude Mythos」的相關文件暴露在公開網域。流出內容包括近 3,000 份未發布的資產(圖片、PDF、內部文件)以及一份完整的部落格草稿。
Anthropic 已證實此事,歸因於「人為設定失誤」,並確認 Mythos 是一款正在測試中的新型通用模型。
為什麼重要
1. 能力躍進:Anthropic 史上最強
根據外洩文件,Claude Mythos 在多項指標顯著超越 Claude Opus 4.6,特別是在:
- 軟體工程程式設計(software programming)
- 學術推理(academic reasoning)
- 網路安全(cybersecurity)——被形容為「大幅超越所有現有 AI 模型」
若數據屬實,這是 Anthropic 成立以來最大幅度的單代能力跳躍。
2. 「雙用途」風險:能幫防禦,也能強化攻擊
外洩的部落格草稿明白警告:Mythos 能夠在正式環境的程式碼庫中,自動發現先前未知的資安漏洞。這個能力是「雙面刃」——同樣可用來強化駭客攻擊,也可用來加固資安防線。
Anthropic 據此決定不對一般公眾開放。
3. 市場已即時反應
比特幣與軟體類股在消息流出後同步走跌,顯示市場立即認知到「更強大的 AI 黑客工具」對虛擬資產與軟體產業的潛在威脅。
4. 誰能先用?封閉生態的策略
Anthropic 規劃 Mythos 初期僅提供給少數早期客戶,聚焦在「區塊鏈資料保護」與「虛擬資產防禦」場景。同時,執行長 Dario Amodei 規劃在英國舉辦一場僅限受邀企業 CEO 參加的閉門展示會,向歐洲高管演示功能。
對誰重要
| 對象 | 影響 |
|---|---|
| 資安產業 | 將出現史上最強的主動漏洞挖掘工具;將重塑滲透測試、紅隊演練的技術基準 |
| 區塊鏈 / 虛擬資產 | Mythos 被設定為直接防守用途,但比特幣市場已對「AI 駭客工具」產生聯想而下跌 |
| 軟體開發 | 能自動發現零日漏洞的能力,是威脅也是機會;開發者需重新評估 AI 輔助工具的安全邊界 |
| 競爭對手 | OpenAI、Google、微軟將被迫回應 Mythos 的 benchmark 表現;模型軍備競賽進入新維度 |
| 監管機構 | 已暴露的「雙用途風險」將加速 AI 安全與出口管制相關立法討論 |
延伸分析
為何 Anthropic 選擇封閉策略?
過往 Anthropic 傾向逐步開放模型(從 Claude.ai 訂閱到 API),但 Mythos 的策略轉向「先封閉、再定向授權」,反映出 AI 安全思維的根本轉變:
- 能力太強,無法冒著被濫用的風險全面開放
- 聚焦 B2B 資安防御場景,變現路徑更清晰
- 透過閉門展示會建立高層決策者網絡,為企業級銷售鋪路
這次洩漏是「意外」還是「有意」?
消息首先由 Fortune 記者 Bea Nolan 發現,隨後由獨立資安研究員 Alexandre Pauwels 與 Roy Paz 分別驗證。Anthropic 快速承認並說明為「人為設定失誤」,姿態相對坦承。但以一家以「AI 安全」為核心價值的公司而出現此失誤,值得觀察後續內部調查結果。
風險與不確定性
- 規格未經獨立驗證:所有 benchmark 數字來自外洩文件,尚未獲 Anthropic 官方確認
- 雙用途風險真實存在:即便鎖定防御市場,模型最終如何被使用難以完全控制
- 洩漏範圍不明:近 3,000 份資產中有多少已流出、是否包含模型權重或訓練資訊,仍未確定
- 歐洲監理壓力:Dario Amodei 英國展示行程若觸發監管機構關切,可能影響 Mythos 落地節奏
Reference
- Fortune - Exclusive: Anthropic Mythos AI model representing step change in power revealed in data leak
- Fortune - Anthropic accidentally leaked details of a new AI model that poses unprecedented cybersecurity risks
- Fortune - Exclusive: Anthropic left details of an unreleased model, an upcoming exclusive CEO event, in a public database
- CoinDesk - Bitcoin price slides alongside software stocks following leak of new Anthropic model
- The News Pakistan - Anthropic accidentally reveals Claude Mythos model: The next frontier in AI power
- Firstpost - Anthropics Claude Mythos leak reveals powerful new AI model with serious cyber risks
- Polymarket - Claude Mythos released by…? Predictions & Odds