AI恐自我改進 Anthropic呼籲全球暫停AI開發

圖為示意圖。攝於2025年5月16日，畫面中顯示著一部手機屏幕上的人工智能（AI）標誌。（Oleksii Pydsosonnii ／英文大紀元）

2026-06-0509:39 中港台時間|06-2222:51 更新

人氣 2312

【大紀元2026年06月05日訊】（大紀元記者高杉編譯報導）總部位於舊金山（San Francisco）的人工智能（AI）公司Anthropic週四（6月4日）發文，呼籲全球主要AI實驗室考慮放緩甚至暫停最先進AI系統的開發，並警告AI正逐步接近「遞歸自我改進」能力，即AI系統在幾乎無需人類干預情況下自行提升性能，這可能對社會構成重大風險。

Anthropic警告AI風險升高

根據Anthropic發布的文章，公司研究人員認為，全球若能做到「放緩或臨時暫停前沿AI開發」，將有助於讓社會治理與安全研究跟上技術發展的速度。

這篇文章由Anthropic研究院（Anthropic Institute）負責人馬里納·法瓦羅（Marina Favaro）及公司聯合創始人傑克·克拉克（Jack Clark）共同撰寫。

文章指出，目前人工智能模型的能力進步速度極快，正朝向「遞歸自我改進」（Recursive Self-Improvement）方向發展，即人工智能能夠自主優化與升級自身系統，而不再需要大量人工參與。

此機制被視為AI跨越人類智慧門檻並引發「智慧爆炸」的核心關鍵，已成為Google DeepMind與Anthropic等頂尖實驗室的研發重心。

Anthropic公司表示，目前尚未真正出現這種情況，但其到來「可能比大多數政府與機構預測得更早」。

公司指出：「現有證據表明，在人工智能開發過程中的每一步，人類的角色都在不斷收窄。」

Anthropic還提出，如果希望全球真正實現暫停AI開發，就需要美國與中國等主要人工智能國家，以及一系列巨頭科技公司共同參與，同時建立一套可核查的監督系統。

Anthropic的主張引發爭議

Anthropic近年因推出Claude系列人工智能模型而迅速崛起，並在與OpenAI等企業的競爭中受到市場關注。

據媒體報導，Anthropic近期完成了新一輪融資，公司估值已接近1萬億美元，並已祕密啟動上市程序。

不過，該公司長期強調人工智能安全問題，也在業界引發爭議。

風險投資人、川普（特朗普）政府非正式顧問大衛·薩克斯（David Sacks）曾批評Anthropic公司，認為其表面以「安全」為名，實際上是試圖透過監管限制競爭對手的發展。

部分批評人士還指出，Anthropic反覆強調旗下最新AI模型存在潛在安全危險，也具有一定市場營銷效果。

Anthropic於2026年4月推出了其最先進且神祕的預覽版模型Claude Mythos（或稱 Mythos Preview）。此模型展現出極為強大甚至令咨詢安全界頗爲震驚的自主網路安全能力。

測試證實，Claude Mythos能夠自主發現並串聯多個「零日漏洞」（Zero-day Vulnerabilities），其挖掘與利用安全漏洞的能力遠超以往的AI模型（如 Claude 4.6 Opus等）。它甚至在各大作業系統與瀏覽器中，找出了隱藏數十年、連人類專家和自動化工具都未曾發現的系統安全漏洞。

由於擔心該模型若被駭客武器化，並將引發災難性的網絡攻擊，Anthropic拒絕向公眾開放Mythos。

相反地，他們採取了嚴格限制的封閉發布策略，透過名為Project Glasswing的計劃，將該AI模型僅提供給少數（最初約40-50家，後於2026年6月擴大至約150家）特定的大型科技公司、資安機構及關鍵基礎設施聯盟（如微軟、蘋果、亞馬遜、CrowdStrike、歐盟資安局ENISA 等）進行防禦性的漏洞修復。

Anthropic此舉也被一些專業人士解讀為是展示其技術實力的一種方式。