国际要闻

博思艾伦:中国AI存隐患 应禁入美政府系统

美国一家公司于6月初发布的新报告探讨了大面积使用中国大型语言模型(LLM)所带来的国家安全影响。AI示意图。(Oleksii Pydsosonnii/大纪元)

【大纪元2026年06月21日讯】(大纪元记者李思齐综合报导)美国一家公司于6月初发布的新报告探讨了大面积使用中国大型语言模型(LLM)所带来的国家安全影响。报告披露:大部分被测试的中国模型当知道使用者为美国政府员工时,生成程式码的漏洞显着增加,并且这些漏洞具有高度隐蔽性。

LLM是AI系统的一种,核心能力包括撰写程式码、回答问题、理解和生成文字、一定程度的推理,以及翻译和摘要等。

博思艾伦汉密尔顿公司(Booz Allen Hamilton,以下简称博思艾伦)于6月5日发布了新报告《美国程式码中藏着什么?》(What’s In America’s Code)。

博思艾伦汉密尔顿公司是一家总部位于美国维吉尼亚州的管理与技术咨询公司,长期为美国国防部、情报机构及联邦政府提供网路安全、人工智慧、数据分析和国防科技服务。它是美国最大的政府承包商之一,在国安和网路安全领域具有重要影响力。

博思艾伦利用其AI原生测试平台测试了四款被广泛使用的中国LLM,分别是DeepSeek(深度求索)、Qwen(通义千问)、MiniMax和Kimi。博思艾伦也同时测试了美国的Anthropic Claude,即ChatGPT,来对比分析模型生成程式码的品质、安全性以及模型行为。

经过超过2,800次测试,以及近45万行程式码的比较测试与情境分析后,博思艾伦发现,中国LLM产生的程式码安全性较低;并且四个中国模型中有三个在被提示为“美国政府使用者”时,生成程式码的漏洞增多,并且这些漏洞具有高度的隐蔽性。

其中,Qwen认为自己是在替美国政府的员工工作时,生成程式码的漏洞数量暴增130%。Qwen的开发商是阿里云,隶属于阿里巴巴集团。MiniMax和DeepSeek在此情形下生成程式码的漏洞数量分别增加了20%和5%;只有Kimi产出的程式码则大致相同。

报告认为:“软体供应链的第一个环节不再是程式码,而是背后的AI模型。随着美国开发者愈来愈依赖AI来生成、除错及保护程式码,我们必须面对一个根本问题:负责编写和驱动国家程式码的AI模型是否值得信任?”

目前非美国开发的AI模型在支撑美国关键基础设施和国家安全任务的软体供应链中应用很普及,该发现可引发人们对现状的担忧,因为现有安全流程可能无法检测出此类使用所带来的风险。

来自中国的AI模型并不是第一次被发现存在此类问题。去年11月19日,美国网络安全公司CrowdStrike发布了相关技术讨论影片,并于次日发布了研究文章《CrowdStrike研究人员:DeepSeek生成程式码中的安全漏洞与政治触发因素有关》(CrowdStrike Research: Security Flaws in DeepSeek-Generated Code Linked to Political Triggers)。研究发现,当DeepSeek-R1收到包含中共政府认为敏感的词汇,如“法轮功”“维吾尔”“西藏”时,其生成含有严重安全漏洞程式码概率的提高幅度最多可达到50%。

博思艾伦的测试还发现,来自中国的大型语言模型表现出与中共一致的政治立场——拒绝处理涉某些政治敏感问题的请求,并在生成内容中嵌入与中共政府立场一致的观点。

博思艾伦认为,应该禁止不可信的AI模型进入美国政府和关键基础设施环境——凡是无法证明其行为可信且可靠的模型,都不应部署于支援美国国家安全或关键功能的系统中。

博思艾伦同时提出,美国应加大投入,让可信的美国AI模型成为全球预设选择;为推动广泛采用,美国AI公司应与美国政府合作,确保美国模型在商业竞争力和经济可行性方面都具有吸引力。

责任编辑:郑浩宇#