【大紀元2026年05月21日訊】(大紀元記者孫晨採訪報導)國際學術期刊《自然》雜誌發表的研究報告顯示,中共官媒的大量內容已滲透全球主流人工智能模型訓練體系。在涉及中國政治敏感議題時,多個主流模型使用中文回答時更容易出現接近北京官方敘事的表達。網絡業內人士透露,當局正在領英等平台高薪招聘美國等西方人工智能工程師,試圖實現「彎道超車」。
美國研究人員擔憂,中共宣傳系統正藉人工智能進入新的信息傳播渠道。近期,《自然》雜誌發表的一項最新研究報告顯示,中共官方媒體包括新華社、《人民日報》等發布的大量內容,已被人工智能訓練系統廣泛抓取,並進入全球主流大語言模型的數據來源。在涉及中國政治敏感議題時,包括ChatGPT、Claude、Gemini在內的多個模型,用中文回答問題時更容易出現接近北京官方敘事的表達;相較之下,英文回答則呈現不同傾向。
研究團隊表示,這種現象並不依賴黑客攻擊或技術入侵,而可能來自訓練數據結構本身。新華社、人民網等媒體長期免費開放、大量轉載,並以統一格式持續發布官方內容。相比之下,不少獨立媒體存在版權限制、付費牆或反抓取機制。在人工智能抓取體系中,這種差異可能進一步形成數據優勢。
人工智能研究學者張子昂接受大紀元採訪時說,過往中共宣傳主要依賴電視、報紙、搜索引擎和社交平台審查。在人工智能時代出現了新的情況:「宣傳系統不一定需要直接介入模型公司,也不需要技術入侵,只要持續、大規模釋放內容,就可能通過訓練數據反向進入全球人工智能體系。」
張子昂認為,人民網等中共官方媒體平台長期持續輸出統一政治表述,並通過轉載網絡、門戶網站和搜索系統不斷擴散。他表示:「真正值得警惕的不是幾篇宣傳文章進入模型,而是模型開始學習一種敘事方式。當用戶不斷得到同一種解釋,時間久了,它可能變成默認認知。這種影響比傳統宣傳更隱蔽。」
中共宣傳滲入AI訓練體系
美國多所高校研究人員組成團隊,首次通過同行評審方式追蹤中共官方媒體進入人工智能訓練體系的路徑,研究對象包括新華社、《人民日報》、學習強國等官方平台。
研究團隊分析開源中文數據集CulturaX發現,該數據庫包含約1.89億份中文文檔,中共官方媒體內容規模達到中文維基百科的41倍;在「黨代會」「中央委員會」等政治詞彙中,官方內容占比達到四分之一。
隨後,研究人員測試ChatGPT、Claude、Gemini及DeepSeek等主流模型發現,在涉及中國政治議題時,中文回答與英文回答出現明顯差異。部分模型在中文環境下能夠自然接續習近平近年來使用的政治論述,並給出較正面的解釋;英文回答則相對保留,DeepSeek則在中英文環境中保持高度一致。
參與研究的美國加州大學聖迭戈分校中國數據實驗室聯合主任Molly Roberts說:「威權政府現在可以通過人工智能,跨越國界塑造全球信息消費。」
中共高薪搶奪美國人工智能專家
廣東網絡技術工程師馮琪(化名)對記者表示:「報導提到的中共宣傳被人工智能抓取是事實。我在使用Claude時發現,關於中國部分的大量用詞出自官方敘述,比如把失業說成靈活就業、城鎮調查失業率、領導幹部、黨員幹部。這些詞彙不該出現在境外模型上,ChatGPT也存在這個問題。」
馮琪透露,中共當局正在挖角美國矽谷的工程師:「廣東、浙江、北京的人工智能公司都在領英挖人,尤其在美國矽谷一線AI企業工作的員工和頭部AI企業工程師最受歡迎。如果你帶著最新技術,將得到幾十萬元(人民幣,下同)到上千萬元的獎勵。現在國內對研發人工智能的需求比芯片大多了。」
研究指出,這種影響無需技術入侵。新華社、《人民日報》等官方內容可以長期免費開放、大量轉載,更容易進入人工智能抓取體系;相比之下,眾多獨立媒體受版權、付費牆限制。媒體研究學者張誠對記者說:「用戶看到的是人工智能給出的答案,卻不知道背後是誰長期提供內容」。研究擴大至37國後發現,新聞自由度越低,其語言環境中的AI輸出越容易接近政權敘事。
責任編輯:林琮文#






