site logo: www.epochtimes.com

如何評估生成式人工智能提供的信息

隨著生成式人工智能創作的內容越來越多,如何評估生成式人工智能提供的信息,是大家要面臨的重要問題。(shutterstock)
人氣: 146
【字號】    
   標籤: tags: , ,

【大紀元2025年10月24日訊】隨著生成式人工智能創作的內容越來越多,如何評估生成式人工智能提供的信息,就成為大家要面臨的重要問題。

什麼是生成式人工智能?

生成式人工智能是一種可以根據使用者的提示生成新文字、圖像、音頻和視頻的人工智能。包括ChatGPT、谷歌(Google)的Bard和必應(Bing)的聊天機器人Chatbot等工具。

生成式人工智能可以創造模仿人類的寫作。它是一種基於海量資料集的機器學習,其遵循的語言模式是通過預測可能一起出現的單字組合而來。雖然生成式人工智能具備遵循模式的能力,這並不等於它也具備辨別事實的能力。實際上,生成式人工智能並不能理解其所創建文本的上下文或含義。

評估生成式人工智能提供的信息

評估資訊來源的原則也適用於生成式人工智能。諸如SIFT和RADAR之類的檢測步驟有助於評估資訊是否可靠。

然而,在諮詢生成式人工智能時,我們通常會問自己的一些關於資訊來源可靠性的問題可能更難獲得回答,因為生成式人工智能得出答案的過程並不是公開的。

那麼,應該如何評估生成式人工智能提供的資訊呢?

1. 比較:

尋找其它可靠來源來驗證人工智能的說法。試著找出涵蓋同一主題的其它來源,甚至是該說法的原始出處。

2. 檢查引用的文獻是否是虛構的:

我們可以要求生成式人工智能工具提供信息來源,但眾所周知,生成式人工智能會提供非常令人信服的虛假來源。

它甚至可以創建包含研究所詢問主題的真實研究人員姓名的引文。然而,引用的文章可能並不存在,或並非來自其引用的期刊。這些虛構的引文被稱為「幻覺」。

你需要搜索這些引文,確認這些文章確實存在,並且引述的內容是正確的。

3. 確認:

查證原始文章來源,並核實生成式人工智能工具所聲稱的在該文章中找到的資訊。人工智能並非專門為真實準確地引用而設計,因此它可能會引用一篇實際上並不包含該資訊的文章。

4. 檢查時效性:

時效性——文件的建立、編輯、更新或修訂時間——是評估任何資訊來源的重要因素。如果您需要有關世界事件或新研究進展的最新信息,生成式人工智能的資料集中可能不包含這些資訊。截至 2023年10月,如果你問ChatGPT(GPT-3.5)它所訓練的資料有多新,它會告訴你它的資訊來自2021年,而且它無法從網路上取得最新資訊。

巡迴的詛咒

隨著生成式人工智能創作的內容越來越多,最終這些內容將進入下一代人工智能的訓練資料集。這可能會導致數據品質下降,因為人工智能產生的錯誤信息可能會隨著時間的推移而不斷累積。

Shumailov 等人在其2023年發表的論文《巡迴的詛咒:基於生成資料的訓練使模型遺忘》(The Curse of Recursion: Training on Generated Data Makes Models Forget)中提出並測試了這個想法。他們發現,在訓練資料集中加入人工智能生成的內容會導致模型崩潰——「這是一種退化過程,隨著時間的推移,模型會忘記真正的底層資料分佈,即使分佈沒有隨時間變化」。

責任編輯:瑞木悅

 

 

評論