【大紀元2025年08月01日訊】(大紀元記者安琪加拿大溫哥華編譯報導)《100英里飲食(The 100-Mile Diet)》的作者James Bernard MacKinnon近日入稟法院,指控四家科技巨頭未經授權使用書籍的內容,用於訓練人工智能軟件。
MacKinnon還撰寫了《曾經與未來的世界(The Once and Future World)》,他是四起訴訟的原告代表之一。根據提交給卑詩省最高法院的訴訟,這四起訴訟代表加拿大的作家,他們的書被科技巨頭用來訓練AI語言模型。
訴訟的被告包括:製造半導體與繪圖處理器、市值4.2兆美元的Nvidia Corp.;擁有Facebook、Instagram與WhatsApp、市值1.3兆美元的Meta Platform;由 Open AI前成員創立、投資人包括亞馬遜與谷歌公司的Anthropic;以及AI領域的私人資料雲端公司初創公司Databricks。
這些訴訟與其他在英國和美國提出的訴訟類似,在英國和美國的這類訴訟成敗參半,目前仍在審理中。
根據對Nvidia最新提出的索賠,這些公司依賴龐大的線上圖書館來訓練大型人工語言模型。
針對Anthropic的訴訟是在5月提出,Meta Platforms的訴訟是在4月,Databricks的訴訟則是在7月,所有這些訴訟均已提交給在卑詩省最高法院。
這四項集體訴訟都必須先獲得法院認證,才能進入審理程序,但目前尚未有任何一例獲得認證。
根據訴訟內容,原告指控Nvidia未依賴公有領域的書籍或已獲授權使用的書籍來訓練其模型,而是「依賴在網路上找到的盜版資料集」,而Nvidia明知該資料集包含未經授權的版權資料。
訴訟指出,Nvidia「並沒有意圖向這些版權所有者支付費用,以取得或使用他們的作品」,而且忽略並隱瞞版權保護。
根據訴訟內容,為了建立大型語言模型(一種模仿人類自然語言的人工智能軟體,英文簡稱LLM),必須從各種來源擷取大量文字,並從中「學習」語言。Nvidia使用並複製了一個名為Pile的資料集,其中包含一個名為Books3的資料庫,該資料庫取自Bibliotik,混合了小說與非小說書籍。
該公司還表示,Bibliotik包含約196,640本書籍,其中包括「加拿大作者擁有有效版權保護」的書籍,MacKinnon的作品也在其中。
訴訟稱,「Nvidia下載Books3資料集時,並未向原告或集體訴訟成員支付授權費用,就將其用於訓練Nvidia LLM 。」。同時Nvidia「使用軟體移除書本中的版權管理資訊」,並知道「受版權保護的電子書在販售時有防止未經授權複製的技術保護措施」,但卻忽略並移除這些措施,因此LLM本身不知道它是由受版權保護的資料所建立。
該索賠聲明指出,Nvidia從侵權行為中獲利,而原告因其著作權被侵犯、作品完整性受損而蒙受損失。
該索賠要求的補償包括要求法院頒布禁止令,以阻止Nvidia侵犯版權,同時計算相關利潤,並賠償給版權所有者,以及因 Nvidia「一再、故意和明知故犯地侵犯」他們權利的懲罰性損害賠償,因為Nvidia的行為是「高高在上、傲慢無禮和罔顧後果」。
聯席律師Reidar Mogerman表示,在這些為創作者尋求版權保護的案件中,科技公司辯稱他們不應該為存取內容付費,因為AI如此具有變革性,它會改變一切的方式,而且對社會非常重要。
他表示,加拿大訴訟案所講述的事實,也就是這些公司如何使用受版權保護的素材,與美國訴訟相同,但「加拿大法院比美國更能保護版權」,他希望訴訟能夠成功。◇
責任編輯:李盈







