微軟悄悄刪除千萬人臉識別數據庫

人氣 4039

【大紀元2019年06月06日訊】(大紀元記者洪雅文編譯報導)隨著人臉識別數據是否侵犯人權的議題在國際延燒,微軟(Microsoft)日前悄然刪除其最大的公共人臉識別數據庫,美國斯坦福大學(Stanford University)和杜克大學(Duke University)也相繼刪除了面部識別數據。

據《金融時報》報導,在微軟使用旗下最大數據庫的數天之後,該公司悄悄從互聯網上,撤下他們面向全球面部識別系統的數據庫資料,刪除大約1,000萬張人臉信息。微軟表示,「這個網站的目的是為了學術需求。後來交由不再與微軟合作的員工運營,現在(網站)已被移除。」

這個數據庫名為MS Celeb,於2016年發布,被微軟稱之為全球最大的公共面部識別數據庫,擁有超過1,000萬張圖像,將近10萬人的面部信息。MS Celeb主要用於訓練多個國家地區的面部識別系統,其中包括:軍事研究人員和商湯科技(SenseTime)、曠視科技(Megvii)等中國公司。

根據人工智能論文中的引文可見,已經有多個商業組織在使用MS Celeb數據庫,IBM、松下電氣(Panasonic)、阿里巴巴、輝達(Nvidia)、日立、商湯科技、曠視科技均有使用。而商湯科技和曠視科技都是中共新疆政府的設備供應商,當地大批維吾爾人和穆斯林少數民族被當局追踪、關押在拘留營中。

由於數據庫所使用的照片,沒有徵得照片當事人的同意,微軟根據《知識共享許可協議》(Creative Commons license)將他們的面部數據信息從搜索引擎和視頻中去除。

除了微軟刪除人臉數據庫資料以外,另有兩個學術單位也刪去了相關數據,包括由杜克大學研究人員建造的Duke MTMC監控數據庫,和斯坦福大學的Brainwash數據庫。

Brainwash數據庫使用的信息來自舊金山下海區的Brainwash咖啡館的顧客,他們通過直播相機拍攝登門的消費者。斯坦福大學發言人表示,在其中一位研究者提出要求後,已經刪除了數據庫,該校致力保護學校和社區的個人隱私。

杜克沒有回應評論請求。

這三個數據庫的侵權問題都是由柏林研究員亞當·哈維(Adam Harvey)所發現,他的百萬畫素(Megapixels)項目記載了諸多數據庫的詳細信息以及使用方式。哈維調查發現,微軟本身已經使用這些數據庫來訓練面部識別的計算。

微軟將數據庫命名為「Celeb」(名流),表明它所概括的面孔是公眾人物的照片。經媒體查證,MS Celeb確實包括了一些特別人物、媒體人的信息,例如:基姆·澤特(Kim Zetter)《連線》雜誌的高級記者,報導涉及網絡犯罪、公民自由、隱私和安全等主題。阿德里安·陳(Adrian Chen)和《監視資本主義時代》作者肖沙娜·朱伯夫(Shoshana Zuboff)。

哈維指出,微軟利用「名人」(celebrity)一詞來包括僅僅只是在網上工作,並在數位世界擁有知名度的人。

當《金融時報》聯繫被收錄在數據庫的當事人時,他們未意識到自己的照片已經被收錄。科技類別作家亞當·格林菲爾德(Adam Greenfield)說,「我絕不是一個公眾人士,我沒有辦法放棄我的隱私權。」「這表明微軟無法讓自己的研究人員保持誠信和正直,在員工離職之前報廢(數據庫)。」

阿蘭·圖靈研究所(Alan Turing Institute)技術政策研究員邁克爾·維爾表示表示,微軟可能違反歐盟通過的《一般資料保護法》(General Data Protection Law),該法規於去年生效,MS Celeb數據庫在法規生效後投入使用。

對此,微軟表示,該網站已經刪除,尚不清楚《一般資料保護法》是否帶來影響。

儘管數據庫已被微軟刪除,但仍可供以前下載過的研究人員和公司使用。哈維表示,它仍然在開源網站上分享。#

責任編輯:林妍

相關新聞
廣州地鐵啟用人臉識別 大陸被指像大監獄
楊寧:人臉識別算法中國領先背後的恐怖
人臉解鎖誰家最安全 蘋果一枝獨秀
識別非裔人臉準確度高 海康威視背後是什麼
如果您有新聞線索或資料給大紀元,請進入安全投稿爆料平台
評論