site logo: www.epochtimes.com

多倫多大學報告揭祕微信如何過濾圖片

人氣: 7038
【字號】    
   標籤: tags: , , ,

【大紀元2019年07月18日訊】(大紀元記者周行多倫多綜合報導)有人可能認為,在微信上通過圖片對話,可以避開審查,其實沒這回事。多倫多大學的一項研究,揭示了微信如何實時、自動地審查聊天中所發送的範圍廣、數量巨大的圖片。

多倫多大學公民實驗室(Citizen Lab)在7月15日發表的這份最新研究報告名為「『未閱先焚』2——微信如何實現實時審查用戶對話中的敏感圖片」。

按中共政府的規定,網絡公司需要對自己平台上的內容進行審查。公民實驗室去年發表的研究報告顯示,微信通過巨量計算,審查在朋友圈(Moments)發送的圖片。這次針對用戶聊天中圖片審查的研究發現,微信使用較便宜的哈希索引(Hash Index)過濾圖片。

該研究對比了微信朋友圈、一對一聊天及群組聊天的圖片審查比例,發現這3項功能的敏感圖片庫並不相同,朋友圈和群組聊天所審查的範圍遠大於一對一聊天。

不斷擴展敏感圖片庫

公民實驗室去年發現,微信審查朋友圈圖片使用的是基於光學字符識別(OCR)方法,將圖像中的文字與黑名單上的關鍵字進行比較;用基於視覺的方法將圖片上的圖像指紋與像黑名單上的圖像指紋進行比較。

該實驗室今年的報告稱,基於光學字符識別的算法計算成本太高,無法應用於聊天的實時過濾。「我們發現,微信使用另一種稱為哈希索引的辦法,當用戶發送的圖片被微信服務器之一接到後,這服務器會計算其加密哈希值。如果哈希值在哈希索引(即黑名單)中,該圖片就被過濾,即不會被發送給目標用戶。」

這是一種可以迅速將一個文件中的數據與指紋(或哈希值)對比的技術,所以,這種計算法適用於實時過濾應用程序。但是,這方法非常不靈活,因為圖像的微小變化就會從根本上改變其加密哈希值。

研究人員發現,為克服這些限制,微信在實時過濾通過後,採用計算成本較高的基於光學字符識別算法,來補充哈希索引的不足。研究人員將屬於黑名單的圖像做了小更改後發出,第一次都能通過審查,「當我們幾秒鐘後再次發送這張圖片時,它就被過濾掉了。」

也就是說,這些圖片因為做了小修改,其哈希值變了,所以通過了審查。但微信隨即對其做基於光學字符識別算法的審查,發現其屬於敏感圖片後,把其哈希值加入了黑名單中。

群聊和一對一聊天有不同的黑名單

多倫多大學公民實驗室的研究發現,微信使用不同的黑名單來過濾多人聊天及一對一聊天。儘管一對一和群聊都使用哈希索引過濾圖片,但它們並不共享黑名單。

研究人員拿一張同時屬於朋友圈、群聊和一對一聊天黑名單的圖片做了修改,使其擁有新的加密哈希值,然後做了這樣的試驗:

1. 通過群聊發送一次該圖片,不會導致該圖片隨後在一對一聊天中發送時被過濾。只有在一對一聊天中發送第二次時,該圖片才被過濾掉。

2. 同樣,通過一對一聊天發送一次該圖片,不會導致該圖片隨後在群聊中發送時被過濾。只有在群聊中發送第二次時,該圖片才被過濾掉。

3.  通過朋友圈發送一次這張圖片,不會導致該圖片隨後在群聊或一對一聊天中發送時被過濾。

研究人員對3個不同黑名單的研究發現,朋友圈和群聊的圖片黑名單,比一對一聊天的黑名單更長。去年11月15日,研究人員對黑名單中111張敏感圖片做了分析,發現有36張敏感圖片同屬於一對一聊天、朋友圈和群聊的黑名單;另外71張敏感圖片在朋友圈和群聊的黑名單中都有。朋友圈和群聊各有2張自己獨有的敏感圖片;一對一聊天完全沒有自己獨有的敏感圖片。

哪些屬於敏感圖片?

報告的另一部分內容,是對微信審查圖片的主題進行分類。在收集的超過200張被過濾的敏感圖中,與中共政府有關的圖片有75張,內容不單有諷刺漫畫,也有中性的政府政策、領導人圖片。比如有一張顯示的是習近平2019年3月訪問意大利前夕,一名藝術家在意大利使用拖拉機在田野上創作的習近平微笑的巨大頭像。

與新聞事件有關的圖片有60張,內容涉及文革、天安門事件、范冰冰逃稅事件、最高法院卷宗丟失事件、華為孟晚舟事件、中美貿易戰、2018美國中期選舉、胚胎基因編輯事件,等等。

令人吃驚的是,這些在被過濾的圖片中,有中共官媒《環球時報》發表過的5張圖片,有些與華為有關,其中一張與持不同政見者郭寶勝有關。還有些被過濾的圖片,是中共喉舌機構新華社發表的,其中一張與去年7月官方對疫苗醜聞的調查有關。

多倫多大學公民實驗室去年和今年的研究都顯示,微信的過濾政策不透明,外界很難推測其審查機制是如何運作的。比如在之前的研究中發現,有些被過濾的內容,只是用中國大陸電話號碼註冊的帳號看不到了,使用國際電話號碼註冊的帳號還可以看到。微信過濾帖子後,不會通知發帖人,發帖人還是可以看到自己貼的、被過濾掉的內容。#

責任編輯:滕冬育

評論