近日,一名圖書作者向法院提起訴訟,矛頭直指科技巨頭meta,指控其未經授權,擅自下載了海量盜版電子書,用于人工智能模型的訓練。
據泄露的內部郵件顯示,meta承認曾獲取過一個備受爭議的大型數據集LibGen,該數據集內含數千萬本盜版書籍。這一行為迅速引發了廣泛關注和爭議。
法庭文件進一步揭露,meta通過一個名為“安娜的檔案”的渠道,下載了至少81.7TB的數據,其中來自知名盜版網站Z-Library和LibGen的內容就占據了35.7TB。更令人震驚的是,meta還被指曾從LibGen額外下載了80.6TB的數據。
這位圖書作者強調,meta的這一行為不僅構成了非法的電子書庫種子下載,而且所揭露的數字可能只是其盜版行為的冰山一角。據作者估算,這些盜版電子書庫可能僅占meta盜版版權作品總量的0.008%,暗示其盜版規模可能遠超當前已知情況。
郵件內容還透露出meta內部員工對這一行為的法律風險的擔憂。2023年4月,meta的研究工程師尼古拉·巴什利科夫在郵件中表示,使用公司筆記本電腦下載BT文件感覺不妥。到了2023年9月,巴什科夫的擔憂進一步加劇,他咨詢了法律團隊,并明確指出,使用Torrents意味著對文件進行“播種”,即對外共享內容,這在法律上是不被允許的。
然而,盡管存在法律風險和內部員工的抗議,meta仍決定繼續其下載行為,并試圖通過將數據集下載到非meta服務器上來規避被追溯的風險。這一舉動無疑加劇了輿論對其盜版行為的質疑和譴責。
此次事件不僅揭示了meta在版權保護方面的嚴重疏忽,也引發了公眾對于科技巨頭在數據使用和隱私保護方面的廣泛擔憂。隨著調查的深入,更多關于meta盜版行為的細節或將逐漸浮出水面。