ChatGPT 被起诉索赔 30 亿,「未经允许收集并泄露个人信息」,16 人匿名状告 OpenAI
一天吃兩起官司,ChatGPT 現在有大麻煩了。
原因都和數據有關。
先是 16 人匿名起訴 OpenAI 及微軟,認為他們在未經允許的情況下使用并泄露了個人隱私數據,索賠金額高達 30 億美元。
緊接著,2 位全職作者提出,OpenAI 未經允許使用了他們的小說訓練 ChatGPT,構成侵權。
而且兩邊的原告都表示,OpenAI 從互聯網上搜刮的數據可太多了,除了他們以外還有非常多人的數據正在被違規使用。
網上的討論很多,有人表示作家就是應該維權,并且獲得適當的報酬。
但也有人認為,生成式 AI 學習互聯網數據就像是學生去參觀藝術作品一樣,應該選擇開放。
現在這兩起訴訟都被遞交到了加利福尼亞舊金山聯邦法院。
被告方 OpenAI 暫時沒有做出公開回應。
16 人索賠 30 億
先來看第一起訴訟。
6 月 28 日,16 位匿名人士向 OpenAI 及微軟發起訴訟,他們認為基于 ChatGPT 的 AI 產品在沒有告知或獲得本人同意的情況下,收集且泄露了他們的個人信息。
這種行為違反了 AI 模型數據相關的法律政策,而且沒有付費。
他們從互聯網、書籍、文章、網站和帖子中抓取了 3000 億個單詞,其中包括未經允許獲取的個人信息。
這其中包含賬戶信息、姓名、聯系方式、電子郵件、支付信息、交易記錄、瀏覽器數據、社交媒體信息、聊天數據、cookie 等等。
這使得個人信息被嵌入到了他們的 AI 產品中,而這些信息可以反映出個人愛好、觀點、工作履歷甚至家庭照片等。
原告認為 OpenAI 沒能充分將這些敏感信息進行過濾,會導致數百萬人面臨信息被泄露的風險。
而且他們指控如上抓取數據的行為,OpenAI 是“秘密進行”的,沒有按照適用法律要求的那樣注冊為數據代理商。
負責這次起訴的律師事務所 Clarkson,此前曾負責過數據泄露和虛假廣告等問題的大規模集體訴訟。
但能否勝訴目前還很不確定。
知識產權律師凱瑟琳?加德納(Katherine Gardner)表示,當用戶將內容上傳到社交平臺或者其他網站時,他們都會授予平臺廣泛許可,允許平臺使用他們的內容。
因此,普通用戶想要就 AI 模型的數據獲取問題獲得賠償,具有比較高的挑戰性。
以及有人發現在這份長達 157 頁的訴訟書中,大量引用了媒體及學界在 AI 倫理道德方面的討論和警告,但是對于造成實際影響的具體案例列舉不多。
另一邊,兩位美國作家也在同一天起訴 OpenAI,認為他們的作品被拿去訓練 ChatGPT。
具體的證據是,ChatGPT 能為他們的書生成“非常準確”的摘要,這足以說明這些書被收錄在數據庫中。
保羅?特朗布萊(Paul Tremblay)和莫娜?阿瓦德(Mona Awad)表示,ChatGPT 未經許可就從數千本書中拷貝數據,這侵犯了作者們的版權。
起訴書中預估,OpenAI 的訓練數據中至少包含 30 萬本書,其中很多來自侵權網站。
比如 OpenAI 在披露 GPT-3 訓練數據情況時,就表示其中包含兩個互聯網圖書語料庫,大概占比為 15%。起訴作者認為這些數據就是來自影子圖書館網站的,比如 Library Genesis、Sci-Hub 等。
以及在 2018 年,OpenAI 透露他們給 GPT-1 喂的數據中包含 7000 + 本小說。起訴方認為這些書是研究人員從一些盜版網站上復制下來的,而沒有獲得作者的同意或授權。
目前 OpenAI 方面沒有進行公開回應。
實際上,從生成式 AI 大火以來,AI 公司吃版權、數據隱私官司,也真的不稀奇了。
OpenAI 一直深陷數據風波
早在去年 11 月時,OpenAI 和 GitHub 一起推出的代碼助手 Copilot,就被程序員們告上了法庭。
原告們認為 Copilot 侵犯了眾多原創代碼作者的版權,同時還泄露了用戶隱私,因此向法院提起訴訟,索賠達 90 億美元。
但到目前為止,這個案件還沒有最終定論。
AI 畫畫那邊,Stability AI、Midjourney 等也同樣官司纏身。
因為發現只要輸入自己的名字,就能生成個人風格的畫作,畫家凱利?麥柯南(Kelly McKernan)聯合另外兩位創作者一起提起訴訟。
律師團隊和上面起訴 Copilot 的都是同一家。
以及網站平臺方也不愿意被白嫖數據。
這不最近馬斯克給推特限流,給出的理由就是“不想讓 AI 白嫖數據了”。目前限制措施還在實行中,還不知道之后會有怎么樣的變化。
Reddit 則表示自家平臺上的數據非常有價值,所以推出了付費 API,價格并不低,這個操作導致不少第三方應用被迫關閉。
總之,AI 在網絡上大規模抓取數據訓練后,帶來的隱私安全問題、版權問題層出不窮,被牽扯進來的人也越來越多。
但目前版權問題該怎么算,業內還沒有形成確定的規范。
只有日本方面傳出過消息,不會對訓練 AI 所使用的數據實施版權保護,因為這能加速 AI 發展。
參考鏈接:
-
[1]https://www.theregister.com/2023/06/28/microsoft_openai_sued_privacy/
-
[2]https://www.reuters.com/legal/lawsuit-says-openai-violated-us-authors-copyrights-train-ai-chatbot-2023-06-29/
-
[3]https://www.washingtonpost.com/technology/2023/06/28/openai-chatgpt-lawsuit-class-action/
本文來自微信公眾號:量子位 (ID:QbitAI),作者:明敏
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,所有文章均包含本聲明。
總結
以上是生活随笔為你收集整理的ChatGPT 被起诉索赔 30 亿,「未经允许收集并泄露个人信息」,16 人匿名状告 OpenAI的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: superset可视化-Bar Char
- 下一篇: superset出现unhashable