研究显示 ChatGPT 可为科学假说生成虚假数据集,对学术诚信造成威胁
11 月 24 日消息,據《自然》雜志當地時間周三報道,本月初發表在《美國醫學會眼科學雜志》上的一篇論文中,作者使用了聊天機器人 GPT-4 和高級數據分析工具 ADA 創建了一個虛假的臨床試驗數據集,從而支持一個“未經證實”的科學主張。
注:ADA 是一種結合了 Python 的模型,可用來執行統計分析、創建可視化數據。
報道稱,論文作者要求 GPT-4 和 ADA 生成一個有關角膜炎患者的數據集,并讓它支持“深層前部角膜移植(DALK)在視力和眼睛成像測試方面比穿透性角膜移植(PK)效果更好”的結論。
由 AI 生成的數據包括 160 名男性參與者和 140 名女性參與者的實驗結果,并支持了上述結論,然而這個結果與真正臨床試驗顯示的結果不符。
專家對該虛假數據集進行了詳細檢查,并發現其中存在明顯捏造跡象。英國曼徹斯特大學生物統計學家杰克?威爾金森表示,“要創建至少表面上看似可信的數據集似乎很容易,在未經訓練的人看來,這‘肯定是’一個真實的數據集。”
參與這份研究報告的作者承認,這一數據集在經過“仔細觀察”之后就可發現其中存在的缺陷,但如果讀者快速查看這些數據集的話,就“很難識別出”數據中的非人類來源。
由 AI 編造的“可信數據”增加了研究人員和期刊編輯對學術研究誠信的擔憂。《EMBO Reports》雜志主編 Bernd Pulverer 表示,“現實中的同行評審往往不會對數據進行全面的重新分析,因此不太可能發現利用人工智能精心設計的完整性漏洞。”他補充說,期刊需要更新質量檢查,以識別 AI 生成的合成數據。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,所有文章均包含本聲明。
總結
以上是生活随笔為你收集整理的研究显示 ChatGPT 可为科学假说生成虚假数据集,对学术诚信造成威胁的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: leedcode05 找出缺失的观测数据
- 下一篇: TP-LINK 首款 Wi-Fi 7 室