OpenAI 表示,如果沒有受版權保護的材料,訓練人工智慧是“不可能的”

人工智慧 (AI) 聊天機器人 ChatGPT 背後的公司 OpenAI 表示,如果不使用受版權保護的資料,「不可能」訓練他們的人工智慧工具。

在此之際,OpenAI 面臨多起與其使用受版權保護相關的訴訟。文章,圖書,以及訓練 ChatGPT 的藝術。其他人工智慧公司也面臨類似的訴訟。

生成式人工智慧工具接受來自網路的大量內容的訓練,用於分析和學習模式以產生新的類人內容。

「因為今天的版權幾乎涵蓋了人類的每一種表達方式——包括部落格文章、照片、論壇貼文、軟體程式碼片段和政府文件——如果不使用受版權保護的資料,就不可能訓練當今領先的人工智慧模型,」OpenAI 在書面文件中辯稱。上個月向英國上議院提交了證據。

英國報紙首先報導了該公司作為大語言模型 (LLM) 調查的一部分的回應電訊報

開放人工智慧聲稱將訓練資料「限制」為公共領域的內容「不會提供滿足當今公民需求的人工智慧系統」。

它補充說,雖然該公司認為“版權法並不禁止培訓”,但它也承認“在支持和賦權創作者方面仍有工作要做”。

聊天GPT2022 年 11 月發布的《人工智慧》由於過去一年的受歡迎程度激增,加速了人工智慧工具的進步。

但人們也擔心,產生書面內容和藝術品的人工智慧工具將導致多個產業失業。

OpenAI 回應《紐約時報》訴訟

《紐約時報》是最新一家這樣做的公司對 OpenAI 提起訴訟侵犯版權,認為人工智慧公司欠他們「數十億美元的法定和實際損失」。

這份長達 69 頁的訴訟聲稱 OpenAI 非法使用《紐約時報》的作品來創造可與媒體公司競爭的人工智慧系統。

訴訟稱,OpenAI 的工俱生成「逐字背誦《紐約時報》內容、對其進行仔細總結並模仿其表達風格的輸出,正如數十個示例所證明的那樣」。

訴訟中的一個例子顯示了 GPT-4 中的一段文本,該文本與《紐約時報》2019 年獲得普立茲獎的計程車行業調查非常相似。

該訴訟強調,這些工具對於 OpenAI 和其最大投資者微軟也帶來了極其豐厚的利潤。

OpenAI 本週在一份聲明中做出了回應單獨的部落格文章針對美國報紙的訴訟,認為利用網路上提供的材料訓練人工智慧模型是“合理使用”,而《紐約時報》的案件“沒有法律依據”。

該公司表示,它一直致力於與新聞機構建立合作夥伴關係,以“創造互利的機會”,並表示新聞媒體只是用於訓練人工智慧系統的內容的“一小部分”。

這家人工智慧公司已與媒體公司達成交易,例如美聯社阿克塞爾·施普林格擁有 Politico、Business Insider、Bild 和 Welt 等媒體公司,授權其培訓內容。

OpenAI 還在其部落格文章中辯稱,它有一個簡單的選擇退出來阻止其訪問出版商的網站。

它補充說,記憶和重複培訓內容是該系統的“失敗”,該系統旨在將概念應用於“新問題”。