馬斯克 (Elon Musk) 的人工智慧 (AI) 聊天機器人 Grok 並不像開源正如他所說,根據定義管理者的說法,許多聲稱自己是這樣的公司也不是。
開源促進會 (OSI) 成立於 1998 年,是一個捍衛開源術語的非營利組織。目前它正在努力更新其定義以包含開源人工智慧。
開源通常意味著軟體的原始碼可供公共領域的每個人使用、修改和分發。
OSI 定義規定,它還必須遵守 10 項標準,包括以合理的成本或免費獲得原始程式碼的公開方式、不存在歧視,以及許可證不限制其他軟體。
但根據 OSI 的 10 分來評估人工智慧系統更加困難。
OSI 執行董事 Stefano Maffulli 告訴 Euronews Next:“我們一直使用的開源軟體定義,並不能完全適用於人工智慧系統。”
聲稱自己是開源的人工智慧公司,例如馬斯克最新的人工智慧企業,開源了權重——影響人工智慧模型表現的數值參數——但沒有開源它所訓練的資料和訓練過程。
Maffulli 表示,這意味著它不能開源,因為使用哪些資料來訓練權重並不透明,如果資料有偏見,可能會導致版權問題和道德問題。
「這些[重量]是新事物,這是歷史上的一個非常新的時期,我們擁有一種新的人工製品,它仍然是人類聰明才智、智力和創造力的產物,」他說。
「但同時也是由大型計算機完成的半隨機計算的詳細闡述」。
“尋求真相”
馬斯克先前在其社群媒體平台X上發文稱,他的開源AI是「迄今為止最透明、最求真」的,並起訴OpenAI放棄了與微軟合作造福人類的初衷。透露權重訓練的數據。
事實上,公司幾乎沒有動力這樣做,因為當你宣布你的數據是基於什麼時,你就面臨版權訴訟。
「在我們對法律方面有一點澄清之前,我認為我們仍然會目睹此類問題,」馬富利說。
所謂的開源人工智慧公司可能不想完全透明的另一個原因是保護商業機密。
因此,OSI 在定義開源人工智慧方面面臨著一項艱鉅的任務。兩年前,OpenAI 的 ChatGPT 於 2022 年 11 月嶄露頭角後,該組織開始了這項探索。
他說,在定義開源人工智慧時,最大的障礙是理解訓練集中的資料與模型權重之間的依賴性。
如何定義開源人工智慧
OSI 首先召集了一群來自 Mozilla 基金會和維基百科等組織的初始專家,但也有民間團體、大學以及 Microsft 和 Meta 等大型科技公司的專家。
隨後,工作小組評估了三種生成式 AI 模型——Meta 的 Llama、Illusion AI 和 Bloom,以及使用機器學習的非生成式 AI 模型。
工作小組投票決定了人工智慧系統開源的最低要求。
馬富利表示,工作小組「都表示至少要對數據透明度有最低要求」。
OSI 目前正在完善該定義草案,預計將在夏季向公眾發布。
但這並不意味著定義最終確定後,OSI將排在馬斯克或其他自稱開源AI公司之後。
「我們是定義的管理者和維護者,但我們實際上沒有任何強大的權力來執行它,」馬富利說。
他補充說,世界各地的法官和法院開始認識到開源定義的重要性,特別是在涉及合併和監管時。
世界各國正在最終確定他們將如何常規人工智慧而開源軟體一直是爭論的焦點。
「開源定義成為識別虛假廣告的障礙,」馬富利說。
「如果一家公司聲稱自己是開源的,那麼它就必須秉承開源定義所蘊含的價值觀。否則,這只會令人困惑」。