OpenAI 是熱門聊天機器人 ChatGPT 背後的公司,它對不同工作接觸人工智慧 (AI) 的數字進行了統計,這些數字令人大開眼界。
研究人員利用最新的機器學習語言模型 (LLM)、最近發布的 GPT-4 以及人類專業知識,調查了語言模型對美國就業市場職業的潛在影響。
儘管研究人員強調這篇論文不是預測,但他們發現大約 80% 的美國勞動力可能至少有 10% 的工作任務受到 GPT(產生預訓練變壓器)的影響。
同時,約 19% 的員工可能會發現至少 50% 的任務受到影響。
這篇論文由 OpenAI、OpenResearch 和賓州大學的研究人員撰寫,研究了工作任務對人工智慧的「暴露」——「不區分勞動力增強或勞動力取代效應」。
研究人員將「暴露」定義為衡量存取 GPT 支援的系統是否可以將人類執行特定工作任務所需的時間減少至少 50% 的指標。
哪些工作最「暴露」?
在這項研究中,人類專家和人工智慧分別計算了不同職業的暴露程度。語言模型將 86 個工作標記為「完全暴露」。
作者指出,完全暴露並不意味著任務可以透過這些技術完全自動化,但這意味著他們估計 GPT 可以節省工作人員「完成大部分任務的大量時間」。
人類將 15 種職業標記為完全暴露,而語言模型將 86 種職業標記為完全暴露。
人類發現 100% 暴露的職業是:
- 數學家
- 報稅員
- 金融量化分析師
- 作家和作家
- 網頁和數位介面設計師
人類列出的其他高比例職業是:
- 調查研究者 (84.4)
- 作家與作家 (82.5)
- 口譯員和筆譯員 (82.4)
- 公共關係專家(80.6)
- 動物科學家 (77.8)
同時,語言模型將以下內容列為 100% 暴露的:
- 數學家
- 會計師和審計師
- 新聞分析師、記者和記者
- 法律秘書和行政助理
- 臨床數據經理
- 氣候變遷政策分析師
語言模型也發現這些工作暴露的比例超過 90%:
- 信函文員
- 區塊鏈工程師
- 法庭記者和同步字幕員
- 校對員及抄寫員
作者總結道:“我們觀察到,大多數職業都存在一定程度的 GPT 暴露,工資較高的職業通常會承擔更多暴露程度較高的任務。”
研究的局限性
作者指出了他們研究的一些局限性,其中一位 OpenAI 研究員 Pamela Mishkin 在 Twitter 貼文中強調了這些局限性。
「今天的GPT 可以做很多事情。在過去的幾年裡,我們看到它們在解決越來越複雜的任務方面做得越來越好,而相關任務的示例越來越少,」她寫道。
該論文研究了這一趨勢,而不是當今可用的任何特定模型」。
發現的第一個限制是他們的方法依賴標籤的主觀性,這可能導致對人類研究人員不熟悉的職業中的某些工作任務的 GPT 的可靠性和有效性做出有偏見的判斷。
他們還指出,GPT-4 結果“對標題的措辭、提示的順序和組成以及提示中的其他細節的變化很敏感”,這意味著人類和 LLM 提示是不同的。
此外,作者承認,目前尚不清楚職業在多大程度上可以完全分解為具體任務,以及這種方法是否忽略了勝任工作所需的某些技能或任務類別。