GPT-4:OpenAI 發布了新版本的 ChatGPT 聊天機器人,但有什麼不同?

突破性的 ChatGPT 發布四個月後,背後的公司宣布了其「更安全、更一致」的繼任者 GPT-4。

ChatGPT 的創建者OpenAI 將其描述為一個具有「有史以來最好的功能和一致性結果」的模型,它花了六個月的時間開發這個改進的版本,承諾更具創造力,並減少錯誤訊息和偏見的可能性。

然而,該公司警告說,它仍然容易出現「幻覺」——這是指聊天機器人傾向於編造事實或給出錯誤的反應。

鑑於人工智慧 (AI) 機器人基於分析大量線上數據進行學習,ChatGPT 在某些領域的失敗及其用戶體驗有助於使 GPT-4 成為更好、更安全的工具。

據 OpenAI 稱,「GPT-4 比 GPT-3.5 更可靠、更有創意,並且能夠處理更細緻的指令」。

GPT-4:發生了什麼變化以及改進了什麼?

OpenAI 聲稱 GPT-4 在生成創意作品(例如劇本和詩歌以及創作歌曲)方面更具創造性,並且具有改進的模仿用戶寫作風格以獲得更個性化結果的能力。

GPT-4 進一步被描述為「多模式」模型,這意味著它可以接受文字和圖像形式的不同輸入。

因此,它將能夠透過分析圖像的組成部分來產生標題並提供回應。

也許更令人印象深刻的是,由於其新的高級推理能力,OpenAI 的新系統現在可以通過各種標準化測試。

例如,該技術的早期版本無法通過律師協會的法律考試,並且在大多數先修課程測試中表現不佳,尤其是在數學方面。

據 OpenAI 稱,GPT-4 有可能在美國參加統一律師考試的學生中取得前 10% 的成績。

該公司的測驗還表明,該系統在 SAT 考試中可以獲得 1,300 分(滿分 1,600 分),並且在微積分、心理學、統計學和歷史等科目的先修分班考試中獲得 5 分滿分。

GPT-4 有哪些限制?

儘管改進版聊天機器人的功能聽起來令人印象深刻,但 GPT-4 仍然受到「幻覺」的阻礙,並且容易編造事實。

雖然根據OpenAI 的說法,GPT-4 在測量這些幻覺的測試中得分“高出40%”,但該公司承認“GPT-4 仍然存在許多我們正在努力解決的已知局限性,例如社會偏見、幻覺和對抗性」。提示」。

到目前為止,其他限制還包括無法存取影像輸入功能。雖然知道 GPT-4 將能夠根據食材圖片建議餐點可能會令人興奮,但這項技術尚未可供公眾使用。

此外,GPT-4 最初將專門向 ChatGPT Plus 的訂閱者發布,這是一項每月費用為 20 美元(18.90 歐元)的高級服務。