GPT-4：OpenAI 發布了新版本的 ChatGPT 聊天機器人，但有什麼不同？

Jarod

突破性的 ChatGPT 發布四個月後，背後的公司宣布了其「更安全、更一致」的繼任者 GPT-4。

ChatGPT 的創建者OpenAI 將其描述為一個具有「有史以來最好的功能和一致性結果」的模型，它花了六個月的時間開發這個改進的版本，承諾更具創造力，並減少錯誤訊息和偏見的可能性。

然而，該公司警告說，它仍然容易出現「幻覺」——這是指聊天機器人傾向於編造事實或給出錯誤的反應。

鑑於人工智慧 (AI) 機器人基於分析大量線上數據進行學習，ChatGPT 在某些領域的失敗及其用戶體驗有助於使 GPT-4 成為更好、更安全的工具。

據 OpenAI 稱，「GPT-4 比 GPT-3.5 更可靠、更有創意，並且能夠處理更細緻的指令」。

GPT-4：發生了什麼變化以及改進了什麼？

OpenAI 聲稱 GPT-4 在生成創意作品（例如劇本和詩歌以及創作歌曲）方面更具創造性，並且具有改進的模仿用戶寫作風格以獲得更個性化結果的能力。

GPT-4 進一步被描述為「多模式」模型，這意味著它可以接受文字和圖像形式的不同輸入。

因此，它將能夠透過分析圖像的組成部分來產生標題並提供回應。

也許更令人印象深刻的是，由於其新的高級推理能力，OpenAI 的新系統現在可以通過各種標準化測試。

例如，該技術的早期版本無法通過律師協會的法律考試，並且在大多數先修課程測試中表現不佳，尤其是在數學方面。

據 OpenAI 稱，GPT-4 有可能在美國參加統一律師考試的學生中取得前 10% 的成績。

該公司的測驗還表明，該系統在 SAT 考試中可以獲得 1,300 分（滿分 1,600 分），並且在微積分、心理學、統計學和歷史等科目的先修分班考試中獲得 5 分滿分。

GPT-4 有哪些限制？

儘管改進版聊天機器人的功能聽起來令人印象深刻，但 GPT-4 仍然受到「幻覺」的阻礙，並且容易編造事實。

雖然根據OpenAI 的說法，GPT-4 在測量這些幻覺的測試中得分“高出40%”，但該公司承認“GPT-4 仍然存在許多我們正在努力解決的已知局限性，例如社會偏見、幻覺和對抗性」。提示」。

到目前為止，其他限制還包括無法存取影像輸入功能。雖然知道 GPT-4 將能夠根據食材圖片建議餐點可能會令人興奮，但這項技術尚未可供公眾使用。

此外，GPT-4 最初將專門向 ChatGPT Plus 的訂閱者發布，這是一項每月費用為 20 美元（18.90 歐元）的高級服務。