本週早些時候,OpenAI 推出了其最新的人工智慧模型,GPT-4o,承諾對 ChatGPT 的功能進行重大升級。
在 GPT-4 成功的基礎上,這個新模型旨在使 ChatGPT 更聰明、更易於使用,並可供所有用戶(包括那些沒有付費訂閱的用戶)使用。
新GPT-4o型號的發布引起了許多關注示威它展示了其新功能,例如視覺輸入的高級分析、求解複雜的數學方程式以及解釋面部表情。
新模型還能夠產生內容並理解語音、文字或圖像中的命令,同時提供即時回應。
自發布以來,用戶已經找到了使用 GPT-4o 的創意方法,並在線上分享了他們的結果。
以下是 OpenAI 最新模型的一些最佳用例。
數據分析
GPT-4o 已展示了在短短 30 秒內處理電子表格和進行數據分析的能力。
只需一個提示,GPT-4o 就可以讓使用者快速將原始資料轉換為見解,並作為產生圖表、圖形和統計摘要的工具。
建立 3D 模型
GPT-4o 還可以在 30 秒內根據文字提示產生 3D 模型。
此功能有助於快速原型製作,無需專門的軟體或廣泛的技術知識即可創建和視覺化詳細模型。
歷史文本的轉錄
GPT-4o 擁有先進的影像辨識功能,使用者以各種創意的方式使用了該功能。
其中包括使用它來轉錄可追溯到 1800 年的舊著作。
臉部表情分析
由於其先進的影像辨識功能,GPT-4o 可以詳細解讀人臉和臉部表情。
它還可以廣泛分析人類的面部表情,並詳細描述人們的情緒狀態或他們的面部通常傳達的情緒。
即時翻譯
GPT-4 可以進行多種語言的即時翻譯。
此功能使用戶能夠接收即時翻譯,促進不同語言環境中的溝通和互動。
數學
ChatGPT 首次推出後,有人批評其無法執行簡單的數學運算。
然而,最新的模型 GPT-4o 具有增強的推理能力,可以更準確地回答複雜的數學問題。
它還提供了解決這些問題所涉及的步驟的詳細說明。
生成視頻遊戲
用戶僅根據螢幕截圖在幾秒鐘內成功創建了一個視頻遊戲。
Alvaro Cintra 使用 GPT-4o 為一款名為“Breakout”的完全運行的視頻遊戲生成了 Python 代碼,從遊戲的屏幕截圖和簡單的提示開始:“您能用 Python 編寫這個代碼嗎?”
視覺輔助功能
從積極的方面來看,GPT-4o 的先進功能可以透過提供即時視覺幫助,讓弱視人士更容易接觸世界。
該技術可以描述周圍環境、識別物體和閱讀文本,幫助導航和與環境互動。
編碼
GPT-4o 繼續展示先進的編碼功能,因為使用者已成功地將其用於各種程式設計任務。
一名用戶能夠在幾秒鐘內產生 Facebook Messenger 程式碼並複製網站。
另一個例子包括產生的用戶基於頁面佈局繪圖的網頁的 HTML 和 CSS 程式碼。
Sam Altman 的應用程式:GPT-4o 提高生產力
最後,OpenAI 執行長 Sam Altman 表示:說他使用 GPT-4o 作為個人助理來提高工作效率。
他沒有切換選項卡並擾亂他的工作流程,而是依靠 GPT-4o 進行即時回應,幫助他保持動力和生產力。