ChatGPT 即將與您進行語音聊天，並有五種語音可供選擇

Jarod

ChatGPT 即將進行重大升級，付費用戶很快就可以使用該工具進行雙向語音對話。

OpenAI 也宣布，去年 11 月推出的人工智慧 (AI) 聊天機器人將能夠查看圖像並了解其中發生的情況。

語音功能將出現在 iOS 和 Android 應用程式上，用戶可以從五種不同的聲音中進行選擇。它建立在該公司開發的新文本到語音模型的基礎上，還將整合其 Whisper AI 工具，這是一種可以將口語單字轉錄為文字的語音識別系統。

這五個聲音分別是帶有美國口音的男性和女性聲音，分別是 Juniper、Sky、Cove、Ember 和 Breeze。 OpenAI 表示，這些聲音可以用於各種用途，從給孩子講睡前故事，到解決餐桌上的辯論。

OpenAI 執行長 Sam Altman 曾表示，由於人工智慧可能對人類構成危險，因此需要對人工智慧進行監管，但儘管有人呼籲暫停，但他的公司似乎仍在繼續推進開發工作。

該公司在部落格文章中宣布的進一步發展是，用戶將能夠顯示 ChatGPT 圖像，人工智慧可以查看和分析這些圖像。該公司聲稱，它在「極端主義和科學能力等領域」測試了該模型，以幫助他們負責任地部署該模型。

Spotify 利用 OpenAI 技術

另一家科技巨頭 Spotify 也在使用 OpenAI 的工具，該公司週一宣布了一項播客翻譯的新功能。

該公司還在一篇部落格文章中表示，Spotify 開發的工具使用“最新創新”，包括 OpenAI 的語音生成技術，可以翻譯說話者的聲音，保持其風格和語氣。

首先試播戴克斯·謝潑德(Dax Shepard)、萊克斯·弗里德曼(Lex Fridman) 和莫妮卡·帕德曼(Monica Padman) 等播客的一些劇集，人工智能將他們的劇集翻譯成西班牙語、法語和德語等語言。