ChatGPT 即將與您進行語音聊天,並有五種語音可供選擇

ChatGPT 即將進行重大升級,付費用戶很快就可以使用該工具進行雙向語音對話。

OpenAI 也宣布,去年 11 月推出的人工智慧 (AI) 聊天機器人將能夠查看圖像並了解其中發生的情況。

語音功能將出現在 iOS 和 Android 應用程式上,用戶可以從五種不同的聲音中進行選擇。它建立在該公司開發的新文本到語音模型的基礎上,還將整合其 Whisper AI 工具,這是一種可以將口語單字轉錄為文字的語音識別系統。

這五個聲音分別是帶有美國口音的男性和女性聲音,分別是 Juniper、Sky、Cove、Ember 和 Breeze。 OpenAI 表示,這些聲音可以用於各種用途,從給孩子講睡前故事,到解決餐桌上的辯論。

OpenAI 執行長 Sam Altman 曾表示,由於人工智慧可能對人類構成危險,因此需要對人工智慧進行監管,但儘管有人呼籲暫停,但他的公司似乎仍在繼續推進開發工作。

該公司在部落格文章中宣布的進一步發展是,用戶將能夠顯示 ChatGPT 圖像,人工智慧可以查看和分析這些圖像。該公司聲稱,它在「極端主義和科學能力等領域」測試了該模型,以幫助他們負責任地部署該模型。

Spotify 利用 OpenAI 技術

另一家科技巨頭 Spotify 也在使用 OpenAI 的工具,該公司週一宣布了一項播客翻譯的新功能。

該公司還在一篇部落格文章中表示,Spotify 開發的工具使用“最新創新”,包括 OpenAI 的語音生成技術,可以翻譯說話者的聲音,保持其風格和語氣。

首先試播戴克斯·謝潑德(Dax Shepard)、萊克斯·弗里德曼(Lex Fridman) 和莫妮卡·帕德曼(Monica Padman) 等播客的一些劇集,人工智能將他們的劇集翻譯成西班牙語、法語和德語等語言。