OpenAI 的新文字轉影片工具 Sora 引起了人們的興奮和恐懼。這是我們所知道的

Jarod

ChatGPT 的製造商現在正在深入人工智慧 (AI) 創建的視訊世界。

來認識 Sora - OpenAI 的新文字到影片產生器。這家總部位於舊金山的公司於週四推出了該工具，它使用生成式人工智慧根據書面命令立即創建短視頻。

Sora 並不是第一個展示這種技術的人。但產業分析師指出，該工具迄今為止展示的影片品質很高，並指出它的推出標誌著 OpenAI 和文字到影片生成的未來的整體重大飛躍。

儘管如此，與當今快速發展的人工智慧領域的所有事物一樣，此類技術也引發了人們對潛在道德和社會影響的擔憂。這是您需要了解的內容。

Sora 可以做什麼以及我可以使用它嗎？

Sora 是一款文字轉影片產生器 - 使用生成式 AI 根據書面提示創建長達 60 秒的影片。該模型還可以從現有的靜態圖像生成影片。

生成式人工智慧是人工智慧的一個分支，可以創造新的東西。例如聊天機器人（如 OpenAI 的 ChatGPT）以及影像產生器（如 DALL-E 和 Midjourney）。

讓人工智慧系統產生影片是更新的、更具挑戰性的，但依賴一些相同的技術。

Sora 尚未可供公眾使用（OpenAI 表示，在正式發布該工具之前，它正在與政策制定者和藝術家接觸），而且還有很多我們不知道的事情。但自周四宣布以來，該公司已經分享了一些 Sora 生成的影片範例，以展示其功能。

OpenAI 執行長山姆·奧爾特曼也利用 X（該平台以前稱為 Twitter）要求社交媒體用戶及時發送想法。

後來，他分享了逼真詳細的視頻，這些視頻響應了“兩隻金毛獵犬在山頂上播客”和“在海洋上與不同動物進行自行車比賽，運動員在無人機攝像機視圖下騎自行車”等提示。

雖然 Sora 生成的影片可以描繪複雜、極其詳細的場景，但 OpenAI 指出仍然存在一些弱點 - 包括一些空間和因果元素。

例如，OpenAI 在其網站上補充道，「一個人可能會咬一口 cookie，但之後，cookie 可能不會有咬痕」。

還有哪些人工智慧生成影片工具？

OpenAI 的 Sora 並不是同類產品中的第一個。 Google、Meta 和新創公司 Runway ML 等公司都展示了類似的技術。

儘管如此，行業分析師還是強調了迄今為止分享的 Sora 影片的明顯品質和令人印象深刻的長度。

麥格理美國人工智慧和軟體研究主管 Fred Havemeyer 表示，Sora 的推出標誌著該行業向前邁出了一大步。

「你不僅可以製作更長的視頻，據我所知最長可達 60 秒，而且製作的視頻看起來更正常，而且似乎實際上更尊重物理和現實世界，」哈夫梅爾說。

「你不會在影片動態上看到那麼多看起來…不自然的『恐怖谷』影片或片段」。

儘管去年人工智慧生成的影片取得了“巨大進步”，包括去年11 月推出的穩定視訊擴散技術，但Forrester 高級分析師Rowan Curran 表示，此類影片需要更多的“拼接”以實現角色和場景的一致性。

然而，Sora 視頻的一致性和長度代表著“創意人員有新的機會將人工智能生成的視頻元素融入到更傳統的內容中，現在甚至可以根據一個或幾個提示生成完整的敘事視頻，”Curran告訴《The》雜誌。

潛在的風險有哪些？

儘管自周四發布以來，Sora 的能力令觀察家感到震驚，但對人工智慧生成影片使用的道德和社會影響的擔憂仍然存在。

例如，哈夫梅爾指出了 2024 年可能充滿挑戰的選舉週期中存在的巨大風險。

他補充說，透過一種「潛在神奇」的方式來產生看起來和聽起來都逼真的影片會帶來政治內外的許多問題，並指出欺詐、宣傳和錯誤訊息等問題。

Havemeyer 表示：“生成式人工智慧的負面外部性將成為 2024 年爭論的關鍵話題。” 「這是今年每個企業和每個人都需要面對的重大問題」。

隨著世界各國政府努力迎頭趕上，科技公司仍在管理人工智慧及其風險方面發號施令。

去年12月，歐盟就世界上第一個全面的人工智慧規則達成協議，但該法案要在最終批准兩年後才會生效。

週四，OpenAI 表示，在廣泛使用 Sora 之前，它正在採取重要的安全措施。

該公司寫道：“我們正在與紅隊成員合作，他們是錯誤訊息、仇恨內容和偏見等領域的領域專家，他們將以對抗性方式測試該模型。”

「我們也正在建立工具來幫助偵測誤導性內容，例如可以判斷 Sora 何時產生影片的偵測分類器」。

OpenAI 全球事務副總裁 Anna Makanju 週五在慕尼黑安全會議上發言時重申了這一點，OpenAI 和其他 19 家科技公司承諾自願合作，以確保安全。打擊人工智慧生成的選舉深度造假。

她指出公司「以相當謹慎的方式」發布 Sora。

與此同時，OpenAI 透露了有關 Sora 如何構建的有限資訊。

OpenAI 的技術報告並未透露使用哪些影像和視訊來源來訓練 Sora，該公司週五也沒有立即回應進一步置評的請求。

Sora 的發布也是在一些作者和《紐約時報》對 OpenAI 及其商業合作夥伴微軟提起訴訟的背景下發布的，原因是 OpenAI 使用受版權保護的寫作作品來訓練 ChatGPT。