OpenAI 的Sora：它是什麼，它是如何工作的，以及其用例

人工智慧的興起始於ChatGPT的開發，這是一種基於提示提供文字資訊的生成模型。該模型吸引了所有人對生成式人工智慧的關注。接下來是基於文字提示和影像的影像生成。人工智慧領域的新時代革命是開發了一種基於使用者提供的描述生成影片的模型。

什麼是 OpenAI Sora？

OpenAI Sora 是 OpenAI 開發的一種人工智慧模型，它可以根據使用者提供的文字描述建立逼真且富有創意的影片。其主要目標是生成物理運動，以解決需要即時互動的問題。

這款文字轉影片模型於2024 年 2 月釋出。該工具目前尚未公開發布。OpenAI 正在採取措施防止生成有害和誤導性內容。

OpenAI Sora 是生成式 AI 和多模態 AI 的一次革命。雖然它尚未公開發布，但其網站上提到的模型的一些功能包括：

OpenAI Sora 的能力可以應用於各種創意和實踐領域：

目前，OpenAI Sora 尚未公開發布。只有紅隊成員可以訪問它以評估風險和危害。OpenAI 還向一些平面設計師和視覺藝術家提供了訪問許可權，以評估模型的效率並獲得改進反饋。

OpenAI Sora 的工作原理與大型語言模型 (LLM) 非常相似，其中模型是在網際網路規模的資料上進行訓練的。雖然 LLM 具有文字標記，但 Sora 具有視覺塊。將影片輸入模型，透過將影片壓縮到較低維度的潛在空間，然後將其分解成時空塊來將影片轉換成塊。

團隊正在改進的當前模型仍有改進空間。OpenAI 提到的某些限制包括：

使用 AI 生成影片的這一最新想法展示了 AI 在不同領域的快速應用。最終，該工具的設計是為了應用於醫療保健和其他領域。此外，可能會有公司站出來開發利用 AI 來改善人類生活的工具。

OpenAI Sora 是 AI 領域的最新創新。該工具由 OpenAI 開發，可以根據文字描述生成影片。它很快就會向公眾開放，這將改變各個行業中某些工作的效率。特別是商業營銷和廣告、電影製作和故事講述。當然，它可能與真實的影片不一樣。

Sumana Challa

更新於：2024 年 9 月 12 日

112 次瀏覽

透過完成課程獲得認證

開始