如果 2023 年有一個明確的流行詞,那一定是「生成式人工智慧」。
人們對 OpenAI 聊天機器人 ChatGPT 的興趣爆發,為這一年數百萬人首次使用生成式 AI 工具奠定了基礎。
雖然可以透過簡單的文字提示產生整篇文章或試卷,但文字提示也可以用於產生圖像。許多平台已經出現,允許用戶只需輸入幾句話即可創建藝術品、海報、徽標、簡報和逼真的圖像。
由於機器學習,他們可以做到這一點。神經網路接受大量資料集的訓練,學習辨識影像中的模式和特徵。然後,該演算法使用學到的知識來預測文字提示正在尋找什麼。
我們正在研究一些當今最受歡迎的圖像生成工具。在深入和使用這些平台之前,值得關注人工智慧生成圖像的版權情況。目前已有多起訴訟正在進行,藝術家們向公司索賠,他們稱這些公司的人工智慧平台接受了受版權保護的材料的培訓。
讓我們來看看當今最好的五種圖像生成器。
中途
迅速的:“施展法術的力量法師”
Midjourney 是最早發展壯大的人工智慧圖像生成器之一,吸引了數百萬用戶使用其平台,用戶對其功能感到震驚,並被其免費試用所吸引。
該免費試用版已不再存在,因此您現在必須付費訂閱才能親自試用,價格為每月 8 美元(9.33 歐元)起。
這個過程可能很繁瑣,因為它是透過 Discord 而不是獨立平台運作的。經過一些嘗試和錯誤,或從網路上提供的眾多提示指南中吸取教訓,您很快就會看到 Midjourney 的強大功能,可以根據您的意願創建逼真的圖像、藝術、卡通或草圖。
難怪它已經擁有超過 1500 萬用戶。
迅速的: ”一架飛機在黃昏起飛的畫作,風格為文森梵谷」。
OpenAI 的 DALL·E 2 來自廣受歡迎的 ChatGPT 背後的公司,是另一種流行的圖像創建工具。
用戶可以在免費方案中產生大量圖像,並且需要註冊付費方案才能大量產生。該平台擁有數百萬用戶,儘管它對於真實感風格圖像的效果似乎不如 Midjourney。它所擅長的是藝術品,具有臨摹名家風格的訣竅。
正如 OpenAI 的 GPT-4 為 Microsoft Bing 搜尋引擎的 AI 聊天機器人提供支援一樣,DALL·E 2 也為 Bing 的圖像生成工具提供支援。
DreamStudio(穩定擴散)
迅速的:「質樸的木桌上放著一杯熱氣騰騰的茶。透過背景的窗戶可以看到樹木」。
另一個早期的大人物,穩定擴散是一種流行的圖像生成模型,在網頁瀏覽器上有一個免費工具。 DreamStudio 使用穩定擴散模型,並具有大量選項和專業的使用者介面。
當您註冊時,您將獲得一定數量的免費積分,然後您需要付費才能充值。結果令人印象深刻,尤其是在生成人臉時 - 儘管像所有這些圖像生成器一樣,它似乎對人手有一個特殊的問題。
WOMBO 的夢想
迅速的:《外星太空站》
與其他平台一樣,面向藝術生成,您只需輸入簡單的文字提示,它就會提供演算法想像的圖像。顧名思義,它產生的圖像有些夢幻,具有抽象且常常令人毛骨悚然的結果。
有數十種藝術風格可供選擇(包括“糟糕的旅行”或“蒸汽朋克”等),這是名副其實的藝術創作遊樂場。它可以作為網路應用程式和行動應用程式使用。
帆布
迅速的:“一名男子駕駛著一輛超級跑車在路上行駛,背景是艾菲爾鐵塔。”
主要用於創建社交媒體貼文和簡報的流行圖形設計平台已全面進軍生成式人工智慧領域。
我們將其作為特別提及,因為它產生上述媒體類型的能力確實令人印象深刻。它還具有免費的圖像創建人工智慧,但目前可能還不夠完善。
它對其創建的圖像類型有相當嚴格的規則。
例如,它拒絕描繪伊曼紐爾·馬克龍駕駛一輛法拉利沿著香榭麗舍大街行駛,所以我們不得不滿足於“一個男人駕駛著一輛超級跑車沿著道路行駛,背景是埃菲爾鐵塔” 。
看起來它仍處於進行中的階段。