未發布的生成成像工具並不回避裸露和血腥,並引起了 MidJourney 的注意。
使用 AI創建的圖像
過去幾個月,OpenAI 一直在私下測試其生成人工智能 (AI) 成像模型的新版本,YouTube 用戶 MattVidPro 泄露的早期樣本顯示,該模型的性能優於之前的圖像生成器。
Matt在 YouTube 上發布的預覽中表示:“非常令人興奮,這讓我們以前見過的任何東西都大喫一驚,太瘋狂了。Midjourney 無法在這個級別上競爭,我什至不認爲 Midjourney 第六版能夠在這個級別上競爭。”
不過,不要指望很快就能嘗試。訪問權限極其有限。
未發布的模型可能是 DALL-E 2 的升級版,並且正在通過 ChatGPT-4 內的邀請預覽進行測試。Matt 表示,全球只有大約 400 人可以使用這個新的 OpenAI 圖像生成器。
雖然圖像樣本有限,但展示了人工智能的高級技能。它通過模仿真實照片的照明和反射生成清晰的圖像,該模型再現了細致到可見筆觸的繪畫細節。它還在生成的產品上完美地重新創建了“士力架”等品牌名稱和賽百味等知名品牌的徽標,並在渲染文本中實現了相當好的拼寫。
OpenAI 的文本到圖像生成的圖像的一個示例。資料來源:MattVidPro
雖然當前的圖像生成器難以實現連貫的雙手,但這些示例顯示了真實且比例適當的雙手,背景也比競爭的人工智能系統更有說服力。
OpenAI 顯然刪除了其安全過濾器以測試該模型的全部潛力。用戶表示,它可以毫不猶豫地生成暴力內容和裸露內容。然而,考慮到 OpenAI 對 NSFW 內容的立場,按照這樣的標准發布官方公开版本的可能性極小。
Matt觀察到,“這是 OpenAI,所以你可以打賭,他們會像在發布之前對所有事情所做的那樣,把它關掉。”
一些專家批評 OpenAI爲了避免潛在的爭議而“簡化”其模型。一些研究甚至表明,OpenAI 訓練的 ChatGPT在其輸出中具有強烈的政治偏見。
盡管如此,樣品中所顯示的一致質量是一個飛躍,它強調了 OpenAI 爲提高生成式人工智能能力所做的持續努力。該公司可能會在今年晚些時候透露更多進展情況,特別是如果圖像識別和生成領域有助於提高其明星產品的穩健性:能夠在一次提示中理解文本、圖像和草稿的多模式 GPT-4 。
目前,該技術仍然僅限於極少數用戶的封閉測試。
隨着模型的不斷改進,人工與真實之間的界限變得更加模糊。雖然這讓很多人興奮,但對濫用的擔憂仍將持續存在,負責任地構建這項技術仍然是一項緊迫的挑战。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。