時隔一年半,OpenAI再次帶來更強大的AI繪圖模型,率先揭露了第三代Dall-E(後稱Dall-E 3)的早期版本,不僅生成內容的準確度比以往模型更高,還能與ChatGPT結合,自動化雕琢出更精細複雜的圖像,預計今年10月登場。
Dall-E 3串連ChatGPT,給「提示詞」更簡單
AI能夠生成的圖像包羅萬象,從動漫風格的角色、寫實的照片到到奇幻似夢的恢宏場景都可以輕易打造,但要求用戶給予AI精確的「提示詞」,以AI有辦法理解的方式描述你所想要的場景與元素。
然而如何給出精準、有效的提示詞可是一門學問,自去年AI浪潮興起後,「提示工程」(prompt engineering )甚至成為了一種專業,根據《彭博社》報導,有公司甚至為提示工程師開出高達37.5萬美元(約新台幣1,200萬元)的高額年薪。
但這次發表的Dall-E 3則結合了ChatGPT,把給予提示詞變得更簡單,用戶在給完所需的提示詞後,ChatGPT便會將其改寫為更富有描述的段落,讓Dall-E 3能夠更好消化用戶的要求,進而生成符合提示詞的圖像。
儘管連結ChatGPT已經足以令人雙眼為之一亮,這並不是Dall-E 3唯一的更新內容,這個版本還能夠生成更為精準、更高品質的圖像。
「不會畫手」長久以來一直是圖像生成AI的罩門,這個弱點也成為人們區分一張圖是人類還是AI所畫的辨別方法,而OpenAI表示,雖然稱不上完美,Dall-E 3在手指及文字等圖像AI常常出問題的地方較舊版本表現更好。
OpenAI計畫今年10月率先為ChatGPT Plus及ChatGPT Enterprise的付費用戶提供Dall-E 3,同時聲稱今年秋季也會提供給研究室和API的客戶使用,至於一般免費用戶何時可以使用Dall-E 3,則還沒有對外公佈。
擔憂訴訟威脅?Dall-E禁止用戶生成當代藝術家風格作品
在推出Dall-E 3的同時,OpenAI還更新了安全措施,防範有心人士利用AI繪圖生成情色或仇恨圖片,也無法生成包含特定公眾人物的內容,並且特意與外部團隊合作,尋找系統是否有漏洞可以繞過他們設置的安全措施 。
同時可能為了避免著作權上的爭議,Dall-E 3不允許用戶要求生成特定當代藝術家風格的作品,並開放藝術家申報自己的作品,要求不被用於未來新版本AI模型的訓練。
自生成式AI爆發熱潮開始,創作者對AI公司擅用作品的抗議從未停歇,先前就有多位藝術家向Stability AI、Midjourney、DeviantArt等AI公司發起集體訴訟,指控這些平台利用受版權保護作品訓練AI模型。儘管並非圖像方面,OpenAI近日也被《冰與火之歌》作者喬治.RR.馬丁為首的17位創作者控告「大規模竊盜」他們的作品。
OpenAI推出Dall-E 3的此刻,AI繪圖服務競爭也逐漸白熱化,Midjourney、Stable Diffusion等對手都喊出超過千萬用戶的成績,Dall-E若想在競爭中脫穎而出,加快完善服務的腳步或許已成OpenAI眼下關鍵任務。
責任編輯:蘇祐萱