3月31日更新:
AI圖像生成機器人Midjourney暫時停止免費試用版本,其CEO兼創辦人David Holz表示,由於近日大量湧入一次性帳號來生成免費圖像,已影響到付費用戶的使用權益。
Midjourney最近一次更新的v5版本,由於重大更新,使其圖像生成的效果更加逼真,可能遭到濫用。也有人認為,這次暫停服務,也是由於近期針對名人(像是川普和教宗等)的假圖流竄於網上。但目前V5只開放付費用戶使用,因此關閉的原因只是防止大量的「免洗」帳號。
但目前Midjourney防止大量濫用的措施但仍不足,因此只能停止開放免費使用。
AI圖像生成平台Midjourney於3月15日發布新版本V5的測試版,提供更完善的風格與細節演算、解析度也提高一倍,生成圖片時所需要的提示詞(prompt,又被鄉民稱作「詠唱咒」)也更靈活,生成出更加逼真與精確的圖像。
Midjourney創辦人大衛.霍爾茲(David Holz)表示,他們將V5視為「專業模式」,因為與前幾代相比,新的演算法限制更少,提供了更多樣的效果。不過,V5也比V3和V4演算法更「沒有主見」, 若輸入字詞太短,輸出效果可能不會那麼好,會需要用戶提供更精確的要求提示 。
Midjourney V5使用教學
至於Midjourney要怎麼用呢?首先需要註冊Discord社群的帳號,並且加入Midjourney的官方伺服器。加入以後在左側列表中點選「#newbies-」開頭為名的頻道,接著在聊天欄輸入 /imagine
,就可以把想要生成的圖片的提示詞輸入了。
新的V5演算法是Midjourney耗時五個月、在Google Cloud的超級叢集(AI supercluster)上訓練的第二個模型,也使用了不同的神經網路架構和美學技術。
Midjourney V5來了!有哪些特色?
由於現在V4仍然是最主要的公開版本,要使用v5演算法,使用時需在提示句末加入參數--v 5
,或是在設定當中選擇版本。
特色一:畫質提高2倍、prompt也更靈活
新版本生成圖像的畫質也提高了兩倍,達到1024 × 1024(原先V4的畫質是512 × 512),只是生成的時間和耗用的GPU時間也會增加1倍。而且不同於舊版本,V5現在也可以使用「自然語言」當提示了;原先「詠唱咒」的格式通常會需要以逗號分開不同的詞彙,現在已經可以用一句話來當作提示。不過,目前當然還只支援英文。
特色二:加入新參數,就能調整文圖比重
還有一個不同以往的新參數:權衡圖片提示與文字提示的比重;在提示句末加入參數--iw
,就可以讓生成的圖像更偏向圖片提示、或是文字提示。
特色三:新參數可生成花紋,寬高比更靈活
另外還有兩個目前還在公開測試當中的參數:拼磚,以及更自由的寬高比。拼磚需在提示句末加入參數--tile
,就會生成像牆紙或是地磚一樣的無縫重複花紋;寬高比則已經不再限於1:2到2:1的大小,只要--ar
後面加上任何的整數比例,就可以生成想要的寬高比例。
Midjourney V5讓AI畫作終於長出手了!但更真實又更恐怖
根據Twitter上的AI資深用戶Nick St. Pierre的分享,新版本Midjourney生成的人物圖像,風格已經不同以往(如舊版本背景褪色、對比度過於鮮明等),而更像真實世界的照片。
新版本也終於會畫正確數量和形狀的手指,也算是一大突破。雖然有時候還是可能生成解剖學上不合理的四肢構造,但作為AI生成圖像最明顯的線索已經大幅減少,讓越來越多人無法判斷圖片的真假。
不過推特上也有評論者指出,在人體一些令人不安的特徵,讓這些圖片仍「處於恐怖谷」,例如橡膠狀皮膚的外觀、不合理的紋路。但總體而言,這些結果還是看起來比第4版更真實。
目前只有付費用戶可以試用V5演算法,且新版本仍然在不斷更新當中,官方表示希望接下來能陸續提供更「親民」和更真實的視覺風格。