5 月 4 日音訊,AI 作圖工具 Midjourney 近來發(fā)布了新的 5.1 版別,宣稱能夠為用戶帶來更高質(zhì)量、更有特性的 AI 藝術(shù)作品。
Midjourney 是一家提供生成式 AI 藝術(shù)服務(wù)的公司,用戶只需在 Discord 上輸入一些文字或圖片,就能夠讓 AI 依據(jù)自己的喜好和風(fēng)格創(chuàng)作出絕無僅有的藝術(shù)作品。Midjourney 的引擎經(jīng)過屢次升級,現(xiàn)在現(xiàn)已達到了 5.1 版別,據(jù)官方介紹,這一版別的引擎愈加“有主見”,能夠生成出更接近 4.0 版別的作用,但質(zhì)量更高。此外,還有一個“原始”模式,供那些不想要太強特性化作用的用戶運用。其他方面的改進包含:準(zhǔn)確度提高,圖像中不想要的邊框減少,文字失真狀況減少,銳度增強。
為了驗證 Midjourney 5.1 的表現(xiàn),外媒 forbes 用同樣的文字提示詞在 5.0 和 5.1 版別平分別生成了四張圖片,并進行了對比。一切其他設(shè)置都保持不變,Midjourney 設(shè)置為基礎(chǔ)質(zhì)量和中等風(fēng)格。IT之家注:在一切下面的圖片中,左邊四張是 Midjourney 5.0 的成果,右邊四張是 5.1 的成果。
第一個提示詞是“女人走在鵝卵石街道上,走向日落”:
能夠看到,在 Midjourney 5.0 中有一個一向存在的問題,就是過度激烈、不天然的鏡頭光暈作用,而在 5.1 版別中這個問題得到了解決。日落在 5.1 版別中看起來更天然,天空也更溫暖、更風(fēng)趣。
第二個提示詞是“油漆廠爆炸,矢量藝術(shù)”:
同樣地,5.1 版別的圖片比 5.0 版別的更出色,顏色運用得更好,構(gòu)圖也更有動感。
人臉是 Midjourney 的一個強項,下一張圖片的提示詞是“戴著泳鏡的孩子的特寫”:
這次能夠體現(xiàn) Midjourney 5.1 版別更有“主見”,5.0 版別中的圖片都很普通,就像是用智能手機拍照的孩子戴著眼鏡的快照。而 5.1 版別中右邊的圖片則有更強的藝術(shù)感,就像是由專業(yè)攝影師拍照的。
后外媒測試了一下 5.1 版別是否真的減少了文字失真的問題,提示詞如下:“街角賣報紙的人,1950 年代風(fēng)格,棕褐色”:
首要,兩個版別都誤解了提示詞,生成了一個拿著報紙的推銷員,而不是一個賣報紙的人,但這能夠通過修正提示詞來改進。兩組圖片中布景都有文字,不過兩者之間沒有太大的差異。從遠處看兩組圖片中的文字都還能夠,但是當(dāng)放大看時,就會發(fā)現(xiàn)它們大部分都是無意義的文字。5.1 版別中的圖片構(gòu)圖更強,主題占據(jù)了更多的畫面空間。
新 Midjourney 5.1 版別現(xiàn)在還在測試中,Midjourney 的用戶能夠通過在 Discord 上輸入 /settings 指令來默許運用 5.1 版別。該公司計劃在本周末之前將 Midjourney 5.1 作為默許模式。 |