AI作圖工具Midjourney 5.1版別發(fā)布，可生成更具特性化圖片

發(fā)布時間：2023-05-05 文章來源：本站瀏覽次數(shù)：2408

5 月 4 日音訊，AI 作圖工具 Midjourney 近來發(fā)布了新的 5.1 版別，宣稱能夠為用戶帶來更高質(zhì)量、更有特性的 AI 藝術(shù)作品。

Midjourney 是一家提供生成式 AI 藝術(shù)服務(wù)的公司，用戶只需在 Discord 上輸入一些文字或圖片，就能夠讓 AI 依據(jù)自己的喜好和風(fēng)格創(chuàng)作出絕無僅有的藝術(shù)作品。Midjourney 的引擎經(jīng)過屢次升級，現(xiàn)在現(xiàn)已達到了 5.1 版別，據(jù)官方介紹，這一版別的引擎愈加“有主見”，能夠生成出更接近 4.0 版別的作用，但質(zhì)量更高。此外，還有一個“原始”模式，供那些不想要太強特性化作用的用戶運用。其他方面的改進包含：準(zhǔn)確度提高，圖像中不想要的邊框減少，文字失真狀況減少，銳度增強。

為了驗證 Midjourney 5.1 的表現(xiàn)，外媒 forbes 用同樣的文字提示詞在 5.0 和 5.1 版別平分別生成了四張圖片，并進行了對比。一切其他設(shè)置都保持不變，Midjourney 設(shè)置為基礎(chǔ)質(zhì)量和中等風(fēng)格。IT之家注：在一切下面的圖片中，左邊四張是 Midjourney 5.0 的成果，右邊四張是 5.1 的成果。

第一個提示詞是“女人走在鵝卵石街道上，走向日落”：

能夠看到，在 Midjourney 5.0 中有一個一向存在的問題，就是過度激烈、不天然的鏡頭光暈作用，而在 5.1 版別中這個問題得到了解決。日落在 5.1 版別中看起來更天然，天空也更溫暖、更風(fēng)趣。

第二個提示詞是“油漆廠爆炸，矢量藝術(shù)”：

同樣地，5.1 版別的圖片比 5.0 版別的更出色，顏色運用得更好，構(gòu)圖也更有動感。

人臉是 Midjourney 的一個強項，下一張圖片的提示詞是“戴著泳鏡的孩子的特寫”：

這次能夠體現(xiàn) Midjourney 5.1 版別更有“主見”，5.0 版別中的圖片都很普通，就像是用智能手機拍照的孩子戴著眼鏡的快照。而 5.1 版別中右邊的圖片則有更強的藝術(shù)感，就像是由專業(yè)攝影師拍照的。

后外媒測試了一下 5.1 版別是否真的減少了文字失真的問題，提示詞如下：“街角賣報紙的人，1950 年代風(fēng)格，棕褐色”：

首要，兩個版別都誤解了提示詞，生成了一個拿著報紙的推銷員，而不是一個賣報紙的人，但這能夠通過修正提示詞來改進。兩組圖片中布景都有文字，不過兩者之間沒有太大的差異。從遠處看兩組圖片中的文字都還能夠，但是當(dāng)放大看時，就會發(fā)現(xiàn)它們大部分都是無意義的文字。5.1 版別中的圖片構(gòu)圖更強，主題占據(jù)了更多的畫面空間。

新 Midjourney 5.1 版別現(xiàn)在還在測試中，Midjourney 的用戶能夠通過在 Discord 上輸入 /settings 指令來默許運用 5.1 版別。該公司計劃在本周末之前將 Midjourney 5.1 作為默許模式。

上一條：微軟談天機器人更新：支撐...

下一條：美國《外交政策》：人工智...

AI作圖工具Midjourney 5.1版別發(fā)布，可生成更具特性化圖片

AI作圖工具Midjourney 5.1版別發(fā)布，可生成更具特性化圖片