金磊 魚羊 Pine 發(fā)自 凹非寺量子位 | 公眾號 QbitAI

注意看,這張情侶照在網(wǎng)上轉(zhuǎn)瘋了:

舊廠街風格,帶著濃濃90年代氛圍感,但是,他倆一夜爆火的原因,你可能想象不到——

這二位并不是真人!而是由AI一鍵生成的!


(相關(guān)資料圖)

(不論是乍眼看去或是放大細瞧,都會覺得是拿相機拍的真人吧!)

這就是Midjourney最新V5版本解鎖的逆天神技。

就連AI繪畫最被詬病的,這次也完全能hold住了。

而且很多網(wǎng)友一開始不相信這是AI畫的,于是他們親自下場輸入提示詞來驗證:

A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen —v 5 —s 250 —q 2.一對年輕的中國情侶,穿著夾克和牛仔褲,坐在屋頂上,背景是20世紀90年代的北京,可以看到對面的建筑—v 5 —s 250 —q 2。

在自己體驗了一把之后,不少網(wǎng)友這次真的直呼:

人類畫師別活了。把我嚇壞了。

逼真的不像話

90年代的中國情侶以假亂真,那么現(xiàn)代版的呢?

把提示詞中的年代改成2023年:

無論是時尚的破洞褲、潮流的發(fā)型,還是背景的樓宇環(huán)境,一下子都拉回到了現(xiàn)在。

還有這樣的:

△來自微博@谷大白話

甚至有人覺得人物的眼神,根據(jù)時代不同也在發(fā)生變化。

而且逼真程度也是騙過了不少網(wǎng)友:

當然,“歐美愛情故事”也是不在話下:

當然,大家最關(guān)心的還是“手”畫的怎么樣。

于是,一位網(wǎng)友就專門加大難度來測試Midjourney V5的這項能力。

例如一張印度美人露手的全身像:

妥妥是影樓大片級別了。

再生成豎大拇哥的:

不僅沒有拉胯,甚至Midjourney能把鏡頭的聚焦感體現(xiàn)出來。

那么只生成手呢?

這一次,真的可以說是沒讓大家失望了:

Midjourney這回可以說是驚艷眾人了,不過也有網(wǎng)友好奇,另一位重量級選手Stable Diffusion表現(xiàn)又會如何?

這不,有位網(wǎng)友便用Stable Diffusion搞了個鏡像:

效果似乎也不錯?

效果為何如此炸裂

Midjourney時隔4個月的更新,為何會讓效果一下拉高到如此“嚇人”的程度?具體又更新了哪些東西呢?

整體來說,最明顯的的當屬以下三點更新了:

細節(jié)更加逼真更多可以選擇的風格告別不會畫手

首先是細節(jié)部分,下圖從左到右依次是V3、V4、V5生成的效果,可以說是越來越逼近照片效果了。

△圖源:arstechnica

不僅如此,在有面部特寫時,各種肌膚紋理以及光影效果,比如說反射、眩光和陰影等,V5都能搞定。

在Discord發(fā)布說明中,Midjourney還指出,相較于V4版本,V5版本會有更多的可以選擇的風格,分辨率也提升了2倍。

風格的話,可以從0~1000中選擇,stylize 0=照片,stylize 1000=更藝術(shù)。

并且V5還會對提示詞更加敏感,用更少更精簡的文本生成更好的有效的圖片。

更更更重要的是,這次升級,Midjourney可算是擺脫掉了“不會畫手”標簽,想要靠看手指數(shù)的多少來判別AI作畫已經(jīng)不管用了(Doge)。

值得一提的是,此前,已經(jīng)有人通過Stable Diffusion+ControlNet解決了AI畫手的問題。

不過,也有網(wǎng)友出來開杠,雖然手指數(shù)畫對了,但仔細看細節(jié)還是能區(qū)分出的:

大拇指還是有點過長了。

當然,除了上面這些比較明顯的升級之外,Midjourney V5版本還更新了一些小細節(jié)。

一位機器學習博主特意列了張表格對V4、V5進行了對比。

△來自@Lars Nielsen

比如說,在最新的V5版本中,重復(fù)式、鋪瓷磚式作畫功能又回來了,在V4版本中,這項功能被官方禁止。

還有,Midjourney V5生成的尺寸也更加自由,像下面1:3、5:1這種窄長的圖像就是V5生成的,甚至1:10的圖像它也能生成(如果你想的話)。

反觀V4版本,尺寸被限制在1:2~2:1之間。

嗯,這樣的話,說不定之后的某個電影創(chuàng)作畫面就是Midjourney V5生成的。

此外,V5版本還可以手動調(diào)節(jié)圖像權(quán)重,比如輸入一張圖像,可以手動輸入數(shù)值來決定它影響最終生成圖像的程度。

如何上手試玩

Midjourney目前在公測階段,通過Discord的機器人指令,AI會根據(jù)提示詞幫你生成4張你想要的圖像。

具體來說,加入測試后,在新手頻道中,你可以通過/image指令來輸入提示詞。

不過,現(xiàn)在想要玩上V5版本的Midjourney,得先充值成為付費用戶才行。

(充哪一檔都可以)

在提示詞中加入—v 5或者從/settings 中選擇“V5”,就可以試玩這個最新模型啦~

就像這樣:

啊,對了,如果你不知道怎么寫提示詞,或許可以問問GPT-4。

[1] https://twitter.com/mranti/status/1637326003927396352[2] https://twitter.com/heybarsee/status/1636766986809282561?s=46&t=6eepxw1G6XRQ7VO0ANjJWg[3] https://twitter.com/TheCartelDel/status/1636262759947210753[4] https://arstechnica.com/information-technology/2023/03/ai-imager-midjourney-v5-stuns-with-photorealistic-images-and-5-fingered-hands/[5] https://bootcamp.uxdesign.cc/midjourney-v5-is-here-so-whats-new-df3f3a645295?gi=062e86694934[6] https://weibo.com/5119715209/4881021646409834?wm=3333_2001&from=10D3193010&sourcetype=weixin

關(guān)鍵詞: