主題

第一次玩 AI 製圖（Midjourney）五張後感想及使用教學

法蘭克 Wei | 2022-08-21 00:09:06 | 巴幣 1014 | 人氣 2186

其實 AI 製圖已經在兩三個月前流行至今了

還是不時都會出現話題、有板面

當時個人就稍微觀察過

Midjourney 是印象以來畫面呈現相對完善、具體的形式

其它款不是沒玩過，有些特徵但就…過於抽象

所以就還是以 Midjourney 為主了

目前還是 beta 版，但就算是測試版
個人覺得已經是有一定的實用價值
現階段國內也沒啥相關法規、版權問題
基本只要付費版都可以自行運用
但公司營業用上則仍需要看細則

自己練習純當作背景、只概念圖啥的已是不錯
甚至光還沒運算完整的情況下其實就滿有料的

這篇將是小教學＋使用心得的部分

————————使用教學部分————————

個人這次使用上只需要兩點：

1.網際網路 & 瀏覽器

2.Discord 帳密

首先要來到 Midjourney 的首頁：https://www.midjourney.com/home/

點進去首頁大概會長這樣（~~很奇異對吧？~~）
~~第一次點開時嚇到我直接 Ctrl+W 關掉~~

接著 Join the beta 點下去

會要求你在瀏覽器登入 Discord

好連結至它的官網作連通

而 AI 製圖時整體都是透過 Discord 內操作的

實際操作方式於 Discord 的 Midjourney 官方群內的 getting-started 資訊區其實已經寫得很清楚：

1.選個 "newbie" 的頻道
（進去後其實就可以觀摩別人大多輸入甚麼關鍵字、有想要的效果就可以自己擬定一些等等要輸入的關鍵字）

2.於聊天室輸入 "/imagine" 再指定頻道的機器人，接著在框框內輸入你想呈現的關鍵字句

3.要等機器人幾秒來算四張圖（通常在 60 秒左右）

4.從第三步驟算出來的四張的圖中，選出一張精算（upscales＝(U)）或再延伸變化（variations＝(V)）
（圖片 1 2 3 4 的順序由上而下，從左到右開始算）

5.概念類似◯◯二選一的遊戲，選到最後挑一張自己感覺最滿意的去精算，如果對精算結果不滿意，可以回到步驟四甚至更之前的預覽圖再次重算，每次算出的結果皆會有些不同
（此項是個人附加的，群組內本身沒有第五項）

※ 個人看過其實有人輸入中文關鍵字也能成圖，但我相信還是英文的效益上最好，且能用的關鍵字上是有限制的字詞，暴力、性方面的字詞有明確禁止，而細算的大小比例是可以直接使用關鍵字去設定的，如16:9、HD畫質…等，都沒有設定的話就會是內建 1024*1024 的大小。

而網頁連通後也並不是毫無功用

每個你算過的過程、收尾圖都可以透過官網瀏覽

會照順序排好、還能像自己電腦資料夾那樣分類、檢閱

對使用者算是滿貼心與便利的

如個人在官網登入後，頁面大概像這樣

因為 Discord 那邊訊息刷很快，回溯找圖是一個滿必要的功能

————————實際製圖成果部分————————

以下個人會從最不滿意→最滿意的順序點評

下方全部圖片除圖片大小外皆未修過圖
當然硬要刷更完美的成果還是可以

但我第一次玩盡量別太刻意刷

藉此統一標準、也比較好評論

會敘述此五張各遇到的問題以及不滿的點

而個人心得結語在最下方

床上手持手機的少女

這張的關鍵字主要是想要呈現女性慵懶的在床上滑手機，都是用英文的關鍵字去繪製的，但不知道是不是語句表達意思不完整或準確（girl in the bed Swipe phone）
跟預想的呈現的有不小差距~~且多半滿像男友視角~~

先講這張也是點出這款最明顯的問題
如手指、眼睛細部也是現階段 AI比較明顯不完善的部分
似乎比較不好分清楚分界處，不是斷的位置錯誤、看起來被截肢
就是有可能跟其他膚色黏在一起，指甲就更不用說了
不是位置突兀、就是根本被省略，完全沒有統一性

選了這張已經是…起碼人為再修一修圖
會是滿合理的，其它張簡直是ET手

當然這是已經自行挑過下相對比較好的再去算的結果圖
重複刷是可以刷到更妥善的，但就比較佔時間跟資源

看起來挺孤單的黃色小熊

其實這張主要是想看看有沒有中資入侵、自High用的
主要詞是說維尼熊被霸凌（Winnie the Pooh is bullied）
然後後面接一些其他列強國的動物，但過程來看頂多只有一排動物
卻完全沒有霸凌的成分

推測是因為能做參照的數量太少了
能呈現霸凌方式不僅多樣，還要用動物當主角更是罕見
原本還想說如果霸凌算禁詞，那我再另外找類似的去算圖

而且有的動物會相互混合、形成有多種外觀特徵的合成獸
過程中不少張看起來都怪怪的，取捨到後來就剩這張比較恰當了
但熊眼睛跟鼻子不忍說，脖子跟腳也都怪怪的
右邊那隻黑色生物如大象的輪廓、卻有著台灣黑熊的毛皮＋白Ｖ領

不過論背景還是挺完善的，其實我只打了個草地（grassland）而已
它就自動補足可能出現的樹林或花園等等的遠景

可以見得場景背景的判別及表現力頗佳

這張我的詞主要是填爬坡道、磚頭路、商店街、樹林、早晨天空
原本預想會呈現出道路→商店→樹林→天空這樣的一層層的堆疊感
結果從它運算過程來看，不是混合就是幾乎以樹林為主
而且從運算過程中也有街道偶而高出消失點的詭異情況
（通往天國的道路？）

最後選了這個森林跟街道分別佔左右邊的這張
因為這是唯一一個總觀上比較合理且要素都有的…
但點下去精算後，天空上的雲朵問題反凸顯出來
雲的角度取材來源太多了，視覺呈現上挺不統一的
雲朵該有的角度和遠近大小沒有弄好

有可能是天空留的空間太多，導致它判斷需要找更多素材來填補？
不過左右兩的斜向雲朵也有弄得像畫在布上的皺褶特殊感
乍一看還算沒有倒很牽強、明顯不自然

~~看起來很快的~~單翼白銀劍士

這張我本來是想呈現出一個持劍、騎著飛馬的女白銀騎士
結果馬的要素被切成只有腿跟姿勢呈現的樣子（腿也因此特別粗…）
甚至有預覽圖主軸僅單單一把有翅膀的劍
可見不是每個關鍵字都必定出現
會隨著常見與否的搭配取捨掉一些字

但結果自己覺得還是弄得滿帥的啦
鎧甲結構組成也滿美
只是那手跟握柄的細部處，還是顯得不太準確跟合理

有點像是手肘／手腕下方直接接成刀刃的雙刀俠
腳掌處基本是太小、甚至看不到的程度

眺望山谷的女孩

結果是實驗性質最高的第一張我最滿意
關鍵詞是女孩、山腰、景色、上午、洋裝（套裝）
呈現的就滿自然整體也不錯
近中遠景皆有明顯分出
光線還很統一、順眼

甚至拿過程中的各個縮圖來精算都沒甚麼大問題
只是當中最是順眼的就這張了
要挑剔的話就是這張看不到女孩的手在哪

但由於遠距的情況下，不算大問題

————————整體使用感想部分————————

整體下來個人感覺是關鍵詞搭配合宜、風景為主、數據量充足
這三者皆恰當的話，那呈現的效果會滿不錯的

但寫實風的話，人一看就很明顯可以感受到奇怪的部分
畢竟我們平常就在看，只要畫面上有些許怪異
那恐怖谷或不合理感一下就出來了

而這款當然也不單單只能呈現這種現實風
只要關鍵詞對，許多超現實、Ｑ版風格的它都可以實踐
如此一來也相對不那麼容易感受到怪異的部分
這部分還是要視自己的風格、想要呈現的感覺
輸入好因應的詞句，才比較能夠獲得想要的圖

自己是感覺這技術應該就是一種…
AI 學習適當的排列組合的統計學
當中多少也能藉此跟其他人交流
可以觀察的到其他人想要呈現的畫面或字詞是甚麼

而且個人是覺得即便自己都不算圖
甚至光看看別人的 AI 製圖

就有不小的收穫感與美感

尤其看下來偶會有種：
「你明明覺得Ａ圖最好看，但結果該位選擇另一張去細算？」
造成兩者的美感衝突感

另外一方面，確實是也有人對 AI 製圖抱持著反對態度
這部分我就覺得屬見仁見智了

就個人而言，背景繪製能力屬弱項，就覺得此工具挺好用的
即便是後續真的收費以後，某層面上就與素材庫更加類似了
且離完全取代人工仍有一定距離，而這部分是可以自己克服的
那如此一來能減少負擔又能增加進度何樂不為？
雖然往後有用到此技術可能要先提出之類的
但確實不失為一種便利的方式／創作過程

假如要舉比較極端的例子來說的話…如漫畫家能善用此工具的話……
例如：富堅的獵人先不說能多進度，起碼單行本能有更多背景

　三浦大神的烙印先不說能完結，就再多個十話也好（QQ）

做為讀者跟粉絲，衡量權重之下
應該還是較樂於假如的情況吧？

但使用 AI 算圖的話會容易造成作品 ≠ 實際畫工實力的問題
尤其對製成作品集跟工作方面應該會是一大隱憂
只是給 AI 算物品物件場景的話，說是自己作品的話那每個都神手
面試官又該如何判斷？萬一覺得很神、開高薪請進來
請該位弄背景結果發現是 AI 算圖仔ㄏㄏ

而且電腦取代人工導致的失業上的可能性，或許是最大的隱憂吧？
這點的話就真的不好說什麼了
以這款已經功能這麼完善的情況下絕對會是趨勢

有多少錢 ≒ 能決定多少事、說話份量有多大，恐怕是舉世通用

最後…當然，開發與管理都是需要持續燒錢的
Midjourney 當然還是歡迎／需要支持與斗內
一當試用期結束後，就需要通過 subscribe 等方式成為付費會員
才能繼續使用的樣子

就現階段而言，尚不用花錢就能使用如此完整功能的情況下
試用者們就且用且珍惜了

（先不論商用）