觸樂夜話:SD發(fā)展小談

技術本身是無罪的。

編輯熊冬東2023年11月16日 20時00分

觸樂夜話,每天胡侃和游戲有關的屁事、鬼事、新鮮事。

圖/小羅

昨天,我的同事祝思齊老師發(fā)布了一篇關于AI工具應用的文章。今天,作為一名使用StableDiffusion(以下簡稱SD)工具的AI繪畫老玩家,我想簡單聊聊SD在過去1年內(nèi),如何被“業(yè)余”地使用。

我想粗略地將這1年的SD大眾向發(fā)展分為3個階段。從去年10月到今年春節(jié)前為“初探期”,這段時間的SD作用有限,對生產(chǎn)毫無幫助,但頗具潛力,許多二次元愛好者把它當作純粹的“玩具”;今年春節(jié)后到5月為“爆發(fā)期”,幾乎是在短短一周內(nèi),SD相關技術席卷互聯(lián)網(wǎng),許多游戲公司開辦“AI興趣小組”,鼓勵大家研究SD;今年6月開始為“徘徊期”,SD技術的發(fā)展似乎停滯不前,業(yè)余大眾對SD興趣驟降,一些從事游戲美術的朋友告訴我,大廠對SD應用的研究日漸專業(yè)化,“技術壁壘”正在產(chǎn)生,但因為保密協(xié)議限制,不便透露太多。

先來聊聊“初探期”。去年10月初,一位策劃朋友告訴我:“我最近發(fā)現(xiàn)了一個叫‘Novel AI’的網(wǎng)址,只需要設置關鍵詞和參數(shù),就可以生成二次元妹子,我可以用它來給Tiera添加參考圖?!盩iera是他正在設計的高難度關卡的最終Boss,形象為白發(fā)藍瞳的魔女。

Tiera角色參考

我點開他發(fā)來的網(wǎng)址,看上去像是一個專為二次元輕小說生成AI創(chuàng)意插圖的工具,界面是全英文,專業(yè)名詞扎堆,我理解起來有些費力。生成圖片需要排隊,還總是卡住。過了幾天,網(wǎng)站開始收費,一些人把網(wǎng)站所使用的SD工具架構到本地。?

我和朋友也架構了SD,但生成的圖片并不理想,線條粗糙、畫質(zhì)模糊且色塊混亂。因為架構到本地后,生成圖片時需要電腦的顯卡進行計算,而我的顯卡功效一般。那時的SD效果極其不穩(wěn)定,我可能需要生成100多張圖片,才能從中選出一張勉強符合要求的。而朋友在嘗試了一段時間用SD添加參考圖后,再也沒打開過它——效率實在是太低了,而且風格受限,完全沒有Pinterest(一個圖片分享網(wǎng)站)好用。

因為SD起源平臺的受眾是宅圈群體,在“一鍵式生成老婆”這個噱頭之下,SD影響力越來越大。雖然生成的圖片質(zhì)量差,但是看教程或者“整活”視頻的人很多。我同朋友打趣說:“搞個賬號開始做自媒體,用AI生產(chǎn)內(nèi)容,保準賺得盆滿缽滿?!?/p>

宅男們在AI圖站樂此不疲地生成“老婆”

玩AI繪畫的人越來越多,一些從事相關領域工作的技術人員也加入進來,SD被不斷迭代,一直有人在開發(fā)相關插件。

由于Lora(小模型)研究的深入,SD所顯現(xiàn)出的潛力越來越大:它不僅可以生成二次元美少女,還可以生成三次元形象;不僅能生成人,還能生成貓、狗甚至“克蘇魯”古神。今年1月,在全球最大的Lora模型站Civitai,已經(jīng)有許多通過真人照片生成的Lora,但以歐美形象為主。到了月底,東亞形象的Lora出現(xiàn)在模型站,有人利用它生成真人Coser照片,并進行詐騙宣傳,此舉引起國內(nèi)警方的注意。在某次警方通告后,SD開始“破圈”。

到了“爆發(fā)期”,SD有一些革命性的新技術涌現(xiàn),其中令我印象最深刻的,是AI動畫領域的多幀渲染法。

在多幀渲染法出現(xiàn)之前,AI動畫的制作方法比較笨重:先把視頻拆成一幀幀的圖片,按序號順序放在同一個文件夾里,再將文件夾地址填到本地的SD中,設置好Checkpoint(大模型)和參數(shù),也可以一同設置角色的Lora,使畫面中的角色形象更穩(wěn)定。同時需要開啟Control net插件來識別角色肢體動作,保持動作的流暢性。這種方法下產(chǎn)出的AI動畫崩壞感嚴重,例如角色跳舞時背過身去,SD會在某幾幀把角色的后腦勺轉(zhuǎn)換成正臉。

而多幀渲染法需要使用一個叫作“Multi-frame Video rendering”的插件。通俗點說,這一插件在耗費舊方法3倍顯卡算力的基礎上,減少了AI動畫中間幀崩壞的現(xiàn)象,大幅提高了AI動畫的穩(wěn)定性。此方法出現(xiàn)后,B站的AI動畫視頻數(shù)量陡增。

多幀渲染法的視頻教程

但我也發(fā)現(xiàn),這一時期的大多數(shù)AI動畫都有著比較明顯的色情意味,并且在多幀渲染法出現(xiàn)后愈發(fā)明顯。換個極端點的說法,許多人接觸SD,目的就是為了生產(chǎn)此類圖片或者動畫——有受眾就有市場,有觀眾就有創(chuàng)作者。在視頻網(wǎng)站,這類AI動畫可以被標注為原創(chuàng),且在創(chuàng)作者激勵的范疇內(nèi),還能參與瓜分現(xiàn)金的創(chuàng)作活動。因為有利可圖,創(chuàng)作者越來越多。

在B站,播放量高的AI動畫中不乏游戲題材

以我了解的一名AI動畫創(chuàng)作者為例,他每天下班后用現(xiàn)成的資源做一個MMD視頻,然后用SD進行風格轉(zhuǎn)化,再投稿到視頻網(wǎng)站。轉(zhuǎn)化過程中,他會玩手游或者看書,并不耽誤自己的時間。半年時間里,他通過AI動畫獲得的“額外收入”約為1萬元。

今年6月之后,AI繪畫逐漸進入“徘徊期”。大眾開始對AI出現(xiàn)審美疲勞,新技術遲遲不出現(xiàn),創(chuàng)作者也感到乏味。歸根結(jié)底,業(yè)余愛好者和觀眾們并不像專業(yè)從業(yè)者,有改善工作流的需求,大多只是想“圖一樂”。因此,對于他們來說,SD更像是一種高門檻的玩具——感興趣時很“上頭”,玩膩了就丟在一邊。我了解的那位AI動畫創(chuàng)作者,在意識到繼續(xù)做AI動畫產(chǎn)生的收益不能覆蓋電費和顯卡壽命損耗的折價后,也暫停了視頻更新。

不過,就像其他AI創(chuàng)作工具一樣,SD在這些發(fā)展階段中也面臨著許多矛盾和爭議。比如傳統(tǒng)創(chuàng)作者與AI使用者之間的矛盾——我們經(jīng)常能看到一些知名插畫師的風格被AI簡單粗暴地“煉成”,并用來創(chuàng)作圖片在約稿網(wǎng)站上售賣,也能看到AI繪畫的反對者網(wǎng)暴AI工具使用者,并采取舉報等方式限制他們的活動。

又如利用AI工具生成真人形象的侵權和欺詐問題,因此訴諸法律的案例也不少。只不過,由于AI尚屬新鮮事物,相關法律顯得較為模糊,與大眾印象里對AI工具的“審判”并不一定完全貼合。從現(xiàn)有情況來看,似乎還沒有出現(xiàn)一個特別有代表性的案例能夠供普通人參考。

一些Up主的教程被人惡意盜用與售賣

在祝老師的文章中,受訪者提到,未來AI創(chuàng)作可能會出現(xiàn)兩極分化的現(xiàn)象,低門檻越來越低,高門檻越來越高。目前,這種情況似乎已經(jīng)有了趨勢:一些AI工具已經(jīng)支持多語言(包括中文)輸入,普通用戶最直接的一道障礙已經(jīng)逐漸被跨過;大型廠商則在嘗試將AI融入工作流,尋找到了一些方向,也取得了一定的進展。

也許,正如這位受訪者所說,“圍繞AI還是有很多爭議,但面對新事物和技術的發(fā)展,一些人心中會有被落下的恐懼,另一些人則把這種變化視為機遇”——技術是技術,會呈現(xiàn)出什么狀態(tài),仍然取決于人們怎樣使用它。

0

編輯 熊冬東

二次元愛好者,也關注中小團隊和制作人故事(V:xdd6480)

查看更多熊冬東的文章
關閉窗口