前言、
個人在這篇之前提到過的:「還有點東西想加、想改,但是不完美才是完美,就這樣吧。個人一個不懂樂理、不會寫歌詞、不會畫圖的人可以做到這樣...10年前想都不敢想。」
現在把一些當時有過的想法加進去,再把音樂做點修改。就成了靠AI製作的MV!如果只是要為了吸引目光,個人就跟其他YT一樣,用AI生成個一堆AI漂亮女性,用AI讓他做點擺首弄姿的動作,再加上AI生成看似好聽的樂曲,隨便剪一剪當成MV就可以拿去騙人了。
這影片不是為了這些,只是為了滿足個人的無法滿足的表達欲罷了。
至於為什麼AI創作不鈎?
幹,最好是AI有辦法把個人腦海裡的文字跟歷程直接Key出來啦!
文字創作不是創作嗎?
正文、
直接上主菜:
信仰的魔法 (信仰の魔法/The magic of faith)
來聊聊這影片怎麼做的吧。不過首先要感謝這些發展AI工具以及模型的人,對您們的努力,個人致上12萬分的謝意。沒有這些,個人根本做不出這首MV。AI發展到現在,終於因為WAN 2.1,讓個人手邊貧困的電腦配備有機會做出這段影片; 之前用過混元,很可惜的是個人電腦配備真的跑不太起來。
一些前期工作都已經在這篇完成,諸如歌詞、音樂的生成等等之類;這邊主要在講述AI影片的部分。其他的部分也有,但是著墨不會太多。
起點
先前做那首《翠色の檻》的時候,AI有生成出一首跟「戈培爾宣傳心得」不太搭軋的歡快樂曲。歌詞有一行讓個人印象深刻:「情感是信仰的魔法直擊心臟」。當時心想,這不就是「相信的心就是你的魔法」嗎?
但是AI怎麼會生出這種歌詞?個人也很好奇,因為給他參考的「戈培爾宣傳心得精選16句」僅有提到情感跟信仰而已,AI會拿去跟魔法還有心臟做連結還真是沒想到,個人讓AI作詞的時候可是沒開Deep Search的。但是仔細一品,那個味兒卻是濃厚異常,讓這句話一直懸在個人心中。
直到WAN2.1出來,讓個人覺得好像可以用這個去做個MV?就把「情感是信仰的魔法直擊心臟」丟給Grok 3讓他以這句為主軸,改造個人原先哪首:《翠色の檻》的歌詞。輸出完後叫他自己再檢查一遍,做好慣老闆的Cosplay。
有歌詞了,接下來要怎麼構思影像內容、架構呢?當然是放棄思考丟給AI啦。小時候的卡拉OK都會放一些跟歌曲內容完全無關的影片虛應故事,當然這個跟版權也有關係,個人也只是拿來說說嘴罷了。一般來說MV會有好幾種不同的做法,有的當微電影拍、有的當宣傳影片拍、有的就乾脆排場演唱會、等等不一而足。
順便一提,這次連曲風都丟給Grok 3決定:
全部丟給SUNO,最後挑一手入個人耳朵的。
個人身邊的設備就官方指南來看,頂多就是5秒的短影片。就只能放棄用故事講述的想法,雖然還是有辦法可以做,但是要花錢,這邊有人做出來了(連結為YT影片)。個人一個免費仔,花不起。
過程
個人Lora練不起(顯卡VRAM不夠),又不想花錢。那就用窮人的作法,讓Grok 3把單句歌詞的意象具體描述出來,個人把這個意象改一改丟給ComfyUI生成圖片,再用這個圖片丟給WAN 2.1去圖片生成影片。聽起來很簡單,過程之麻煩:
●出來的圖片不是每張都能用,要挑;提示詞不要拿AI產出直接用,最後出的圖很難達標。
-這部分要去根據AI給出的意象具體化描述提示詞,畢竟個人用的生圖跟產文之AI不是同一個。
●圖片出來後,也不是單單丟給WAN 2.1生成就好,還要在提示詞裡具體描述出「主體、場景、運動、鏡頭語言、氛圍詞、風格化。」不過這可以寫個系統提示詞讓AI去處理,倒是還好。不過出來的影片,一樣,要挑。
-把圖片轉化成WAN 2.1的提示詞交給AI作後還是要修,可能鏡頭運鏡不對勁、或是明明運鏡描述是對的,但是AI就是不生成你要的影片,AI轉蛋再現...。
●那怕到最後拼裝過程,還是會有這好像不太搭的感覺,然後上面流程再重複一遍 (昏倒。
●最前面那段歌手會有怪怪的地方,很簡單,因為是5秒短影片,5秒5秒接起來的,雖然前5秒的最後一張圖是後5秒的第一張圖去生成,但是AI不知道,所以一定會怪怪的,救不了。就算是這位做的一鏡到底長影片,也能感覺得出來銜接點。
就算現在,個人也還是有想修改的地方;
之後就看看個人的能力在不花錢下能做到甚麼程度吧。
這篇就到這邊了,謝謝各位的觀看。