開發了ChatGPT的OpenAI公司,在不久前發表了新的影片生成AI「Sora」,名字源自於日文的「そら」(天空)。Sora就跟各種影片生成AI一樣,只要輸入文字就可以產生出最長60秒的影片。至於Sora產生出來的影片如何?首先請不知道Sora是什麼的各位看看下面的示範影片:
裡面出現的影像,全部都是只要打一段文字就生成出來的結果,真驚人
到目前為止的各種影片生成AI,產生出來的影片看起來都還是相當奇怪,但是Sora產生的影片,竟然可以這麼逼真——不只很逼真,而且動作也非常流暢,還有運鏡與呈現的方式也變得更豐富,沒有會扭來扭去的人或事物。雖然現代的CG技術本來就可以創造出各種栩栩如生動物或場景,但是不要忘記,這些影片都只要使用者輸入一段文字就可以產生出來!
看過Sora的示範影片後,我真的覺得技術的演化速度真的越來越超乎我的想像。
我自己以前也試著玩過好幾種影片生成AI,不過我看過的AI生成的影片都是看起來怪怪的,不然就是影片中的角色動作一眼就看得出很不自然,或是影片裡的物體像黏土一樣黏在一起;但Sora產生出來的影片沒有這些問題,大部分看起來就像錄影下來的畫面自然。
其中的技術原理我也只是略知一二,所以這部分跳過,看到「Sora」出現之後,雖然感覺很好玩,但也覺得有點可怕。
先講自己想像得到的擔心的點吧。
首先如果只要有一段描述影片內容風格或故事的文字,就可以產生出一部逼真的影片,那就意味著任何會打字、有想法但是沒有任何技術知識的人也能夠製作高品質的作品。
就像幾年前像Stable Diffusion那樣的繪圖AI問世後,Pixiv上面出現一堆利用AI創作的作品那樣,我可以想像得到Sora開放一般人使用以後,YouTube上也會看到一堆用AI製作出來衝流量的Shorts(短影音),既然Sora可以生成一部最長60秒的影片,那要量產只有15秒的影片想必超簡單。
再來因為影片的風格只要簡單打幾個字就可以指定,所以絕對會拿來被當成造假的工具。雖然OpenAI還沒開放的原因就是在評估這些可能的風險與問題,不過就算Sora禁止使用產生名人、犯罪內容,最後有心人士還是會找到漏洞然後創作出一部他們可以利用的東西吧。而且除非影片本身有不合常理的地方出現,像是這樣子的:
另外還有這部影片4:05~4:14的段落也是。
不然一般人用肉眼根本分辨不出真假,如果未來還是沒有新的法律規範的話,我也可以想像得到假的影片滲透人類社會的景象,像是製作假的靈異影片或拍到外星人、UFO這類超自然存在影片然後上傳YouTube來騙流量,只能期待OpenAI真的做好萬全的對策之後再釋出了。
這讓我想起以前Midjourney取消免費試用的原因,就是有人生成了川普被警察逮捕的假圖片的事。
再來就是每個人都想得到,每個人都在擔心的工作被取代問題。
我感覺可以想像得到影視相關產業大受衝擊的未來。但真的會變成什麼樣就不確定。像Sora這麼強的影片生成AI在未來會帶來什麼樣的衝擊真的誰也不知道,失業的話感覺會,不過會有多少種職業就此消滅就不清楚。
然後以後的影片創作者說不定也要跟繪師一樣,製作影片之後也要附上製作過程證明自己不是用AI產生出來的,各種影片要判定真偽都還要用判斷AI成分的工具檢測一次才行,接下來感覺會變成一個非常非常累人的時代,然後就回不去了。
再來說說好的方面吧。如果這麼強的技術變成每個人自己打開電腦、手機就可以利用的話,那對創作者來說也是好事。
任何人只要有自己完整的構想與想好想呈現的風格,誰都可以成為一人動畫公司或一人微電影公司,製作簡單的作品。
如果Sora連60秒微電影的劇本的每個分鏡都能仔細製作出來的話,那我也很想試試看,這樣子的話也算是自己的小說動畫化或微電影化的一種吧
就像幾年前最初的繪圖AI問世以後,接下來就有人開發出新的動漫風格繪圖AI一樣,等Sora問世以後幾個月,可能就有人開發出更細緻的日式動畫生成AI,大家都能自己幫自己的作品動畫化與微電影化的未來或許已經不遠。
總之,雖然滿擔心Sora對社會的影響,但還是覺得很想玩玩看。
我的感想就以上這些。希望壞的預測都只是我杞人憂天。