Technology of Music ── Vocaloid
音樂科技主題──Vocaloid軟體概述與影響
Chapter 0 前言:動機與目的。
至2010年下半年起,媒體報導Vocaloid相關新聞漸多,但大多是以「虛擬偶像」,「角色扮演」的方式去報導,會有人誤以為是某個卡通的角色。但其本質為一種可編輯具人聲之音樂的樂曲創作軟體,「虛擬角色」只是一種宣傳手法而已。故本人想以軟體本質、原理基礎、操作,以及音樂市場、音樂創作與再創作等方面,使大家知道現在正在發展的新音樂型態、新音樂科技、新音樂市場的樣貌,並正視其影響。
本人希望這場報告能表達給聽眾的有:
(1)認清Vocaloid的本質,與其代表虛擬角色的背後意涵。
(2)Vocaloid只是數種科技的結合產物。
(3)認知其出名的原因。
(4)認知Vocaloid的音樂市場本質,對其他類型音樂市場的影響。
(5)Vocaloid在日本的問題與挑戰。
Chapter 1 什麼是Vocaloid?
Vocaloid,中文翻作「人聲電子音樂合成製作軟體」,是一種可以將以各種樂器所譜出的背景音,和已音階旋律化的歌詞,在一套系統內編輯,合成為同時具人聲歌詞與音樂的歌曲,就如同我們平常聽到的流行樂曲。基本上,只要使用者輸入某些歌詞,再針對歌詞及背景音作譜旋律化,一首歌便可製作完成。
Chapter 2 Vocaloid建構基礎
Section 1 語音合成軟體(Speech Synthesizer)
學英文的大概都知道,有所謂的KK音標,內有母音和子音;在臺灣學中文,大概都一定學注音符號,來了解每個字的發音與語調;學日文都一定要先學五十音……。世界各國的語言,都是由母音、子音、子音+母音、或是子音+母音+子音,搭配成一個音節。一個單字是由一個至數個音節所組成,而音節的聲音元素,無論是子音還是母音,都是有限的且不會很多,故音節的發音法總數不會太多。換句話說我們可以在有限的音節發音類型中,組合成一個單字,甚至是一個句子。上述的說明,早在十八世紀至十九世紀的語言學家就己完備地研究。
在一九三零年代,美國貝爾實驗室成功製作了電子化語音合成軟體,並於一九三九年在紐約世界博覽會發表,但那時仍是以類似打字機的鍵盤輸入文字與指令,在大型電子計算機中處理並發音。在電腦問世後,以電腦介面處理的「文字轉換至聲音之語音合成系統(Text-to-speech Synthesizer)」才完備於一九六八年。並於一九七零年代起進入商業與教育應用領域。
現在的語音合成軟體的開發者與使用者無非想要使合成出的聲音能明顯辨別,且要聽得自然。以上的原因使目前的合成軟體有兩種主要類型:
(1)連鎖合成法(Concatenative Synthesis):
這一類的語音合成是以大量的詞語、單字、或是音節所構成的語音資料庫為基礎,經使用者的重新編輯而得以組合出一個完整句子。使用詞語、單字為資料庫基礎的語音合成軟體在我們的日常生活中最常見,但能使用的範圍有特別領域上的限制。舉凡火車站的自動廣播:「『十七點』『二十八分』,『經由』『山線』,『開往』『七堵』『自強號』,『請在』『第一月臺』『上車』。」或是醫院叫號「『來賓』『二零五九號』,『請至』『九號』『櫃臺繳費』。」這些都是此種類型。
而Vocaloid軟體人聲部分,則是使用音節所構成的語音資料庫,但每一個音節有數種可供調整頻率、長短、音色、強弱等不同調控參數。也因為它能做到「音音斟酌、字字計較」,而能夠發出較自然而易分辨的語句,但是軟體的大小及所使用的硬體設施卻是近幾年的電腦才能負擔。
(2)共振合成法(Formant Synthesis):
這一類的聲音合成是事前針對每一個音節發音作大量的統計與分析,作出每一種音節發音的波波函數模型,再以此波函數模型作基準頻率、長短、強弱等不同調控參數的調整,也能做到每字每音的精準調控,但它僅能合成出明顯識別出的語句,但會顯得不太自然。雖是如此,仍有少部分的Vocaloid軟體是使用這種技術。
我們知道所有聲音是由一個基準頻率波,外加數個基準頻率波數倍,但振幅與起始角皆不同的弦波所組合成的,故此類軟體不會有語音資料庫,只有表示該音色所具備的波數、每波頻率、振幅與起始角。如下的公式表示:
Section 2 電子音樂發展導論
電子音樂的開端,主要有兩項物品,第一個是於1857年發明的錄音機(留聲機),第二個是於1906年由李.佛瑞斯發明的真空管,才使二十世紀的音樂充了電子樂。
在1919年,李昂.戴維尼發明了較近現代所使用的電子樂器,正式開啟電子樂器的時代。而在第二次世界大戰為美國為首的同盟軍立下汗馬功勞的電子計算機也於1951年發展出能播放音樂的系統CSIRAC,同一年,也推出了能錄音的電子音樂播放系統。在1956年,以電子計算機(電腦)為介面的譜曲與播放系統也被發表,並於1960年代進入商業和藝術應用領域。因此可想見一些表演難度高的樂曲,如「大黃蜂的飛行」就可以不急不徐地編輯並應用。而商業化的電子音樂與相關歌曲也於1970年代造成風潮。
同時在1970年代,隨著桌上型電腦崛起,電子音樂播放、錄音、編輯系統也從專門處理的硬體改變成配合電腦處理的軟體。1970年代晚期,數位化訊息傳遞興起並大量應用,也促成了1980年的MIDI(電子音樂數位介面系統)與相關軟體的發表。
而這些音樂,從最早以事先錄音再作編輯的形式,再到以大量弦波,但互為共振所組合成的共振弦波,在傳輸上稱為類比(Modularity),再到以極小時間間隔及規則化的振幅,所組合成的階梯波,在傳輸上稱為數位(Digital)。這些改進,使傳輸後的音樂能以較高的品質重現,在合成音樂上也能做到更高的擬真度。
Section 3 在日本之非實際存在之歌手歷史概論
之為何說明這種歌手的歴史?原因是在日本銷售此類軟體,大多有配合一位虛擬人物作為各種產品的代表,就類似一位現實中不存在的歌手為作詞作曲家唱出歌曲一樣。雖然在日本,這是一種常見的銷售手法,但不管在軟體的銷售、還是對日本流行音樂的影響,都十足巨大,故特別說明此相關歷史。
在日本,非實際存在之人物與動畫脫不了關連,歌手也不例外,最早可以追溯至1982年的著名科幻動畫「超時空要塞」,當時推出的動畫原聲帶中,就有不少是以劇中歌姬「林明美」的名義及插圖來發行,雖然它還註明是由其演出配音員「飯島真理」所唱,但此種銷售宣傳模式,已經可視為非實際歌手推行作品。
再來是1989~1990年的「偶像」系列,當初是為了推銷新歌手「田中陽子」和「田村英理子」,因而創造動畫,女主角就和要推銷的歌手同名同姓。這種動畫與歌唱作結合的推銷法,也可視為動畫角色推行歌曲作品。
隨著具歌唱能力的日本配音員在比例上逐漸增加,以及部分歌手跨足配音界,這種以「不存在的角色」推行音樂作品的情形便屢見不鮮了,不論是2007年的「瀨戶之花嫁」、「守護甜心」,還是在2010年席捲日本動畫電玩界之音樂年度排行榜的「K-ON輕音部」,都是以非實際歌手發行音樂作品的例子,只是大多有再加註演唱真正歌手。
Chapter 3 Vocaloid發展史
Section 1 前言
雖然1961年美國就有人嘗試把電子合成音樂和語音合成軟體作一個歌唱的搭配,但一直要到上述兩類軟體的達成熟的二十世紀末期,才有較佳的突破。2000年3月,西班牙Pompeu Fabra 大學和日本知名樂器公司YAMAHA聯手開發,在2003年3月在德國展覽會公開發表。由於上述單位皆沒有一個專門的語音資料庫,故授權其他公司利用該技術,開發語音資料庫並製錢軟體,目前包含YAMAHA在內,共有七家公司擁有該產品關鍵技術。
Section 2 Vocaloid 1st
在技術公開後,在2004年1月,ZERO-G公開了最早兩個人聲音樂合成軟體,第一個稱作Leon,為男性聲音,第二個稱作Lola,為女性聲音,語言皆為英文。而日文的Vocaloid也在2004年11月推出,名稱為MEIKO,為女性聲音,由Crypton Future Media研發。值得注意的是產品包裝上已出現代表產品的虛擬代表人物,它是第一個以虛擬人物形象販售的人聲音樂軟體。
第一代Vocaloid共有5個產品,分別為兩家公司出版。
產品 |
發行公司 |
語言 |
性別 |
聲源提供者 |
發行日期 |
Leon |
ZERO-G |
英語 |
男 |
(Unknown) |
March 3, 2004 |
Lola |
女 |
(Unknown) |
Miriam |
女 |
(Unknown) |
July 26, 2004 |
MEIKO |
Crypton Future Media |
日文 |
女 |
拜鄉芽衣子 (拝郷メイコ) |
November 5, 2004 |
KAITO |
男 |
風雅なおと |
February 17, 2006 |
Section 3 Vocaloid 2nd
第一個使用第二代Vocaloid相關技術所推出的產品是由Pover FX推出的Sweet Ann,在2007年6月發行,語言為英文。但對日本人來說,第一個在日本出現的Vocaloid 2nd則是由Crypton Future Media推出的初音未來(初音ミク,Hatsune Miku),在2007年8月發行,比Sweet Ann在日本出現早了三週。提供聲音作為語音資料庫的配音員為藤田咲(音同笑)(Saki Fujita),是因為她具有純淨而透明感的聲音,而從一百多位配音員中被選出,現在先讓大家聽聽她在2008年9月推行的唯一單曲,其中一首「Crystal Quartz」。
雖然為第二代Vocaloid先驅軟體,但它有在高音上會有輸出變小的缺陷;儘管如此,此軟體還是可以做許多不同類型的流行音樂。而在2010年4月,Crypton Future Media追加了初音未來的人聲資料庫,共6種,統稱「初音未來 Append」也由藤田咲提供原聲。
而在2007年12月,Crypton Future Media推出了鏡音玲.連(鏡音リン.レン,Kagamine Rin/Len)皆是由配音員下田麻美(Asami Shimoda)提供聲音作為語音資料庫。本軟體最大特色是它的人聲輸出可以在少女聲及少年聲作連續轉換。而配音員下田麻美因很長一段時間是為偶像歌手養成遊戲「偶像大師」提供演唱曲,故有較佳歌唱能力,也使軟體「鏡音玲、連」有較好的人聲輸出品質。Crypton Future Media也於2010年12月追加人聲資庫,統稱「鏡音玲、連Append」,也由下田麻美提供原聲。
以下是目前Vocaloid 2nd 出版產品一覽表:
產品 |
發行公司 |
語言 |
性別 |
聲源提供者 |
發行日期 |
Sweet Ann |
Power FX |
英文 |
女 |
Judy(?) |
June 29 ,2007 |
初音未來 |
Crypton Future Media |
日文 |
女 |
藤田咲 |
August 31, 2007 |
鏡音玲.連 |
Crypton Future Media |
日文 |
女(玲) 男(連) |
下田麻美 |
December 27, 2007 |
Prima |
ZERO-G |
英文、 西班牙文 |
女 |
(Unknown) |
January 14, 2008 |
鏡音玲.連 Act 2 |
Crypton Future Media |
日文 |
女(玲) 男(連) |
下田麻美 |
July 18, 2008 |
Gackpoid(がくっぽいど) |
Internet Co., Ltd. |
日文 |
男 |
Gacky (神威 楽斗) |
July 31, 2008 |
巡音流歌 |
Crypton Future Media |
日文、英文 |
女 |
淺川悠 |
January 30, 2009 |
Magpoid (メグッポイド) |
Internet Co., Ltd. |
日文 |
女 |
中島愛 |
June 25,2009 |
Sonika |
ZERO-G |
英文(可作多國語言) |
女 |
(Unknown) |
July 14, 2009 |
氷山キヨテル |
AH Software |
日文 |
男 |
比山貴咏史 |
December 4,2009 |
歌愛ユキ |
AH Software |
日文 |
女(童音) |
(Unknown) |
December 4,2009 |
SF-A2 Miki |
AH Software |
日文 |
女 |
フルカワミキ |
December 4,2009 |
Big Al |
Power FX |
英文 |
男 |
Michael King , Frank Sanderson |
December 22, 2009 |
初音未來 Append |
Crypton Future Media |
日文 |
女 |
藤田咲 |
April 30, 2010 |
Tonio |
ZERO-G |
英文 |
男 |
(Unknown) |
July 14, 2010 |
Lily |
Internet Co., Ltd. |
日文 |
女 |
Yuri(屬團體m.o.v.e.) |
August 25, 2010 |
VY1 |
Yamaha + Bplats |
日文 |
女(無關) |
(Unknown) |
September 1, 2010 |
Gachapoid |
Internet Co., Ltd. |
日文 |
男 |
(Unknown) |
October 8, 2010 |
貓村IROHA |
AH Software |
日文 |
女(?) |
(Unknown) |
October 22, 2010 |
歌手音piko |
Sony Music + Ki/oon Records Inc. |
日文 |
男(可女聲) |
PIKO |
December 8, 2010 |
鏡音玲.連Append |
Crypton Future Media |
日文 |
女(玲) 男(連) |
下田麻美 |
December 27, 2010 |
值得注意的是,同樣由Crypton Future Media研發的巡音流歌(巡音ルカ,Megurine Luka),是第一個擁有兩國語音資料(英語、日語)的軟體;而由Internet株式會社(Internet Co., Ltd.)發行的Megpoid:GUMI,因為它是由日本具有人氣的配音員兼歌手中島愛(Megumi Nakajima)提供原聲,故現在以它來編出的曲子也不少,比例上僅次於初音未來;再來是由ZERO-G開發的Sonika,是以英語為主體,嘗試能表現多數國家語言的人聲音樂軟體,臺灣於2010年8月引進,並加上了中文語音建議輸入法,希望能較正確地表示目前中文普通話。但到目前為止,包含或主體為中文北京普通話的語音資料庫所構成的Vocaloid軟體仍未建立。