微軟申請了一件前途看好的專利,能幫電影、遊戲和其他娛樂媒體自動配樂的AI系統。
在世界智財權組織(WIPO)的網站,微軟申請了「編寫配樂的AI模組」專利。微軟正在研發智慧型音效編曲科技,可以為所有種類的媒體(像電影、電視、遊戲、甚至現場錄音)創作音效、音樂或其他在聲音方面的表現。專利提到遊戲中的動態片段,這暗示專利可以創作出配合玩家行動來變化的配樂。專利的摘要中表示能靠著視覺、音效及文字檔案的特徵,或者輸入提示(以上總稱為資料集)來設置參數,以指示多個AI模組編寫配樂。
最近AI的推出一直不斷進化,已經應用到美術及媒體的多項領域。雖然市面上已有不少製作音效的AI工具,但微軟最新的專利似乎暗示,屬於微軟智財的AI模組數位平台,將會是目前最全面、最新進、由機械輔助的音效創作系統。
AI在電玩中扮演不可或缺的角色。從怪物的行動及遭遇的戰鬥,到自動產生場景的程序,還有玩家與NPC及環境的互動,AI在開發遊戲的各層面都必不可少。在音效設計方面,舉例來說,《惡魔獵人5》只有在達成較高的過關評價時,配樂才會開始帶有唱腔激烈的歌聲,其他像是比較新的《毀滅戰士》以及《潛龍諜影崛起 再復仇》,動態配樂是許多電玩遊戲的特點。
但是動態配樂在遊戲中常見的應用,已經被微軟新的音效AI超越。AI即時完成全部程序,能動態地、不斷地用適合的音效及音樂,為玩家的行動即時配樂。所以每個玩家的音效體驗都會不一樣。另外,許多主打音效和音樂的遊戲,也能參考這項科技演算出來的範例,來幫助啟發靈感。
關於創作符合資料集的配樂,接受指令去執行的多個AI引擎,在專利說明的部分有進一步詳述。這些AI能分析人類的表情及情緖、收集場景的資訊、分析情境的氣氛及其他更多的功能。整個AI系統能理解照片、影片、電影、實況,然後產生一組音效檔,這組音效檔可以把適合的音效及音樂,與來源的視覺材料合成在一起。這個AI的尖端技術在媒體的創作上,能開創許多令人興奮的新道路。靠著各種配樂越來越多的龐大資料庫,變得人人都能製作電影、遊戲等等。為主角的出場而設計史詩級的管絃樂、為寵物的去世而編寫憂鬱的曲調、為槍戰及爆炸的場面來製作音效,以上這些都能託付給AI來演算。副作用是作曲家和音效設計師可能要面對新的競爭了。
這項科技將由雲端運算,何時系統可以實際運作還有待觀察。規模這麼大的資料庫前所未有,AI系統勢必需要硬體強健的基礎設施。但是音效設計的前景看俏,微軟在音效業界或許正在主導新的革命。