奧地利團隊AI完成貝多芬遺作解構神經網絡、機器學習、AI創作潛能｜STEM教室

2024-08-07 14:00

科技的進步固然有助我們的生活，但其衍生的爭議亦一直是大家的討論話題。其中一個我們經常面對的問題，就是科技會否取代人類所有職業。現今大部分重複性的工序已經能夠由機器自動完成，導致不少工廠員工失去工作；可是，講求創作力的行業是否能夠倖免呢？奧地利一個研究團隊成功利用人工智能寫下音樂傳奇貝多芬尚未完成的第十號交響曲，定必會為這話題激發起更多思考和辯論。

了解大腦如何運作

在了解「電腦」如何「思考」及「創作」前，我們應該先認識一下大腦是怎樣運作的，因為我們是基於人腦的結構和原理來設計電腦以及人工智能。「文藝復興三傑」之一的意大利雕塑家米開朗基羅曾經說過，「其實（雕塑）這形體本來就存在於大理石中，我只是把不需要的部分去掉而已」，當中蘊含人類一直擁有並不自覺地運用了的「感知」、「思考」、「創作」等概念。我們要先有五官上的感知，然後才能去創造，而感知這過程須要我們的想像，因此與創作息息相關。

神經網絡錯綜複雜

過去一百年，科學家們都在研究我們大腦的結構，以及每個區域分別有甚麼功能，而其中一項重要發現就是認識神經網絡。這個龐大的網絡，是由無數神經元伸出如樹枝般的結構連結而成，這些「樹枝」能夠把資訊以電流形式在各個神經元之間傳遞；通過電流大小、頻率等資訊，我們就可以分析所接收到的訊息，以及發放信號作出不同動作。然而，這些枝節錯綜複雜，在一段很長的時間裏我們都不容易建造模型來模擬大腦的運作。直至近年人工神經網絡的發展，我們才能夠開始嘗試利用電腦來模擬人類般學習。

人腦神經元網絡。作為神經系統中最基本的元素，這數以百億計的神經元能夠把資訊在腦部與身體各部位間來回輸送，從而我們能夠做到思考以及一系列複雜的動作。

人腦內的神經元數量極多，專家發現人類高達四分之一的能量都是供給腦細胞使用，可以想像，要在虛擬網絡構造同樣精緻細密的系統難度有多高，而且即使是超級電腦也難以負荷高速及繁複的運算。因此，我們在電腦裏所用到的神經網絡，要在精準度及速度之間取得平衡，才能有助我們處理不同任務。

神經網絡與機器學習

知道人腦的基本構造後，讓我們轉到電腦這範疇。人類嘗試讓電腦學習，或是發展人工智能已有一段時間。以最籠統的定義來說，任何能讓電腦進行運算或決策的編程都算是人工智能的一種，不過，普通指令不足以讓電腦學習和理解，甚至進行創作。

虛擬神經網絡。我們先構建輸入層（input layer）及輸出層（output layer），然後讓電腦建立中間的分層（hidden layer）。當演算完成後，我們就可以只輸入，讓電腦的算式推算出一個答案。

輸入與輸出建構點和綫

模仿人腦的分支結構，電腦的神經網絡亦是充滿一系列的點，以及點與點之間的連結。我們學習辨認東西，會先看物件圖片（輸入），再給予答案（輸出），然後我們就要找到物件當中的特徵以作配對；同樣地，我們把樣本的輸入（input layer，如照片）及輸出（output layer，如物件名稱）資訊交給電腦，它就會嘗試在當中建構不同的點（用以辨識物件的數值或參數）與綫（算式），形成中間的分層（hidden layer），亦即物件的「特徵」。在有足夠的樣本情況下，算式和參數就會計算得較準確，這就如我們學習時熟能生巧一樣。

電腦學習創作音樂

上文提及電腦能夠學習辨認物件，其實同樣原理亦能放在聲音上。我們只要把某一種曲風的大批樂曲放進電腦系統，它就可以分析該類型的基本架構，如拍子、節奏、音域等等。當「看」得足夠多的樂譜，電腦就能找到當中的模式（hidden layer）來把曲風（輸出層）與樂譜（輸入層）相配對，並建立相應演算法。

「反過來」的演算過程

有了這個演算法，我們可以輸入新樂譜，讓電腦推斷是甚麼類型的音樂。那整個過程可以反過來嗎？亦即是，我們先在輸出層放入想要的曲種，利用相同演算法，電腦能否嘗試自行創作一份新樂譜呢？原來這是可行的。電腦科學家與作曲家Pierre Barreau於2016年創辦AIVA（全名是Artificial Intelligence Virtual Artist，即人工智能虛擬藝術家），通過閱讀多首如貝多芬、莫札特、巴哈等音樂，利用深度學習與強化學習（一種機器學習的方法），摸索出古典音樂的規律，從而創作出相同風格的樂曲。現時，不但是古典音樂，電子、搖滾、爵士樂等，AIVA也能製作到。

AIVA分析一首樂曲時，呈現方式如矩陣般。利用深度神經網絡， AIVA能夠在樂譜中尋找規律（藍色與橙色標記），並在一句或一章節後推算下一個音符應是甚麼；經過多首歌的「訓練」，AIVA的推算會愈來愈接近其曲風的需求，這樣就能創作一整首歌曲。

完成貝多芬第十號交響曲——向高難度挑戰

回到最初提及的貝多芬第十號交響曲，這比AIVA創作音樂又難上一層。十九世紀時，貝多芬曾受英國皇家愛樂協會之委託寫兩首交響曲，當時他寫了一首第九號交響曲，當中的《歡樂頌》可謂膾炙人口；而另一首第十號交響曲，他卻只寫了一小部分就因病離世。雖曾有人嘗試填補未完成的部分，但因為本來就只有很少的原稿及相關筆記，因此都不太成功。

符合風格與年代的樂曲

直至2019年，奧地利薩爾斯堡卡拉揚研究所（Karajan Institute）的羅德（Matthias Röder）團隊接受了這個挑戰，嘗試運用人工智能完成這部遺作。與 AIVA不同的是，這次不但要寫某一種曲風的一首樂曲，而且要特定符合貝多芬的風格，再加上須配合原先僅有的一小部分樂章以及筆記，寫出符合年代的交響曲。團隊包括作曲家、電腦科學教授、人工智能專家、音樂學家等，他們的做法與上文提及創作音樂的方法類近，先嘗試找來貝多芬的其他作品，把那些樂曲的初稿放進輸入層（input layer），最終版本放進輸出層（output layer），讓電腦發展演算模型配對兩者。但困難的是，即使有這演算法，團隊還要把貝多芬的獨有風格量化，以及將影響貝多芬的人物及環境等因素考慮在內。在接近兩年的努力，研究團隊終於成功以人工智能完成創作，並在2021年10月9日舉行公演。

貝多芬寫第十號交響曲時的一頁手稿。

補充資料

人工智能的其他創作應用

除了音樂，人工智能還有其他創作潛能。

自動化新聞（或機械人新聞寫作）已不是最近才有的事，只要輸入新聞的基本資料和數據，電腦就能夠拼砌前後對應的字句，寫成一篇新聞稿。人工智能亦有助檢查文章中有沒有錯誤，從而令新聞更準確。此外，通過電腦學習，還可成為畫家繪畫並參展。基本原理如上文提及的圖像辨識功能，在發展推算算式後，只要輸入新相片，就能認出當中物件是甚麼。倒轉過來，在「輸出層」先寫上物件名稱，通過演算法，理論上就可以畫出相應物件。

利用已知的演算法（w）以及想要畫的物件（y），人工智能有能力畫出未知的畫作（x），又或是在已有的一幅畫中（如圖六的雲）找到當中的規律，從而「利用想像力」畫出電腦「聯想到」的物件。

電腦從雲中「看出來」的物件。

奧地利團隊AI完成貝多芬遺作解構神經網絡、機器學習、AI創作潛能｜STEM教室

了解大腦如何運作

神經網絡錯綜複雜

神經網絡與機器學習

輸入與輸出建構點和綫

電腦學習創作音樂

「反過來」的演算過程

完成貝多芬第十號交響曲——向高難度挑戰

符合風格與年代的樂曲

補充資料

人工智能的其他創作應用

延伸閱讀：AI教父離開Google 警告人工智慧將比人類更聰明

最新回應

相關新聞

「自動化」科技未來大趨勢物流業、物聯網IoT、自動車、圖像識別｜STEM教室

小學數學科引入「AI助教」數秒生成練習題能批改學生手寫答案

訂閱星島日報

聯絡我們

廣告表格及價目表

了解大腦如何運作

神經網絡 錯綜複雜

神經網絡與機器學習

輸入與輸出 建構點和綫

電腦學習創作音樂

「反過來」的演算過程

完成貝多芬第十號交響曲——向高難度挑戰

符合風格與年代的樂曲

補充資料

人工智能的其他創作應用

延伸閱讀：AI教父離開Google 警告人工智慧將比人類更聰明

最新回應

相關新聞

「自動化」科技 未來大趨勢 物流業、物聯網IoT、自動車、圖像識別｜STEM教室

小學數學科引入「AI助教」 數秒生成練習題 能批改學生手寫答案

訂閱星島日報

聯絡我們

廣告表格及價目表

神經網絡錯綜複雜

輸入與輸出建構點和綫

「自動化」科技未來大趨勢物流業、物聯網IoT、自動車、圖像識別｜STEM教室

小學數學科引入「AI助教」數秒生成練習題能批改學生手寫答案