11月12日消息,據國外媒體報導,也許你今天還在為應該聽什麼歌而發愁,但是不久的將來互聯網音樂工業將採用更先進的方式來為你解決這個問題。 谷歌、百度和Spotify還沒有完全向外界展示該方法的全貌,但他們都努力在用一種叫做「深度學習(deep learning)」的人工智慧系統為使用者提供更好的音樂播放清單。
「深度學習」是人工智慧的的一個培訓系統分支,稱為「人工神經網路」。 目前,所有這些公司都聘請了「深度學習」專家。 包括谷歌、百度在內的公司把「深度學習」工具用於各種目的-廣告、語音辨識、圖像識別甚至是資料中心優化。 有一家創業公司甚至打算用「深度學習」識別醫學圖像的模式。
現在,這些公司正在轉向音樂工業。 基於音樂流媒體服務的神經網路,無需音樂家的指點,就可以識別音樂的和絃模式。 然後推薦符合使用者喜好的歌曲、專輯或演出者。 把這些複雜的系統投入實際應用不是一朝一夕的事情。 但是,一旦該技術變得成熟,「深度學習」可能讓使用者未來對於音樂流媒體服務無法割捨。
音樂流媒體神經網路起源
人們開始關注音樂流媒體神經網路起源于比利時根特大學去年的學術論文。 該大學的電子和資訊系統部門發表了名為《存續計算》的論文。 該論文說明了使用卷積神經網路(細胞神經網路)選擇歌曲屬性的方法。 而不是像工程師以前那樣利用神經網路來觀察圖像的特徵。
該論文發現,他們的方法可以「產生合理的建議」。 更重要的是,他們的實驗表明,該系統「顯著優於傳統的做法」。 微軟的研究人員最近甚至引用該論文作為「深度學習」領域的概述。 該論文也引起了Spotify的注意。 論文作者Dieleman表示,「他們邀請我們去Spotify的辦公室談了談相關內容,我想我們的論文是非常有説明的。 」
業界廣為接受
「深度學習」首先從Spotify的系統中脫穎而出。 目前,Spotify採用較為傳統的資料分析方法,對特定的音樂在互聯網上的文本內容進行分析,以及對歌曲本身進行聲學分析。 聲學分析基於歌曲的某些特質,比如節奏、音量和按鍵。 該系統需要大量特定領域的資訊輸入。 但比利時人所創造的「深度學習」方法,則完全不同。
「深度學習」分析的是聲音波形,並假定我們不知道歌曲的內容。 然後機器就可以自動分析出一切結果。 它是一個非常通用的模型,有很大的潛力。 該系統沒有採樣Spotify的資料,只是根據歌曲的相似性提供播放清單。 目前該系統並不是Spotify所使用的選歌方法的完美替代。 但該公司認為這是值得進一步研究的東西。
同時,「深度學習」已經在谷歌派上了各種各樣的用場,並且其員工肯定正在調查該理論在音樂流媒體方面的應用可能。 谷歌一名專注于音樂技術的科學家道格·埃克認為,「令人激動的‘深度學習’代表了一個完整的革命,絕對的革命。 」
不過麻煩的是,「深度學習」可能在檢測歌曲相似性方面做的很好,但優化選擇結果可能意味著多種資料的檢測,這並不容易。 所以「深度學習」可能並不是一個音樂分析軟體的簡易替換。 它可能是另一種工具,也許不僅可以用於確定播放清單,它的潛力不止這些。 道格·埃克表示「我所看到的是,‘深度學習’使我們能夠更好地理解音樂,使我們能夠真正更好地瞭解音樂是什麼。 谷歌可以利用它打造更好的產品,一個更好的流媒體服務。 」
未來無限可能
最重要的是,「深度學習」可能説明人們發現新的音樂。 這些音樂可能目前不受歡迎,但使用者聽過之後卻可能會喜歡。 但從根本上說,對於那些介紹給聽眾新音樂的分析系統,未來仍然是一個挑戰。 很多流媒體播放服務雖然已經積累了豐富的音樂資料。 但不幸的是,總是有新的音樂,因此流媒體音樂服務還是要一種通用的分析方法。
另外,「深度學習」不只是為音樂愛好者準備。 對於演出者,「深度學習」也可以説明他們。 不基於銷量名氣,而只關心音樂本身的分析方法,可以更好的説明那些獨立音樂人以及新人歌手及時的被聽眾發現。
(責任編輯:mengyishan)