大資料不僅僅是關乎資料的大小:發現和利用不同資料的來源也很重要。 資料可以是網頁數據、感應器資料、地點資料等,還加上現在的藝術資料。 不,不是那些世界大師作品的資料,而是我們畫東西時用到的一筆一畫的資料。
在本周洛杉磯的SIGGRAPH會議上,有兩個有關研究的發言。 他們的HTTP://www.aliyun.com/zixun/aggregation/6551.html">研究結果表明,如果能夠搜集到的資料是對的,就可以對一個人如何畫畫做一個全面的瞭解。 其中的一個專案是由卡耐基梅隆大學和微軟研究團隊做的,他們為了獲得資料,讓研究物件在iPhone上玩一個介於Pictionary和Wheel of Fortune中的一個遊戲。 這個研究即使單從用眾包的方法產生資料的角度來看也是特別有意思的,他們利用了iPhone無處不在這個優勢,最後搜集到17,000幅素描畫做了個資料集合。
他們讓研究物件玩一個名為DrawAFriend的遊戲,用手指畫出一些名人或相互認識的朋友頭像。 一個參與者完成後,畫完的畫會一筆接著一筆地呈現給另一個參與者看,另一個參與者根據自己的確定程度猜出畫的是什麼人。 其目的是對各參與者的筆劃做比較,猜的次數越少,畫中的筆劃得分就越高。
如何玩DrawAFriend
研究人員然後用了一些修正方法,對一些不良筆劃以及肥大手指做了使用者都不知道的改正。 這些研究人員下一步要做的是找不同的方法,通過搜集的資料分析使用者的行為(如什麼時候會用「取消」功能,筆劃順序等),他們也在考慮如何可以讓筆劃不但更精確而且可以從美感上來看更漂亮。
另外一項研究來自迪士尼。 他們找了一些美術工作人員,讓他們用觸筆給24個不同的人畫素描,24個人的每一個需要畫4次,每一次的時間都少於上一次(分別是270、90、30和15秒)。 研究人員用這種辦法為每個藝術工作人員搜集了8000個筆劃。
研究人員說,通過資料分析可以確定藝術人員的素描和原畫在幾何特徵方面的區別(如眼睛靠得太近或是下巴輪廓線太粗),還可以説明他們找到需要改正的壞習慣。
迪士尼研究裡一個有關素描和分析的例子
這種研究算是比較新穎的,說明我們有可能搜集和分析幾乎任何類型的數位資料,不過我也能想像會有人問這有什麼用。 也許像迪士尼這樣的公司可以用這種技術做一個程式引擎,從而可以批量生產那些熱門電影的電視片續集,或是可以用來做一個教育軟體説明那些胸懷大志的演出者們克服自己的壞毛病。
不然的話,一個演出者的作品因為有意思似乎正是因為其獨特性所然。 如果存在一個演算法,可以矯正和優化筆劃,那得到的作品還算不算是我完成的呢? 而且,一如迪士尼研究人員指出的,有些變種有時候更多的是每個人的風格造成的,而不是由於複製得不精確造成的。
我們有能力搜集和分析此類資料,而且達到如此(像卡耐基梅隆大學研究專案裡)的規模,這一點是十分重要的。 我肯定,會有人為這些藝術型演算法找到很多的應用,只是我不知道而已。 不過,似乎有時候,我們沒有必要對這個世界上有些東西進行量化,僅僅是因為我們有這種能力——藝術可以說是其中之一。