這項研究是基於這樣的思考:人類往往會傾向于根據自己的經驗和看到的例子去思考並做出決定。 例如,兒童也許能從他父母談話的幾個單詞就知道他們正在談論夏令營,因為他們去年去過,並且他們知道「month,」 「lake」 和「counselors」這樣的單詞只會在這種情況下一起使用。
然而,如果我們在某一個特定的領域經驗有限或者也許沒有經驗,一點點的説明可能都是必要的——這正是Bayesian Case Model發揮作用的地方。 給定一組資料,如食譜,模型會基於他們最突出的成分和給定食譜集中的代表實例或原型比較分類,這個給定的食譜也是電腦選的。
例如,儘管我不知道啤酒、辣椒粉和番茄醬中有相同的成分辣椒,但當我發現該模型被視為典型的辣椒食譜,我就可以斷定該食譜中包含辣椒。 事實上,麻省理工學院的研究人員Been Kim 、Cynthia Rudin 和Julie Shah發現,不僅他們的模型執行比以前的技術更準確,而且人類測試人員使用Bayesian Case Model技術的輸出比以前技術能顯著提高分類食譜的速度。
Julie Shah (左)和 Been Kim
這種技術在某些特定領域應該使用更加複雜類型的資料。
即使不是這種模式本身,隨著資料集超過人們的分析能力,這種類型的工作也可以非常有用。 非監督機器學習和人工智慧模型,例如,從軟體方面的Ayasdi以及谷歌著名貓臉識別深度學習系統已經可以通過大量的資料和識別類似的事情,但任何工具只有準確和簡單的説明人類辨識它所發現的才會有用。 完整的論文點擊這裡。
原文連結: Researchers build pattern-recognition model that acts like a human (責編/魏偉)
2014中國大資料技術大會(Big Data Technology Conference 2014,BDTC 2014)將于2014年12月12日-14日在北京新雲南皇冠假日酒店召開。 傳承自2008年,歷經七屆沉澱,「中國大資料技術大會」是目前國內最具影響、規模最大的大資料領域技術盛會。 本屆會議,你不僅可以瞭解到Apache Hadoop提交者Uma Maheswara Rao G(兼專案管理委員會成員)、Yi Liu,以及Apache Hadoop和Tez專案管理委員會成員Bikas Saha等分享的通用大資料開源專案的最新成果和發展趨勢,還將斬獲來自騰訊、阿裡、Cloudera、LinkedIn、網易等機構的數十場乾貨分享。 當下門票團購還有些許優惠, 預購從速。
免費訂閱「CSDN大資料」微信公眾號,即時瞭解最新的大資料進展!
CSDN大資料,專注大資料資訊、技術和經驗的分享和討論,提供Hadoop、Spark、Impala、Storm、HBase、MongoDB、Solr、機器學習、智慧演算法等相關大資料觀點,大資料技術,大資料平臺,大資料實踐 ,大資料產業資訊等服務。