讀《數學之美》

來源:互聯網
上載者:User

標籤:數學   數學之美   吳軍   學習   

讀《數學之美》

       其實準備讀《數學之美》這本書,是從很久開始的。記得去年夏天的時候,是讀了《浪潮之巔》,然後就認識了吳軍這樣的一個人,很喜歡他的寫作風格。於是就準備讀《數學之美》的。

      《數學之美》這本書,本身和《浪潮之巔》一樣,已經在眾多的讀者中有了一個很好的口碑了,吳軍博士本身的才學和研究,對於更多的人來說,也形成了一種尊重的心理。在我讀了《浪潮之巔》後,有種很厚重的曆史滄桑感堆積於胸。不得不承認《浪潮之巔》對於我的影響。

     《數學之美》其實與《浪潮之巔》有很大的不同,《浪潮之巔》可以說成是一本更適用於福士科普類的讀物,裡面有作者很深的思想觀點在裡面;而《數學之美》則相對來說只是適合這個領域的讀者來讀。雖然吳軍博士已經將《數學之美》中很多的定理寫得很淺顯,但是如果對於一個文科類學生來說,我認為依舊很難理解。即使對於理科出身的我,念過一年的《高等數學》,裡面的很多的具體的定理技術,同樣很生疏。所以從去年準備讀這本書,到今年真正讀完它,相隔的時間也挺久的了。而在這之間,我覺得也有很多的機緣和巧合,我因為工作的關係,瞭解了一些機器學習,人工智慧,包括中文分詞類的知識,而這部分知識,在《數學之美》中,也有了很好的體現。

       我覺得我從來不算是一個實幹派,對於某類的技術知識,我願意先從理論知識入手,先必須瞭解一個整體的架構,之後才可以做好一個局部的某塊。這種邏輯在大公司來說,是基本不可能的,很多的系統,包括組織,整體的架構有人知道的也已經很少,大多數人都在忙著自己的那塊,完成了既是完成了。就像我學中文分詞等等的東西。

       在有了一定的基礎知識之後,我會覺得讀《數學之美》是一件很幸福的事,吳軍博士的深入淺出的對於很多理論知識的講解和描述,很多時候會讓你有種茅塞頓開的感覺。

       我覺得吳軍博士文字裡總是會有一種人文的東西,在裡面。那種感覺很奇妙,也會讓你莫名的感受到一個在學術上有很好造詣的人的內心情懷。就像吳軍描述的很多的人一樣,很多有很多成就的人,不緊緊是一個人,或者有很古怪的性情,或者有很獨特的思想,但很多人同樣已自己的一種堅持和態度,在影響著更多的人,所以他們會成功,也會帶領更多的人成功。

       在讀了《數學之美》之後,自己也反思了很多自己的事,對的,不對的,都有。有時候想,有的大學為什麼會那麼好,而有的大學不那麼好。很多人願意很努力的去更好的學校是為什麼,而讀過大學的很多人都應該知道,大學更多的是自學。你可以很老師交流。而我所理解的好的大學,它之所以好,是因為它首先有很多很好的老師集中在那裡,所以他們可以集中更多的關注點,然後吸引了更多的優秀的人,而這些牛人也很會帶領優秀的人。所以這會形成一種迴圈,因為有好的,來好的,變更好。這就是好的發展迴圈。

       吳軍博士在後記裡面寫了一句,我認為特別好的話:“世界上最好的學者總是深入淺出的把大道理講給外行人聽,而不是故弄玄虛的把簡單問題複雜化。”書中吳軍博士也談到很多的理論,在很多的時候,可能你盡量的去簡化它,往簡單的方向去想,或許結果會很些,就像隱含馬爾科夫模型等等,或者還有一些科學領導者的思想。

       每次讀吳軍博士的書之後,總覺得意猶未盡(雖然一共,我也唯讀了兩本)。書雖然是讀完了,但是我總覺得那裡面,能夠我去想,去領會的東西還有很多。我記得一句讓我印象很深刻的話“很多人讀書的時候,不應該追求讀書的數量,而應該在於你讀它,你用來思考的時間。”

 

以下是我習慣,把一本書的目錄附上:

第1章 文字和語言 vs 數字和資訊

文字和語言與數學,從產生起原本就有相通性,雖然它們的發展一度分道揚鑣,但是最終還是能走到一起。

第2章 自然語言處理— 從規則到統計人類對機器理解自然語言的認識走了一條大彎路。早期的研究集中採用基於規則的方法,雖然解決了一些簡單的問題,但是無法從根本上將自然語言理解實用化。直到?多年後,人們開始嘗試用基於統計的方法進行自然語言處理,才有了突破性進展和實用的產品。

第3章 統計語言模型

統計語言模型是自然語言處理的基礎,並且被廣泛應用於機器翻譯、語音辨識、印刷體或手寫體識別、拼字錯誤修正、漢字輸入和文獻查詢。

第4章 談談中文分詞

中文分詞是中文資訊處理的基礎,它同樣走過了一段彎路,目前依靠統計語言模型已經基本解決了這個問題。

第5章 隱含馬爾可夫模型

隱含馬爾可夫模型最初應用於通訊領域,繼而推廣到語音和語言處理中,成為串連自然語言處理和通訊的橋樑。同時,隱含馬爾可夫模型也是機器學習的主要工具之一。

第6章 資訊的度量和作用

資訊是可以量化度量的。資訊熵不僅是對資訊的量化度量,也是整個資訊理論的基礎。它對於通訊、資料壓縮、自然語言處理都有很強的指導意義。

第7章 賈裡尼克和現代語言處理

作為現代自然語言處理的奠基者,賈裡尼克教授成功地將數學原理應用於自然語言處理領域中,他的一生富於傳奇色彩。

第8章 簡單之美— 布爾代數和搜尋引擎的索引布爾代數雖然非常簡單,卻是電腦科學的基礎,它不僅把邏輯和數學合二為一,而且給了我們一個全新的視角看待世界,開創了數字化時代。

第9章 圖論和網路爬蟲

互連網搜尋引擎在建立索引前需要用一個程式自動地將所有的網頁下載到伺服器上,這個程式稱為網路爬蟲,它的編寫是基於離散數學中圖論的原理。

第10章 PageRank — Google的民主表決式網名

網頁排名技術是早期的殺手鐧,它的出現使得網頁搜尋的品質上了一個大的台階。它背後的原理是圖論和線性代數的矩陣運算。

第11章 如何確定網頁和查詢的相關性確定網頁和查詢的相關性是網頁搜尋的根本問題,其中確定查詢中每個關鍵詞的重要性有多高是關鍵。是目前通用的關鍵詞重要性的度量,其背後的原理是資訊理論。

第12章 地圖和本地搜尋的最基本技術

有限劃地圖和本地服務中要用到有限狀態機器和動態規劃技術。

這兩項技術是機器智能和機器學習的工具,它們的應用非常廣泛,還包括語音辨識、拼字和文法錯誤修正、拼音IME、工業控制和生物的序列分析等。

第13章 Google AK-47 的設計者— 阿米特·士

在所有輕武器中最有名的是衝鋒槍,因為它從不卡殼,不易損壞,可在任何環境下使用,可靠性好,殺傷力大並且操作簡單。的產品就是按照上述原

則設計的。

第14章 餘弦定理和新聞的分類

電腦雖然讀不懂新聞,卻可以準確地對新聞進行分類。

其數學工具是看似毫不相干的餘弦定理。

第15章 矩陣運算和文本處理中的兩個分類問題無論是詞彙的聚類還是文本的分類,都可以通過線性代數中矩陣的奇異值分解來進行。這樣一來,自然語言處理的問題就變成了一個數學問題。

第16章 資訊指紋及其應用

世間萬物都有一個唯一標識的特徵,資訊也是如此。每一條資訊都有它特定的指紋,通過這個指紋可以區別不同的資訊。

第17章 由電視劇《暗算》所想到的— 談談原理

密碼學的根本是資訊理論和數學。沒有資訊理論指導的密碼是非常容易被破解的。只有在資訊理論被廣泛應用於密碼學後,密碼才真正變得安全。

第18章 閃光的不一定是金子— 談談搜尋引擎題

閃光的不一定是金子,搜尋引擎中排名靠前的網頁也未必是有用的網頁。消除這些作弊網頁的原理和通訊中過濾噪音的原理相同。這說明資訊處理和通訊的很多原理是相通的。

第19章 談談數學模型的重要性

正確的數學模型在科學和工程中至關重要,而發現正確模型的途徑常常是曲折的。正確的模型在形式上通常是簡單的。

第20章 不要把雞蛋放到一個籃子裡— 談談型

最大熵模型是一個完美的數學模型。它可以將各種資訊整合到一個統一的模型中,在資訊處理和機器學習中有反作弊問題著廣泛的應用。它在形式上非常簡單、優美,而在實現時需要有精深的數學基礎和高超的技巧。

第21章 拼音IME的數學原理

漢字的輸入過程本身就是人和電腦之間的通訊。好的IME會自覺或不自覺地遵循通訊的數學模型。當然要做出最有效IME,應當自覺使用資訊理論做指導。

第22章 自然語言處理的教父馬庫斯和他的們

將自然語言處理從基於規則的研究方法轉到基於統計的研究方法上,賓夕法尼亞大學的教授米奇·馬庫斯功不可沒。他創立了今天在學術界廣泛使用的語料庫,同時培養了一大批精英人物。

第23章 布隆過濾器

日常生活中,經常要判斷一個元素是否在一個集合中。布隆過濾器是電腦工程中解決這個問題最好的數學工具。

第24章 馬爾可夫鏈的擴充— 貝葉斯網路

貝葉斯網路是一個加權的有向圖,是馬爾可夫鏈的擴充。而從認識論的層面看:貝葉斯網路克服了馬爾可夫鏈那種機械的線性約束,它可以把任何有關聯的事件統一到它的架構下面。它在生物統計、影像處理、決策支援系統和博弈論中都有廣泛的使用。

第25章 條件隨機場和句法分析

條件隨機場是計算聯合機率分布的有效模型,而句法分析似乎是英文課上英語老師教的東西,這兩者有什麼聯絡呢?

第26章 維特比和他的維特比演算法

維特比演算法是現代數字通訊中使用最頻繁的演算法,同時也是很多自然語言處理的解碼演算法。可以毫不誇張地講,維特比是對我們今天生活的影響力最大的科學家之一,因為如今基於的移動通訊標準主要就是他創辦的高通公司制定的。

第27章 再談文本自動分類問題— 期望最大化演算法

只要有一些訓練資料,再定義一個最大化函數,採用演算法,利用電腦經過若干次迭代,就可以得到所需要的模型。這實在是太美妙了,這也許是我們的造物主刻意安排的。所以我把它稱作上帝的演算法。

第28章 羅吉斯迴歸和搜尋廣告

羅吉斯迴歸模型是一種將影響機率的不同因素結合在一起的指數模型,它不僅在搜尋廣告中起著重要的作用,而且被廣泛應用於資訊處理和生物統計中。

第29章 各個擊破演算法和Google 雲端運算的基礎

Google頗為神秘的雲端運算中最重要的MapReduce工具,其原理就是電腦演算法中常用的“各個擊破”演算法,它的原理原來這麼簡單— 將複雜的大問題分解成很多小問題分別求解,然後再把小問題的解合并成原始問題的解。由此可見,在生活中大量用到的、真正有用的方法

常常都是簡單樸實的。

 


聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.