Time of Update: 2018-12-05
作為總結:1、這次做了一個非常糟糕的設計:我採用了深度優先搜尋,當初之所以採用這種方式,是因為我要爬的資料都在搜尋樹的分葉節點上,這樣可以在代碼中少用一個隊列,事實上,這是個爛到家的設計。非分葉節點的頁面會長時間佔著記憶體。一般爬蟲會採用廣度優先搜尋,把要訪問的串連儲存在一個隊列裡面,好處:A、訪問過的頁面佔用的記憶體能被回收B、速度更快,每個頁面只解析一次。(雖然深度優先也是只解析一次,但虛擬機器要幫忙維護很多小隊列,以保持每個頁面解析出來的連結)C、容易實現多線程並行爬資料。只要保持對隊列的
Time of Update: 2018-12-05
Cocoa Foundation架構有很多面向資料的低級類和資料類型,這樣的類型會有更高的效率。一、範圍NSRangetypedef struct _NSRange { unsigned int location; unsigned int length;} NSRange;1、NSRange range; range.location = 17; range.length = 4;2、NSRange range = {17, 4};3、NSRange range =
Time of Update: 2018-12-05
google推出了很多優秀的產品,但作為國內使用者,很多東西體驗不好,主要兩方面原因:1、天國防火牆限制,開啟什麼都慢2、有些產品不太符合我的習慣,比如,不喜歡picasa最初開啟時讓你選擇從哪裡搜尋電腦的圖片,難道就不能不搜尋嗎?非要這樣強制嗎?它搜羅了所有照片,而許多圖片我是不想讓它顯示的。 一、GoAgentGoAgent是使用Python和Google App EngineSDK編寫的免費代理軟體,該軟體在中國大陸一般被當作破網軟體,用來瀏覽被中國大陸官方建立的防火長城所屏蔽的網路服務。
Time of Update: 2018-12-05
http://hi.baidu.com/group609/item/00e99d1597f986e49d778a691.什麼是機器學習?從一些經驗(E)中學習,來完成某種任務(T),通過某種評價方式(P)判斷,發現perform得更好了,就算是學習了。因此對於機器學習,需要三方面的內容,一些經驗+一個任務+一個評價方式。它能夠教會電腦去做一些事情,但是!但是!這些事情卻不是 hard code的,不需要顯示地編程實現其中所有的邏輯,而是通過資料來建模。PS:對應到我們的實驗中就是E就是訓練資料,
Time of Update: 2018-12-05
來自:http://www.javaeye.com/topic/483158應用一:解決tomcat下中文亂碼問題(先來個簡單的) 在tomcat下,我們通常這樣來解決中文亂碼問題:過濾器代碼:Java代碼 package filter; import java.io.*; import javax.servlet.*; import javax.servlet.http.*; import wrapper.GetHttpServletRequestWrapper; publi
Time of Update: 2018-12-05
突然來了一個想法,想要有快速學習的能力。雖說很功利,但我還是覺得這是很不錯的能力。所謂快速的學習,當然指比普通的一步一步學要更快速的方式。忽然呈現出好多問題:1、學習的本質是什嗎?與認識論的關係?2、為什麼學習?3、有要多東西要去學習,生活中,知識中,在不同的領域是不是有不同的學習模式?4、學習與忘記與實踐該怎麼平衡? 先拋開這些問題,專註於電腦裡面1、學習—>實踐—>總結針對學習以後要用的2、實踐—>學習—>總結針對項目中用到的東西3、基礎與應用的關係?? 千萬別把自己
Time of Update: 2018-12-05
一、好像哲學意義上的時間空間與近代物理中的時間空間不是一回事
Time of Update: 2018-12-05
文章目錄 如何證明遵循兩段鎖協議的事務調度處理的結果是可序列化的 如何證明遵循兩段鎖協議的事務調度處理的結果是可序列化的怎麼證明遵循兩段鎖協議的事務調度處理的結果是可序列化的? 如題 ------解決方案-------------------------------------------------------- 9.4. 可序列化隔離等級 可序列化(Serializable) 提供最進階別的事務隔離。
Time of Update: 2018-12-05
最近在看,先留個連結http://passover.blog.51cto.com/2431658/425536有窮自動機(Finite Automate)是用來類比實物系統的數學模型,它包括如下五個部分:有窮狀態集States輸入字元集Input symbols轉移函數Transitions起始狀態Start state接受狀態Accepting
Time of Update: 2018-12-05
注意一、configure()總能找到設定檔,基本不需要自己給它制定路徑Configuration config = new
Time of Update: 2018-12-05
Database Principles Database Systems Design Advanced Database Technology一、Database principlesRelational data model – relational algebra SQL – DDL, DML, DCL, ODBC(JDBC) Database design — Entity-Relationship model Relation normal forms
Time of Update: 2018-12-05
一、模型評估和模型選擇1、訓練誤差與測試誤差2、過擬合和模型選擇經驗風險最小化會出現過擬合問題。 二、正則化與交叉驗證1、正則化模型選擇的典型方法是正則化。正則化是結構風險最小化策略的實現,是在經驗風險上加一個正則化項。正則化符合奧卡姆剃刀原理。2、交叉驗證另一種常用的模型選擇方法是交叉驗證cross
Time of Update: 2018-12-05
https://webarchive.jira.com/wiki/display/Heritrix/A+Quick+Guide+to+Running+Your+First+Crawl+Job1、下載heritrix3後解壓2、命令列到bin目錄 >heritrix.cmd –a admin:admin啟動可以用heritrix --help 查看協助3、開啟瀏覽器 地址 127.0.0.1:8443 即可使用,使用者名稱密碼是上面打的admin, admin (以前版本好像是127.0
Time of Update: 2018-12-05
在實驗室和寢室上網,要使用不同的ip,每次都改下太麻煩了,寫了2個bat檔案修改。@ echo offecho 設定422ip地址set addr=10.214.25.81set mask=255.255.255.0set gway=10.214.25.1set dns1=10.10.0.21echo ------------------------------echo ip=%addr%echo mask=%mask%echo gateway=%gway%echo
Time of Update: 2018-12-05
IT方面的論壇太多了,有綜合,有專業,有行業,在各個論壇裡混了幾年,體會頗深,以前是論壇哪裡人多,往哪裡去,新浪論壇,網易是經常去的,人多啊,好幾十萬,去了以後才發現沒有意思,沒有共同的語言,於是逛專業論壇,行業論壇,終於找到了共同語言,總結一下論壇的經驗:人不在多,有仙則靈,貼不在多,有精則行,逛了大半輩子,一個IT人發展方向一定要除了技術外,業務,理論,思想一個都不能少,於是我推薦如下這些論壇,或許真能協助您,做論壇,都是賠本的買賣,不收費還協助你學習,得向斑竹們致敬啊。
Time of Update: 2018-12-05
使用Eclipse構建Maven的SpringMVC項目http://blog.csdn.net/chjttony/article/details/6026079 1.在java開發領域,Spring相對於EJB來說是一種輕量級的,非侵入性的Java開發架構,曾經有兩本很暢銷的書《Expert one-on-one J2EE Design and Development》和《Expert one-on-one J2EEdevelopment without EJB》是java高手進階必看的寶典,
Time of Update: 2018-12-05
“我們發現,一切知識都必鬚根據我們的本能信仰而建立起來,如果,如果這些本能被否定,變一無所有了。” “除非我們以某種特別的信仰為根據,否則我們便不可能有理由拒絕一種信仰。” 對於一個絕對的懷疑派,是沒有什麼可說的或者要說的。 既然確立了本能信仰,這個事件就是我們認識、建立的世界。1、認識世界,發現規律,即相對真理。然後指導實踐。實踐的目的??實踐的目的是人的能動性、主動性和客觀性的統一。2、survive
Time of Update: 2018-12-05
supervised learninglearn a function h : X → Yh is called a hypothesis.一、Linear Regression例子中,x是二維向量,x1代表living area,x2代表bedroomsfunctions/hypotheses h設x0 = 1,變換得Now, given a training set, how do we pick, or learn, the parameters θ?現在變為求參數θOne
Time of Update: 2018-12-05
http://blog.csdn.net/xianlingmao/article/details/7667042 資訊檢索和網路資料領域(WWW, SIGIR, CIKM, WSDM, ACL,
Time of Update: 2018-12-05
http://www.sigvc.org/bbs/thread-57-1-1.html1 What is the Goal of Sensory Coding: 介紹了兩種sensory coding 的方式 PCA 和 Sparse coding,並比較了他們的優缺點,指出對於大 多數生物資訊處理來說多採用sparse coding的方式。 2 Sparse coding with an overcomplete basis set A strategy employed