Time of Update: 2018-12-04
最近又把Lucene In Action 前面的章節讀了一下,跑了跑幾個測試案例。因為編寫這本書的時候是Lucene 1.4版的,而我現在所用的是2.2版的,其中必然又很多method 或者 class 有改動。我認為在1.9版本中添加的新class(貌似1.9版) ConstantScoreRangeQuery 是很有協助的。public void testRangeQuery() throws ParseException { query = queryParser.parse("[01/
Time of Update: 2018-12-04
在敏捷開發過程中是通過使用者故事來將需求具體化成可以進行反覆式開發法的一個個現實的可見的開發工作單位。因此在敏捷軟體的開發過程中,使用者故事的劃分對於迭代和開發起著舉足輕重的作用。使用者故事從其名字來看是站在使用者的角度所描述的故事,同時也是使用者所能看懂的故事,開發人員最容易犯下的一個錯誤就是站在自己的角度去思考和劃分故事,這樣就背離了使用者故事的初衷。那什麼是使用者故事?首先來說使用者故事是對需求的細化和切分,既然是細化,就得有一個度,需求的顆粒度需要多少才能稱之為使用者故事?這就牽扯出和使
Time of Update: 2018-12-04
持續整合 Continuous Integration作為極限編程的其中一個實踐而出現的。但是其自身所體現出的價值卻已經超出極限編程了。目前在我們的項目中所採用的CI已經逐漸的從最開始的抵制到現在被項目群組成員所接受,從個人的觀點來看,持續整合為項目提供了以下的幾點作用:1. 及時發現bug(通過acceptance
Time of Update: 2018-12-04
剛剛看了一篇分析Mark Zuckerberg成功因素的文章,裡面提到了Zuckerberg成功的6點因素,分別為:志向洞察力執行力決心運氣時機在我個人看來決心是任何人成功所不能缺少的最核心的前提條件,文章中提到:“世界上沒有什麼可以替代毅力。才華不能,許多不成功的人都不缺才華。天賦不能,沒有獲得回報的天才比比皆是。教育不能,世界上有著太多受過良好教育的棄兒。毅力和決心是無所不能的。‘努力前進’的口號已經解決並將繼續解決人類面臨的問題。”--John Calvin
Time of Update: 2018-12-04
這兩天在開發一個小工具,使用的IDE是intelliJ,但是在進行資源檔的編譯的時候發現intelliJ對於資源檔的處理還是存在一點的小疑惑的。首先如果要編譯的資源檔不是intelliJ所認為的檔案尾碼結尾的需要進行配置,位於compiler下面的 Resource
Time of Update: 2018-12-04
關於單元測試的重要性就不做過多的贅述,其基礎概念可以參考http://blog.csdn.net/linlinlinxi007/article/details/5294098。最近看到一個ppt介紹UT方面的best practice最佳實務,根據個人對UT的理解將其大致內容做一個簡單的陳述。首先我們在開發產品的時候Production Code和Testing Code這裡指UT,都是位於代碼層級的,也就是關注在底層的邏輯實現上面,但是二者關注點有所區別,Production
Time of Update: 2018-12-04
最近在項目中碰到利用java預設的Collator.getInstance(Locale.China)進行預設的拼音排序時有一部分漢字無法正確的通過預設的排序方式自動進行排序。查詢了一下資料,原來問題出現在中文字型檔上面,預設的一級字型檔是採用的拼音排序方式,而二級字型檔中的漢字預設卻是採用的部首筆劃的順序排列的。在此將網路上關於漢字的一級字型檔和二級字型檔資訊的資料做一個小小的總結。為了使每一個漢字有一個全國統一的代碼,1980年,我國頒布了第一個漢字編碼的國家標準: GB2312-80《資訊
Time of Update: 2018-12-04
在firefox中進行擴充有兩種方式,一種是extension,另外一種為plugin。extension是firefox的附加組件,它可以改變firefox的現有功能和增加一些新功能,extension相對於plugin來說輕量級一些,它是通過javascript和XUL(XML的變相方式)來實現的。而plugin則是一個獨立的application,firefox通過特定的api介面進行相應的互動來擴充瀏覽器自身的功能,連結參考。Firefox是mozilla核心,自身引擎主要是通過C語言實
Time of Update: 2018-12-04
這兩天在寫自己的案頭搜尋程式,陸續把自己所碰到的一些問題寫一下,防止以後遺忘,再犯同樣的錯誤。 現在先說一下PDFBox對文本的提取,我最開始的時候對於文本的提取是按照下面的方式來寫的: COSDocument cosDoc = null; FileInputStream is = new FileInputStream(file); PDFParser parser = new PDFParser(is);// parser.parse( ); cosDoc =
Time of Update: 2018-12-04
這兩天在用POI提取 Microsoft 格式文檔的內容的時候莫名其妙的遇到了一個問題,困擾了我3天: 我的POI版本為:poi-3.0.2-FINAL-20080204.jar;poi-contrib-3.0.2-FINAL-20080204.jar;poi-scratchpad-3.0.2-FINAL-20080204.jar;開發環境為:jdk1.6; IDE為Eclipse3.2;以下是我提取excel格式文本的程式: HSSFWorkbook book = new
Time of Update: 2018-12-04
公司內部論壇, 經常有同事說上傳不了附件, 對於360瀏覽器, 把論壇設為信任網站就行了,可是對於IE8,設為信任網站也解決不了問題, 因為IE8安全性比較高,伺服器預設是識別不了本地路徑。ie功能表列, 工具 -> InterNet選項 -> 安全 -> 自訂層級。 啟用: 將檔案上傳到伺服器時包含本地目錄路徑。 如所示
Time of Update: 2018-12-04
編輯相關快速鍵 Eclipse的編輯功能非常強大,掌握了Eclipse快速鍵功能,能夠大大提高開發效率。Eclipse中有如下一些和編輯相關的快速鍵。 1. 【ALT+/】 此快速鍵為使用者編輯的好幫手,能為使用者提供內容的輔助,不要為記不全方法和屬性名稱犯愁,當記不全類、方法和屬性的名字時,多體驗一下【ALT+/】快速鍵帶來的好處吧。 2. 【Ctrl+O】 顯示類中方法和屬性的大綱,能快速定位類的方法和屬性,在尋找Bug時非常有用。 3. 【Ctrl+/】
Time of Update: 2018-12-04
剛才想在google code上面去下載一個git,突然發現我又上不了google code了。對於google reader也只能通過https來進行串連,其他的google相關服務也一律無法使用,我不知道其他的中國使用者是否也出現了我這樣的情況,至少我是經常碰到,一如當年sourceforge無法訪問一樣。作為一個IT人我已經習慣使用google的各種產品和服務,可能一個普通使用者在無法開啟google的情況下能夠去使用百度,就搜尋來說我就不多做評論,可是google
Time of Update: 2018-12-04
pragma once表示的是這個標頭檔只聲明一次,可以防止被重複的引用導致的錯誤;而對於#ifndef語句則也是聲明一次,但是確實使用的事宏。我們不必為怎麼是用一個宏而大費周折了。如果聲明的宏的名稱一樣的話,可能會導致標頭檔明明存在,但是編譯器卻說找不到狀況。而對於pragma
Time of Update: 2018-12-04
java作為目前最受開發人員歡迎以及熱度最高的一門語言,在很多方面展現出了其特性,雖然靈活性不比c++,執行效率不比c,開發效率不比Ruby,但是作為最早最純粹的OO語言,java在目前來說因為其在編程方面有著與c及c++語言的延續性而被廣泛的使用。即使java是如此的受歡迎,個人覺得jdk的api在很多方面卻做的不是太好,簡單的以命名來說。比如說string類的兩個方法replace和replaceAll,因為有replaceAll的存在根據命名來看很容易使人覺得第一個replace方法是用r
Time of Update: 2018-12-04
NextRecordset 和 GetRows 大家可能用的很少!最近使用使用,不錯的好東東!對提高批量查詢,查詢紀錄集不是巨海量的情況很有效果NextRecordset 和 GetRows 是Recordset的兩個方法 GetRows 將recordset記錄集提取到一個二維數組中,我們對recordset資料的行為就轉移到該數組,可以早早的斷開紀錄集,不用再使用中繼資料操作,rs.movnext, while not
Time of Update: 2018-12-04
關於MMU編程,有幾個是要經常查閱的資料。這裡我把它整理成一篇文檔,因此篇幅太長,節選發上來,全部內容放在附件的PDF當中。 這個文檔主要有三個內容 一.協議處器CP15 中寄存器的全部說明. 二.ARM 協處理指示 三.CP15命令列表一.協議處器CP15 中寄存器說明---------------------------------------------------------------------------引自 http://blog.csdn.net/genglei1
Time of Update: 2018-12-04
原文連結:http://www.defmacro.org/ramblings/fp.html 單元測試因為函數式編程的每一個符號都是
Time of Update: 2018-12-04
最近我的Eclipse在關於Annotation的問題上老是莫名其妙的出些問題, 最常見的就是關於Annotation中的@Override這個標記了。按照定義@Override在java中表示覆寫一個基類中的方法,其在源碼中的定義如下/** * Indicates that a method declaration is intended to override a * method declaration in a superclass. If a method is annotated
Time of Update: 2018-12-04
最近在公司接手了新的project,需要對公司的整個無線網路進行分布式的爬取,網頁索引進行更新和計算PR值,由於資料量太大(千萬級資料量),不得不進行分布式的處理。新的版本準備採用Hadoop架構,現在將Hadoop配置的大致過程和需要注意的事項進行說明,呵呵,轉載自別人的文章(以後的文章我會著重說明我在配置的過程中碰到的一些問題,作為一點小小的總結吧)http://www.cnblogs.com/wayne1017/archive/2007/03/20/678724.html本文主要是以安裝