Time of Update: 2018-12-06
Play!的安裝(windows):下載檔案http://www.playframework.org/下載最新的安裝包,play-1.2.3.zip解壓到本機檔案夾,如:D:\play\設定環境變數Path到安裝目錄,開啟window命令列:輸入play,就會輸出play!的相關資訊,表示已安裝成功Play!建立項目:開啟window命令列,進入項目要儲存的目錄,play new myapp
Time of Update: 2018-12-06
先到http://www.elasticsearch.org/download/下載最新版的elasticsearch運行包,本文寫時最新的是0.19.1,作者是個很勤快的人,es的更新很頻繁,bug修複得很快。下載完解開有三個包:bin是啟動並執行指令碼,config是設定檔案,lib是放依賴的包。如果你要裝外掛程式的話就要多建立一個plugins的檔案夾,把外掛程式放到這個檔案夾中。1.單機環境:單機版的elasticsearch運行很簡單,linux下直接 bin/elasticsea
Time of Update: 2018-12-06
一 直接使用 Lucene ( http://lucene.apache.org )說明:Lucene 是一個 JAVA 搜尋類庫,它本身並不是一個完整的解決方案,需要額外的開發工作優點:成熟的解決方案,有很多的成功案例。apache 頂級項目,正在持續快速的進步。龐大而活躍的開發社區,大量的開發人員。它只是一個類庫,有足夠的定製和最佳化空間:經過簡單定製,就可以滿足絕大部分常見的需求;經過最佳化,可以支援 10億+
Time of Update: 2018-12-06
前幾次我們講到了solr的基本用法和設定檔,接下來就開始進入我們真正的代碼之旅啦。 1)首先以一個簡單的程式來開頭:public static void main(String[] args) throws SolrServerException, IOException, ParserConfigurationException, SAXException{ //設定solr.home,注意這時通過環境變數是solr.solr.home
Time of Update: 2018-12-06
Lily是什麼Lily是一個可擴充的資料倉儲。用於資料的儲存和搜尋。Lily是一個分布式系統,她並不是白手起家的,她依賴於兩個已有的OpenSource軟體,一個是HBase, 另一個是SOLR. 同時Lily對於使用者提供自己的操作介面,稱作Lily API.Lily的優勢在於她強大的搜尋能力,無論是文本匹配還是全文索引,通通都能搞定。但我覺得Lily在擷取這些優勢的同時付出了相當大的代價,最主要的代價就是系統的複雜性。想想看,為了能夠使用Lily,你需要安裝並維護以下系統:HDFS,
Time of Update: 2018-12-06
前兩天,學習了solr的基本用法,接下來我們就開始真正來學習一下solr。學習一下它的檔案結構,設定檔等。 以我們現在學習的階段,最重要的檔案夾就是example檔案夾,這個裡麵包含了許多我們要學習的東西。 我們再來看一下該檔案夾結構 我們看到這樣的檔案結構,檔案夾的意思大家肯定都看得懂,這裡只介紹兩個檔案夾,multicore和solr。 multicore是多個solr執行個體時才需要用到,現在我們暫時沒用,先不管它。solr是內建的一個solr.home
Time of Update: 2018-12-06
文章目錄 Katta - Lucene & more in the cloud. 介紹 katta 是一個運行在許多商品硬體伺服器上的分布式應用,它非常類似於Hadoop MapReduce, Hadoop DFS, HBase, Bigtable 和 Hypertable. 概述 主節點伺服器管理從節點伺服器和index shards任務。從節點伺服器服務index
Time of Update: 2018-12-06
1 1. Solr1.1 Features1.2 Pros & Cons1.3 References2 2. Senseidb2.1 Features2.2 Pros & Cons2.3 為何沒有直接用Solr?2.4 References3 3. elasticsearch3.1 Features3.2 Pros & Cons3.3 References4 4.
Time of Update: 2018-12-06
採用基於資料採礦的演算法來實現Recommendation Engine是各大電子商務網站、SNS社區最為常用的方法,Recommendation Engine常用的Content-Based推薦演算法及協同過濾演算法(Item-Based 、User-based)在電子商務推薦系統入門v2.0 、電子商務推薦系統入門基礎 中已經有所闡述。但從實際應用來看,對於大部分中小型企業來說,要在電子商務系統完整採用以上演算法有很大的難度。1、常用Recommendation Engine演算法問題1
Time of Update: 2018-12-06
Apache Tajo是一個基於hadoop的關係型且分布式的資料庫倉庫系統,Tajo設計之初就是通過先進的資料庫技術做到能夠低延遲,可擴充,即時查詢,可彙總的資料庫倉庫系統,以彌補hadoop等目前在即時,關係事務方面的短板。同時Tajo還支援SQL標準,所以你可以通過SQL來操作它。HDFS為Tajo的主要儲存層,並且有自己的查詢引擎(代碼結構看下來貌似很多代碼都是自己寫的)所以可以直接控制各種分布式執行(如查詢)和資料流。如此Tajo有許多查詢控制策略,以及對查詢可以做很多最佳化。功能:
Time of Update: 2018-12-06
1. Sensei介紹Sensei是Linkin公司開發的一個開源分布式即時半結構化資料庫,他主要支援以下功能(根據官網翻譯):全文檢索索引即時更新faceted searchkey-value查詢在高並發更新與查詢效能高支援與Hadoop整合初步的調研了以下該項目,發現他其實主要是在全文索引的基礎封裝了Browse Query Language
Time of Update: 2018-12-06
<SCRIPT LANGUAGE="JavaScript"><!--function fsubmit(sform){str = '';stre='';for(i=0;i<sform.length;i++){stre +=sform[i].tagName+"->"+sform[i].name+"="+sform[i].value+"\n";}alert(stre);var a=sform.getElementsByTagName("input");
Time of Update: 2018-12-06
MSXML中提供了Microsoft.XMLHTTP對象,能夠完成從資料包到Request對象的轉換以及發送任務。 建立XMLHTTP對象的語句如下: Set objXML = CreateObject("Msxml2.XMLHTTP") 或Set objXML = CreateObject(“Microsoft.XMLHTTP”)' Or, for version 3.0 of XMLHTTP, use:' Set xml = Server.CreateObject("MSXML2.Serve
Time of Update: 2018-12-06
大部分人已經見過自動完成(autocomplete)的功能了(見),solr提供了構建這個功能的機制。今天,我將給你展示如何使用facet的方式來添加自動完成機制。 索引 設想你想在你的線上商店中,給使用者一些提示,比如商品的名稱。假設我們的索引構建如下: <field name="id" type="string" indexed="true" stored="true" multiValued="false" required="true"/> <field name=
Time of Update: 2018-12-06
jetty開機後自動啟動,這個問題困擾我有一陣子了,最後摸索出來一個行至有效辦法和大家分享下。直接看rc.local代碼,系統啟動的時候會自動運行此指令碼:#系統內容是必備的export LANG="zh_CN.UTF-8"export
Time of Update: 2018-12-06
《Lucene in Action》第二版中對MoreLikeThis 介紹的例子,搜尋類似的書籍,代碼如下,供大家學習參考:public class BooksMoreLikeThis {public static void main(String[] args) throws Throwable {String indexDir = System.getProperty("index.dir");FSDirectory directory = FSDirectory.open(new
Time of Update: 2018-12-06
最近一段時間,經常看到有人在微博上說,“很多公司暫時用不到YARN,因為一般公司的叢集規模並未像Yahoo、Facebook那樣達到幾千台,甚至將來幾萬台”。這完全是一種錯誤的觀念,在Hadoop高速發展的時代,必須更正。實際上,上述觀念只看到了YARN的擴充性(Scalability),擴充性是可用可不用的特性,中小型公司將YARN部署到小叢集(按照IBM觀點,叢集規模小於200台的稱為中小規模叢集,這樣的公司找到90%以上)上,可能享受不到擴充性帶來的優勢,但至少可以擷取以下幾個收益:(1)
Time of Update: 2018-12-06
常有人說,他們在使用XMLHTTP過程中,總是為中文亂碼的問題煩惱。本人查閱了一些資料,結果令我失望,大家都是使用ASP伺服器端技術解決該問題。 先分析一下為何會出現中文亂碼的問題。原因很簡單:XMLHTTP得到Response時假定Response是UTF8編碼的,它把含GB2312編碼的HTML當成UTF8格式,因此,出現了中文亂碼。 那麼,除了使用ASP伺服器端指令碼技術外,就沒有用戶端的解決辦法嗎?答案是:有!
Time of Update: 2018-12-06
getfile.asp <%''利用xmlhttp組件擷取遠程檔案儲存到當前空間''此是網站建設中的一個執行個體,遠程擷取一個網頁內容並篩選出相關的天氣資料,當然可以跳過檔案本機存放區再擷取資料''參考了xoyu的函數,在此感謝fileurl="http://www.hbqx.gov.cn/other/tqyb/inc_city_hb.asp"dotloc=InStrRev(fileurl,".")filepath="thistest"&mid(fileurl,dotloc) ''
Time of Update: 2018-12-06
引言 大家都知道可以通過post或者get獲得form表單的資料,那麼我們如何?不重新整理的提交直接獲得頁面上的資料呢?這就要藉助xmlhttp協議了。xmlhttp是xmldom技術的一部分。 下面的代碼就是一個很簡單的例子,我們利用xmlhttp技術實現簡單的使用者登陸。 開始 1.簡單的登入頁面login.jsp <script>function toServer(){ var xml = "<root>"+