Time of Update: 2018-12-04
1 多個使用者操作hdfs和hbase時,出現以下異常,大概意思就是無法串連datanode,擷取不到資料INFO hdfs.DFSClient: Could not obtain block blk_-3181406624357578636_19200 from any node: java.io.IOException: No live nodes contain current block. Will get new block locations from namenode and
Time of Update: 2018-12-04
1、在客戶現場做項目,不要與客戶混在一起辦公,要有獨立的辦公間,可以關起門來大聲討論的,最好還有會議室、投影儀、移動板。 1)甲方是職能型組織、咱們是項目型的,工作方法、辦公方式都不一樣。討論、會議是項目組必不可少的,尤其是DW/BI(資料倉儲/商務智能)項目,1天1討論、3天1會議的,直接影響到了甲方的其他成員,久而久之你會發現甲方的人員對項目組隱隱有敵意。
Time of Update: 2018-12-04
首先是Node 類的定義package SearchTree;public class Node {private Node left;private Node right;private Node Parrent;int data;public Node(Node left, Node right, Node parrent, int data) {super();this.left = left;this.right = right;Parrent = parrent;this.data =
Time of Update: 2018-12-04
<?xml version="1.0" encoding="utf-8"?><s:Application xmlns:fx="http://ns.adobe.com/mxml/2009" xmlns:s="library://ns.adobe.com/flex/spark" xmlns:mx="library://ns.adobe.com/flex/mx" minWidth="955" minHeight="600"
Time of Update: 2018-12-04
項目進度因測試延遲好幾天了,又是關鍵裡程碑的驗收點,心裡焦慮,飯吃不香、覺也睡不太穩。 項目進度與項目組利益戚戚相關,延遲一天,就要從項目獎金中直接扣除項目組這一天的成本。 做為PM有責任為項目組爭取更多的利益,這其中也有個人自己的利益,腦子裡老想著這個事.... 認真分析了進度延遲的原因,一是計劃中沒重視項目測試,把這塊的時間安排的很短;二是測試案例由客戶準備,設計的很變態。DW/BI項目的測試與其他項目不一樣,客戶不懂這塊,哎,風險沒控制好。
Time of Update: 2018-12-04
應用:假設一個亂序數組,需要尋找一個元素是否在該數組中,這時需要用到順序尋找,也就是遍曆數組。一般情況下我們會寫下如下代碼:int Sequential_Search(int *a,int n,int key){//數組從1開始int i;for(int i=1;i<=n;i++){if(a[i]==key)return i;}return 0;//尋找失敗}有的資料結構書上,會運用哨兵元素,改成這樣的代碼:int Sequential_Search2(int *a int n,int
Time of Update: 2018-12-04
公司的產品有點複雜,有些功能又只能通過命令列完成。但是有的時候產品容易被預設安裝到c:\Program Files\這樣包含空格的路徑下,那麼在命令列中輸入一個帶空格的file path作為參數往往會出錯。所以大家都流傳著這樣一種說法:咱們公司的產品安裝的時候選擇的目錄千萬不要包含空格。但是,一個那麼大的產品裝好了,使用命令列配置的時候發現path帶空格命令過不去,而卸載重裝太恐怖了,怎麼辦?現在有兩個辦法來解決這個問題1)用縮寫。比如c:\Program Files縮寫為c:\Progra~1
Time of Update: 2018-12-04
1 這個用的比較少,限制比較大,一般情況下不對已經存在的資料和檔案進行修改,修改的往往是mapreduce 或者其他階段產生的臨時檔案import java.io.IOException;import java.io.InputStream;import java.io.OutputStream;import java.net.URI;import org.apache.hadoop.conf.Configuration;import
Time of Update: 2018-12-04
通過敲寫著連個例子,大概瞭解了lucene 的核心類以及主要api 的功能。package Demo;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStreamReader;import java.util.Date;import
Time of Update: 2018-12-04
1:使用java.net.url 不過需要轉換,這是最間的那的一種,有缺陷public class URLCat {/** * @param args */static{URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory()); // 將hdfs 格式的url 轉換成系統能夠識別的}public static void main(String[] args) throws MalformedURLException,
Time of Update: 2018-12-04
這個文章已經想寫很長時間了,今天沒事就寫下!關於CXF之前接觸不是很多,所以不是很懂,這段時間項目需要所以就研究下首先是理解Restful 介面也發行就緒wsdl介面,以往我的印象中Rest介面,只是發布一個服務,他的介面服務方式給使用文檔說明的,但是接下來發布的Rest介面就是一個wsdl形式的介面。工程需要Spring core 、Spring AOP、CXF等相關包支援。Demo工程目標,
Time of Update: 2018-12-04
#include<stdio.h>/* 求num 二進位中1 的個數,複雜度為o(count) , num&(num-1) 每次消除右起第一個1 考慮 num=1110 num-1=1101 num&(num-1)=1100*/ int numCount(int num){ int count = 0; while(num) { num&=(num-1); // 將num 右起第一個 1 給消除掉
Time of Update: 2018-12-04
// cc ListStatus Shows the file statuses for a collection of paths in a Hadoop filesystem/* * 一個路徑下會產生一個到多個的FileStatus,每個檔案和每個目錄都會產生一個 */import java.net.URI;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileStatus;import
Time of Update: 2018-12-04
先說說系統安裝環境: centOS 6.3 最新的系統,一切都是免費的, yum 是不受管理,大多數的軟體已經裝好了比如python python 2.6 。 centOS 5.* yum免費,python 2.4 redhat 5.6 這個是老的系統,yum需要註冊,才能更好的使用。 python 應該是2.4的 ------------------- 我們需要安裝cloudera hadoop
Time of Update: 2018-12-04
本教程,結合本人親身實踐,不僅適合於最新版本Heritrix 1.14.4,更適合其他任何版本。Heritrix具體如下: http://sourceforge.net/projects/archive-crawler/files/archive-crawler%20%28heritrix%201.x%29/ 本執行個體所用的為Heritrix1.14.4的原始碼版本,即你只需下載一個檔案即可:heritrix-1.14.4-src.zip。
Time of Update: 2018-12-04
項目需要使用activemq 來做訊息匯流排,剛開始看了下activemq in action 字型是在不好看,草草看完了,就動手下了個實現sender和receiver ,一般實現了就OK了,但是我實現以後,他雖然正常接收訊息,但是不確認訊息,很奇怪,想想這麼牛XX的訊息中介軟體,這麼大的bug ,肯定不可能,然後就想著哪裡肯定搞錯了吧,結果繼續學習查資料,功夫不負有心人啊,給解決了。廢話不說了,開始吧。 首先 訊息發送這邊沒什麼好說的,可以查詢一些文檔,瞭解一些參數的設定。一會給出例子。
Time of Update: 2018-12-04
1 一個大的含有50MURL的記錄,一個小的含有500個URL記錄,找出他們兩個中相同的URL.答:對包含500個記錄的檔案建立一個hash_set,對500個資料進行hash,然後遍曆50M的檔案,每次取出一個記錄,對它進行同樣的hash,判斷是否在hash_set裡面,如果在的話,則輸出該URL,然後再hash_set裡面刪除(防止重複輸出同一個URL).通過建立一個hash表,大大縮減了遍曆的次數,每次比較的時候只需要進行hash,然後進行比較。
Time of Update: 2018-12-04
Cloudera CDH4安裝方法有三種:1、通過Cloudera Manager自動安裝(只支援64bit linux作業系統);2、通過資源套件,利用Yum命令手工安裝;3、通過下載的tarball包,手工安裝; 個人建議1、2兩種都嘗試,先2後1的方式對Hadoop的架構,內建的組件以及配置等會要一個比較清晰的瞭解。具體的安裝可以參考官方文檔(CDH4 Installation
Time of Update: 2018-12-04
使用 AppFuse 快速構建 J2EE 應用http://www.ibm.com/developerworks/cn/java/j-lo-appfuse/?ca=j-t10 AppFuse: Start Your J2EE Web Appshttp://today.java.net/pub/a/today/2004/07/15/thefuse.html(可下載appfuse的Archetypes,很奇怪在appfuse.org上沒找到)appfuse首頁:http://www.appfuse.
Time of Update: 2018-12-04
這整整一個月我們都在寫文當評審文檔,乾的挺沒勁的,但是裡邊確實有道道啊,其實說白了,還是工作不用心,學習不認真所導致。經過這段時間的編寫,和兩次的評審也得出了些結論:寫作技巧:1 UML圖中有明顯的錯誤。但是我畫圖的時候體會不到錯誤。這個需要學習2 措辭,不能太口語化了3 使用的專業名字,如果是英文的那麼就必須要一致,這裡的一致說的是,書寫上要一直,意思要需要一致,就算不一致也需要寫明理由。appid/Appid/APPID/appIDAppId4