淺談Java讀取Csv實踐

來源:互聯網
上載者:User

標籤:val   final   資料庫   直接   com   基礎   amp   資訊   沒有   

  看項目中以前的處理方式是直接用用java IO類庫讀取Csv檔案,實際處理中發現Csv檔案本身包含了對各種特殊字元的處理資訊。

  最常見的比如:

  1. 對包含特殊字元的字串資料首尾加雙引號

  2. 對資料中的單個雙引號前加單個雙引號

  其它...

  所以用Java IO讀到的字串全是經過處理後的字串,在某些情境下是不符合預期需求的。比如我需要的是不做任何處理的原始內容。

  項目中另一種常見的檔案格式Excel用了POI來處理,但是POI不支援Csv格式,於是找到了javacsv。

  代碼很簡單:

  Java代碼

  public List importCsv(String file) {

  List list = new ArrayList();

  CsvReader reader = null;

  try {

  //初始化CsvReader並指定資料行分隔符號和字元編碼

  reader = new CsvReader(file, ‘,‘, Charset.forName("GBK"));

  while (reader.readRecord()) {

  //讀取每行資料以數組形式返回

  String[] str = reader.getValues();

  if (str != null && str.length > 0) {

  if (str[0] != null && !"".equals(str[0].trim())) {

  list.add(str);

  }

  }

  }

  } catch (FileNotFoundException e) {

  log.error("Error reading csv file.",e);

  } catch (IOException e) {

  log.error("",e);

  }

  finally{

  if(reader != null)

  //關閉CsvReader

  reader.close();

  }

  return list;

  }

  以上代碼有幾個要點:

  1 初始化CsvReader時指定分隔字元和字元編碼,如果不指定,預設分別為逗號和ISO-8859-1,我用了GBK,具體使用時要看當時的字元編碼而定。

  2 讀取每行資料,返回字串數組,數組內的順序即檔案資料列的順序

  3 最後記得關閉CsvReader

  是不是很簡單,返回的數組格式也正好是我想要的,而且拿到是原始的資料,沒有經過特殊字元處理。

  有些童鞋質疑特殊字元未經處理,插到資料庫會出錯,其實大可不必我們手工處理,一些基礎組件比如JDBC的preparedstatement已經包含了對特殊字元的處理,我們只要以綁定參數的形式來傳送這些包含特殊字元的資料就可以。常用的持久化架構底層也封裝了JDBC,自然也對特殊字元做了處理。

  如有不懂的朋友可以加我Q,或者加群號來一起學習,大家一起學習編程分享視頻,希望能協助喜歡JAVA的朋友。有需要協助的可以聯絡我。

淺談Java讀取Csv實踐

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.