Java使用Apache POI庫讀取Excel表格文檔的樣本_java

來源:互聯網
上載者:User

Apache POI 是用Java編寫的免費開源的跨平台的 Java API,Apache POI提供API給Java程式對Microsoft Office格式檔案讀和寫的功能。
項目下載頁:http://poi.apache.org/download.html

Apache POI 是建立和維護操作各種符合Office Open XML(OOXML)標準和微軟的OLE 2複合文檔格式(OLE2)的Java API。用它可以使用Java讀取和建立,修改MS Excel檔案.而且,還可以使用Java讀取和建立MS Word和MSPowerPoint檔案。Apache POI 提供Java操作Excel解決方案。

  • HSSF - 提供讀寫Microsoft Excel XLS格式檔案的功能。
  • XSSF - 提供讀寫Microsoft Excel OOXML XLSX格式檔案的功能。
  • HWPF - 提供讀寫Microsoft Word DOC格式檔案的功能。
  • HSLF - 提供讀寫Microsoft PowerPoint格式檔案的功能。
  • HDGF - 提供讀Microsoft Visio格式檔案的功能。
  • HPBF - 提供讀Microsoft Publisher格式檔案的功能。
  • HSMF - 提供讀Microsoft Outlook格式檔案的功能。

讀取Excel文檔樣本
我們使用POI中的HSSFWorkbook來讀取Excel資料。

public void test(File file) throws IOException {     InputStream inp = new FileInputStream(file);     HSSFWorkbook workbook = new HSSFWorkbook(inp);          // workbook...遍曆操作   } 

上邊代碼,讀取Excel2003(xls)的檔案沒問題,但是一旦讀取的是Excel2007(xlsx)的檔案,就會報異常:“The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF)”
查閱了資料,Excel2007版本的Excel檔案需要使用XSSFWorkbook來讀取,如下:

public void test(File file) throws IOException {     InputStream inp = new FileInputStream(file);     XSSFWorkbook workbook = new XSSFWorkbook(inp);          // workbook...遍曆操作   } 

注意:XSSFWorkbook需要額外匯入poi-ooxml-3.9-sources.jar和poi-ooxml-schemas-3.9.jar。
這樣,Excel2007的匯入沒問題了,但是匯入Excel2003又報異常。

所以,在匯入Excel的時候,盡量能判斷匯入Excel的版本,調用不同的方法。
我想到過使用檔案尾碼名來判斷類型,但是如果有人將xlsx的尾碼改為xls時,如果使用xlsx的函數來讀取,結果是報錯;雖然尾碼名對了,但是檔案內容編碼等都不對。
最後,推薦使用poi-ooxml中的WorkbookFactory.create(inputStream)來建立Workbook,因為HSSFWorkbook和XSSFWorkbook都實現了Workbook介面。代碼如下:

Workbook wb = WorkbookFactory.create(is); 

可想而知,在WorkbookFactory.create()函數中,肯定有做過對檔案類型的判斷,一起來看一下源碼是如何判斷的:

/**    * Creates the appropriate HSSFWorkbook / XSSFWorkbook from    * the given InputStream.    * Your input stream MUST either support mark/reset, or    * be wrapped as a {@link PushbackInputStream}!    */   public static Workbook create(InputStream inp) throws IOException, InvalidFormatException {     // If clearly doesn't do mark/reset, wrap up     if(! inp.markSupported()) {       inp = new PushbackInputStream(inp, 8);     }          if(POIFSFileSystem.hasPOIFSHeader(inp)) {       return new HSSFWorkbook(inp);     }     if(POIXMLDocument.hasOOXMLHeader(inp)) {       return new XSSFWorkbook(OPCPackage.open(inp));     }     throw new IllegalArgumentException("Your InputStream was neither an OLE2 stream, nor an OOXML stream");   } 

可以看到,有根據檔案類型來分別建立合適的Workbook對象。是根據檔案的頭部資訊去比對進行判斷的,此時,就算改了尾碼名,還是一樣通不過。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.