標籤:
如何用.net(c#)讀取epub格式檔案
epub格式是印刷出版界常見的格式,本格式遵循XML原則把網頁進行壓縮打包。
如何用c#讀取epub格式檔案是個頭疼的問題,本人搜遍各大網站,發現介紹都語焉不詳。
因項目中要用的此功能,特做案例整理如下,僅供參考。
// 動態庫 https://epubreader.codeplex.com/,添加引用eBdb.EpubReader.dll
// 頭部增加引用
using eBdb.EpubReader;
string fullfile = @"E:\佛學資料\EPUB\般若秒瓶.epub" ;
Epub epub = new Epub(@fullfile);
//Get book title (Every epub file can have multiple titles)
// 擷取epub文章標題
string title = epub.Title[0];
//Get book authors (Every epub file can have multiple authors)
// 擷取作者
string author = epub.Creator[0];
//Get all book content as plain text
// 以純文字格式擷取圖書內容
string plainText = epub.GetContentAsPlainText();
//Get all book content as html text
// 以html 格式擷取圖書內容
string htmlText = epub.GetContentAsHtml();
//Get Table Of Contents (TOC)
// 擷取目錄
List<NavPoint> navPoints = epub.TOC;
//擷取目錄數量
int cnt = navPoints.Count;
//擷取目錄序號
int j=1;
// 擷取目錄標題
string contenttitle = navPoints[j].Title.ToString();
// 擷取子目錄標題(假設有子目錄)
string childtitle = navPoints[j].Children[0].Title.ToString();
//Get some part of book content
// 獲得部分文章章節,序號是把大小目錄在一起排序的
/*
一、解義慧劍釋 0
* 1、第一課 1
* 2、第二課 2
*/
ContentData contentData = epub.Content[j] as ContentData;
//擷取目錄內容(預設只取第一級目錄)
// 擷取文本格式內容
string content_plaintext =
navPoints[j].ContentData.GetContentAsPlainText().ToString();
//擷取HTML格式內容
string content_html =
navPoints[j].ContentData.Content.ToString();
如何用.net c# 讀取epub格式檔案