ASP.net中將Word/Excel轉換成PDF

來源:互聯網
上載者:User
關鍵字 : Asp.net, word, Excel, PDF

參照網友的一篇文章(http://www.vuu.cn/vuu/vuu-a/4302.html)
---ASP.Net實現將Word轉換PDF格式 作者:佚名  來源:動態網站製作指南  時間:2006-3-28 前言:由於一個客戶的項目中需要將WORD文檔轉換成PDF格式,故寫了本篇實站教程

  需求分析:客戶的項目以B/S結構為主,提供一個WORD檔案在後台自動轉換成PDF,經過實際測試,如果該篇WORD文檔有100多頁的話,轉換需要20分鐘左右的時間(環境:CPU是奔騰M 1.6G,512M記憶體),整個CPU的佔用率近乎95%~100%,此結果告訴客戶以後,客戶提議:到客戶下班後,自動轉換PDF,同時如果使用人確認要查看該PDF文檔,如果沒有轉換,提供給客戶選擇,是現在轉換成PDF,還是由伺服器在客戶下班後,自動轉換。

  項目功能:按需求分析要寫兩個功能

  第一為:B/S結構後台轉換,要提交給客戶選擇

  第二為:Windows服務自動轉換WORD文檔到PDF

  這兩個分類:核心的轉換程式都是採用線程的方式執行,只不過第一個功能是針對一個WORD檔案,第二個功能針對所有未轉換的WORD文檔.

  分析到現在:我們開始實戰轉換了!

  一:必備工具

  安裝必須的工具MS VS.Net2003,MS Office2003,Adobe Acrobat 7.0 Professional,postscript.exe,gs811w32.exe

  MS VS.Net2003的安裝不說明

  MS Office2003的安裝不說明

  Adobe Acrobat 7.0 Professional安裝說明

  運行setup.exe檔案,出現輸入序號,就運行註冊機,用滑鼠在第一行刷下就可以看見序號,複製粘貼到Adobe Acrobat 7.0 Professional安裝程式對話方塊,安裝到最後出現註冊時,點擊PHONE...將安裝程式中顯示的第二行序號(第一行是剛才註冊機產生的序號)複製粘貼到註冊機的第二行,點擊右邊的按鈕,再用滑鼠刷第三行授權號就出來了,將其複製粘貼到安裝程式的最後一行,完成安裝註冊!

  postscript.exe預設安裝就可以了,它是一個PDF轉換時所需要的指令碼

  gs811w32.exe預設安裝就可以,它其實是個PDF虛擬印表機的驅動

  二:配置虛擬印表機

  進入Windows的控制台,進入印表機,點擊"添加印表機"表徵圖.在安裝對話方塊上"按一步",出現選擇印表機時,在製造商一欄中選擇"Generic",在印表機一欄中,選擇"MS Publisher Color Printer",然後一路按下一步,知道安裝結束.

  三:開始寫第一個程式(指令碼程式)

  為什麼要使用指令碼程式進行轉換呢,其實實際測試過程中,使用PDF Distiller的對象引用到C#後,轉換成功,但整個PDF Distiller對象不能釋放,第二次再轉換時,就發生了錯誤,故此處使用指令碼程式實現轉換.這樣我們只要在C#的程式中呼叫指令碼程式就可以實現WORD到PDF的轉換。

  宿主指令檔名:ConvertDoc2PDF.js

  指令檔內容:

var files = WScript.Arguments;
var fso = new ActiveXObject("Scripting.FileSystemObject");
var word = new ActiveXObject("Word.Application");
var PDF = new ActiveXObject("PDFDistiller.PDFDistiller.1");
word.ActivePrinter = "MS Publisher Color Printer";

//files(0) 為WORD文檔檔案名稱
//files(1) 為,轉換後需要儲存的路徑
//調用fso.GetBaseName(files(0))後,為無路徑,無副檔名,的檔案名稱
//files.length為檔案參數的個數,使用迴圈可以支援多個WORD文檔的轉換

var docfile = files(0);
var psfile = files(1) + fso.GetBaseName(files(0)) + ".ps";
var pdffile = files(1) + fso.GetBaseName(files(0)) + ".pdf";
var logfile = files(1) + fso.GetBaseName(files(0)) + ".log";

try{
var doc = word.Documents.Open(docfile);
//WORD檔案轉成PS檔案;
word.PrintOut(false, false, 0, psfile);
doc.Close(0);

//PS檔案轉成PDF檔案;
PDF.FileToPDF(psfile,pdffile,"");

fso.GetFile(psfile).Delete();//刪除PS指令檔
fso.GetFile(logfile).Delete();//刪除轉換的記錄檔

word.Quit();
WScript.Echo("isuccess");//成功
WScript.Quit(0);
}
catch(x)
{
word.Quit();
WScript.Echo("isfail");//失敗
WScript.Quit(0);
}

  然後測試該指令碼程式

  啟動MS-DOS,輸入如下命令:

c:\>cscript //nologo c:\ConvertDoc2PDF.js c:\test.doc c:\

  說明:

  運行成功後將看到test.pdf文檔了

  c:\test.doc參數對應的是指令碼程式中的files(0)

  c:\參數對應的是指令碼程式中的files(1)

  你可以安照該指令碼改寫成,支援多個參數,使用FOR迴圈,一次轉換多個WORD文檔,此處沒有使用多個檔案轉換功能,是考慮到,該段指令碼放在C#的線程中執行,這樣一來也可以轉換多個WORD文檔.

  四:使用C#調用ConvertDoc2PDF.js指令碼

  建立一個C#的WINDOWS應用程式,添加一個按鈕button1

  添加一個函數,函數名StartConvertPDF

public void StartConvertPDF()
{
 Process proc = new Process();
 proc.StartInfo.FileName = "cmd.exe";
 proc.StartInfo.WorkingDirectory = @"c:\";
 proc.StartInfo.CreateNoWindow = true;
 proc.StartInfo.UseShellExecute = false;
 proc.StartInfo.RedirectStandardInput = true; //輸入重新導向

 proc.Start();
 proc.StandardInput.WriteLine(@"cscript //nologo c:\ConvertDoc2PDF.js c:\test.doc c:\");
 proc.StandardInput.WriteLine("exit");
 proc.WaitForExit();
}

  然後在按鈕的CLICK事件中添加調用線程的代碼

private void button1_Click(object sender, System.EventArgs e)
{
//定義線程式
Thread thConvert = new Thread(new ThreadStart(StartConvertData));
thConvert.Start();
}

  注意:在測試上面的C#程式時,必須添加如下命名空間

using System.Diagnostics;
using System.Threading;

  五:健壯的C#調用代碼(實際考慮,可放在B/S系統中)

  完成第4步的C#測試後,細心的讀者,可能看到一點問題,那就是如何得到指令碼運行後輸出的結果,如何給線程中調用的StartConvertData方法傳遞參數

  1:傳遞參數,此話說來也可用一篇教程告訴大家線程中方法如何來傳遞參數,現在就講一個方案,此種方案很多,我採用一個類,初始化這個類,然後調用該類的方法作為線程執行的方法

  2:得到指令碼的輸出結果,使用Process對象的輸出重新導向,就是說改變輸出方向,使指令碼不輸出到控制台(MS-DOS視窗),而是重新導向輸出到C#程式中,並採用線程的非同步回調方法,顯示指令碼運行結果。

  添加一個新類,類名為ToPdf

using System;
using System.Diagnostics;
using System.ComponentModel;
using System.Windows.Forms;
using System.Data;

namespace Doc2Pdf
{
public class ToPdf
{
private string strWord = "";//此處的WORD檔案不含路徑
private string sPath = "";
public string sExecResult = "";
public bool bSuccess = false;

public ToPdf(string sParamWord,string sParamPath)
{
strWord = sParamWord;
sPath = sParamPath;
}

public void StartConvertPDF()
{
Process proc = new Process();
   proc.StartInfo.FileName = "cmd.exe";
   proc.StartInfo.WorkingDirectory = sPath;
   proc.StartInfo.CreateNoWindow = true;
   proc.StartInfo.UseShellExecute = false;
   proc.StartInfo.RedirectStandardInput = true;//標準輸入重新導向
proc.StartInfo.RedirectStandardOutput = true;//標準輸出重新導向

   proc.Start();
proc.StandardInput.WriteLine("cscript //nologo "+sPath+"ConvertDoc2PDF.js "+sPath+strWord+ " "+sPath);
proc.StandardInput.WriteLine("exit");
sExecResult = proc.StandardOutput.ReadToEnd();//返回指令碼執行的結果
proc.WaitForExit();
proc.Close();

}

public void EndConvertPDF(System.IAsyncResult ar)//ar參數必須寫,是線程執行完成後的回呼函數
{
if(sExecResult.IndexOf("isuccess")!=-1)bSuccess=true;
else if(sExecResult.IndexOf("isfail")!=-1)bSuccess=false;
//如果放在B/S系統,你可以在此處寫資料庫,是成功還是失敗,並用一個WEBService程式不斷檢查資料庫,此WEBService程式不放在該回調用函數中
//如果放在C/S系統,回呼函數可以不放在類中,以便在表單程式中調用結果
}
}
}

  改寫原來的button1_Click事件中的代碼

private void button1_Click(object sender, System.EventArgs e)
{
ToPdf my2Pdf = new ToPdf("test.doc","c:\\");
ThreadStart thStartConvert = new ThreadStart(my2Pdf.StartConvertPDF); //開始非同步呼叫線程
thStartConvert.BeginInvoke(new AsyncCallback(my2Pdf.EndConvertPDF),null);//設定非同步線程的回呼函數

//如果需要轉換多個WORD,你可以用迴圈
//如果是B/S系統,可以將本段代碼放在ASPX中,並結合用戶端的無重新整理顯示資料的技術,不斷訪問WEBService程式,以確定PDF是否轉換成功或失敗
}

  六:編寫更加健壯的C#調用代碼(實際考慮,可放在WINDOWS的服務程式中)

  實際使用時,由於轉化PDF時CPU的佔用率很高,考慮只在同一時間轉換一篇WORD文檔,放棄非同步線程的回呼函數的使用,考慮一個WINDOWS的服務程式。

  寫一個函數CheckData2Convert(),不斷的檢查沒有轉換的WORD文檔,並使用迴圈調用ToPdf類中執行轉換方法StartConvertPDF

//以下給出,泛代碼,使用者按照自己的需求,填寫完整即可
//bool bStart為全域變數,控制迴圈的進入與退出
//例:18:30開始檢查並轉換,那麼18:30時,bStart=true;並啟動轉換線程
//6:30停止轉換線程,bStart=fasle;

private void CheckData2Convert()
{
//檢查指定目錄下的沒有轉換的WORD文檔,你同樣可以檢查資料庫中記錄的沒有轉換的WORD文檔
string sPath = System.Threading.Thread.GetDomain().BaseDirectory; //當前的路徑
while(bStart)
{
int iFileCount = CheckWord(); //CheckWord為一個方法,檢查當前沒有轉換的WORD文檔,返回沒有轉換的檔案數,該方法的代碼由讀者自己編寫
for(int i=0;i<iFileCount;i++)
{
string sWord = GetWordFileName(i) //GetWordFileName為一個方法,返回一個不帶路徑的WORD檔案名稱,該方法的代碼由讀者自己編寫
//ToPdf類中的StartConvertPDF()方法使用的是不帶路徑的WORD檔案名稱
ToPdf my2Pdf = new ToPdf(sWord ,sPath);
my2Pdf.StartConvertPDF();

if(my2Pdf.sExecResult.IndexOf("isuccess")!=-1)
{
//成功,寫日誌,或回寫資料庫
}
else if(my2Pdf.sExecResult.IndexOf("isfail")!=-1)
{
//失敗,寫日誌,或回寫資料庫
}

}

if(!bStart)break;
Thread.Sleep(1000);
}
}

  然後在服務的開始事件中,啟動線程

protected override void OnStart(string[] args)
{
//可以使用一個開始定時器,檢查是否到開始時間,時間一到,就開始執行線程,此處的開始執行線程可以放在開始定時事件中
//可以使用一個結束定時器,檢查是否到結束時間,時間一到,就結束線程,結束線程的代碼可以放在結束定時事件中
//注意:應該使用組件中的定時器,而不是Windows的FORMS中的定時器
//該定時器的類名為System.Timers.Timer,千萬別搞錯,不然執行不會正常的
bStart = true;
Thread thConvert = new Thread(new ThreadStart(StartConvertData));
thConvert.Start();
}

  然後在服務的結束事件中,設定停止線程的標識bStart= false

protected override void OnStop()
{
bStart = false;
//為何次處不停止線程呢,因為考慮到,現線上程正在轉換WORD文檔,但沒有結束,所以只設定停止標識,轉換完成後,線程也執行結束了.
}

  結束語:

  Adobe Acrobat 7.0 Professional,postscript.exe,gs811w32.exe這三個檔案可以在itbaby.jss.cn下載,都包含在同一個RAR的壓縮檔中了。

   itbaby.jss.cn是動態網域名稱,主機在作者家裡,如果網站不能訪問,說明電腦沒有開,請稍後幾天再試。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.