掃描的圖片PDF轉換為txt

來源:互聯網
上載者:User

雖然pdf文檔在諾基亞E61上能看,不過,掃描的圖片的pdf縮放貌似不管用,放大1000%還是看不清楚。

以下是我嘗試把pdf轉換為txt的過程:

1,掃描的pdf不能直接用轉換工具轉換為txt的,必須OCR識別

2,把pdf列印為mdi檔案,用Microsoft Office Document Imaging開啟之後不能進行文字識別,掃描後的文字品質比較低,Microsoft Office Document Imaging根本無法識別。

3,CAJViewer識別,識別效果非常好,不過只能選中一段文字識別,如果是整個文檔另存新檔txt全部是亂碼。

4,我最後的解決方案是,用“PDF2JPG”工具把pdf轉換為jpg,然後使用“尚書七號OCR”識別圖片文字。(因為尚書七號OCR不能直接開啟pdf)。識別效果還可以接受,90%以上。

 

希望可能找到更好的解決方案。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.