在利用php解析xml時提示Invalid byte 1 of 1-byte UTF-8 sequence錯誤了,這個問題我百度查實說是編碼問題,結果我把編碼處理一下果然KO了,下面我來分享一下解決辦法。
錯誤提示
Invalid byte 1 of 1-byte UTF-8 sequence
原因分析
在中文版的window下java的預設的編碼為GBK,也就是所雖然我們標識了要將xml儲存為utf-8格式但實際上檔案是以GBK格式來儲存的,所以這也就是為什麼能夠我們使用GBK、GB2312編碼來產生xml檔案能正確的被解析,而以UTF-8格式產生的檔案不能被xml解析器所解析的原因。
把xml的encoding屬性值UTF-8改為UTF8
org.xml.sax.SAXParseException: Content is not allowed in trailing section
把先要解析和字串trim()一下即可解決問題。
解決:
1、最簡單就是把改成
2、或者把xml開啟另存的時候把字元集改為UTF-8後儲存
或改程式
代碼如下 |
複製代碼 |
SAXReader reader = new SAXReader(); org.dom4j.Document document = reader.read("D:\ha.xml"); OutputFormat of = new OutputFormat(); of.setEncoding("UTF-8"); //改變編碼方式 XMLWriter writer = new XMLWriter(new FileWriter "d:\dom4j.xml"), of); |
我使用的是eclipse編輯器如下操作即可
可以在Eclipse中更改,在 eclipse 的功能表 [Project]→[Properties],?? [Resources],在右?的「Text file encoding」,把原?硎竅到y??的??,改? 「UTF-8」。
http://www.bkjia.com/PHPjc/633192.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/633192.htmlTechArticle在利用php解析xml時提示Invalid byte 1 of 1-byte UTF-8 sequence錯誤了,這個問題我百度查實說是編碼問題,結果我把編碼處理一下果然KO了,下面我來...