有用到Office 檔案格式的朋友可以研究一下。 另外做共用軟體的朋友可以考慮格式轉換工具或者類庫。 我發現最近SourceForge 上有一個項目正在做這個事情: http://b2xtranslator.sourceforge.net ,不妨參考。
Office 檔案(doc, xls, ppt) 格式的官方網站: www.microsoft.com/interop/docs/OfficeBinaryFormats.mspx
Microsoft Word
Word 97-2007 Binary File Format (.doc) Specification PDF | XPS
Microsoft PowerPoint
PowerPoint 97-2007 Binary File Format (.ppt) Specification PDF | XPS
Microsoft Excel
Excel 97-2007 Binary File Format (.xls) Specification PDF | XPS
Excel 2007 Binary File Format (.xlsb) Specification PDF | XPS
Office Drawing
Office Drawing 97-2007 Binary Format Specification PDF | XPS
而且還有一些其他檔案的格式也一併公開了
Windows Compound Binary File Format Specification PDF | XPS
Windows Metafile Format (.wmf) Specification PDF | XPS
Ink Serialized Format (ISF) Specification PDF | XPS
另外,這裡有一片KB文章專門講如何從Office二進位檔案裡面提取資訊 《How to extract information from Office files by using Office file formats and schemas》 http://support.microsoft.com/kb/840817/en-us