第一章
P17 最後一行 page analyse翻譯成“頁面分析技術”更為妥當。
P22 全文檢索索引的簡寫應該是FTR。 P19 倒數第2段,兩個連續的“的”。
-------貢獻人 zhujt198108 2009-06-25
第二章
P31第二段,每個字元的機率應該是1/768079的1/46,書中為1/4是錯誤的。
-------貢獻人 Raymond.He 2009-06-26 P80 第三行 "是數對(4,6)",正確應該是(4,b) P80 倒數第二段 "在此例中,編碼短語bab時,前面兩個字元(bab)" 應該是(ba) -------貢獻人 Raymond.He 2009-07-01
P62 第3段第4行
譯文:在這種情況下,需要使用6個算術編碼步驟。這看上去很多,實際上很少。
較好的翻譯應該是:這看上去很多,但這種情況發生的機率很小。
in this case, six arithmetic encoding stpes would be required. This may seem extreme,but actually it is very rare-during the early parts of the text, while the model is still learning, it is unlikely that fifth-order contexts will be repeated,and once...
--------貢獻人 尚家興 2010-8-27
P62 第3段第5行
譯文:在處理文本的前面部分時,模型仍然在學習階段。五階上下文重複出現的機率很低,當建模由速度決定時,不太可能需要低階上下文。
較好的翻譯應該是:在處理文本的前面部分是,模型仍然在學習階段,五階上下文重複出現的機率很低(因此需要低階上下文),當演算法進行到一定程度時(步入正軌),就太可能需要低階上下文了。(因此作者後面才得出結論這種演算法比單純的0階演算法只稍慢一些)。
--------貢獻人 尚家興 2010-8-27
第三章 P114 第二段第一個字"為",應該是“未”。
P114 21的譯者注:最後"表示索引胡壓縮" ,“胡”應改為“的”
P117 最後一段 "表3-5中的第二列"應該是"表3-6中的第二列"
P118 第三段末尾,這樣合起來就是9個碼字,應該是7個碼字。 -------貢獻人 Raymond.He 2009-07-01第五章 P249,line 1, 每一列表示一個單詞,每一行表示一個文檔,每一列表示一個單詞 “每一列表示一個單詞”第二個為重複,直接去掉。 -------貢獻人 李波 2010-06-07 第六章 P317頁倒數第二段More Probable Symbol應翻譯成“大機率符號”;Less Probable Symbo應翻譯成“小機率符號”。 -------貢獻人 zhangf888 2009-06-26