多維拼音IME – Davepy V1.0 Beta

來源:互聯網
上載者:User

多維拼音IME

Davepy

戴維作品

 
 
多維拼音IME Davepy V1.0 Beta 簡體中文版
姓  名: 多維拼音IME (Davepy)
綽  號: 書生 (Beta版本)
修鍊等級: 1 (1.0版本)
獨門絕技: 智能提示,音形混合輸入
擅長功夫: 強大流暢的整句輸入,發達的智能記憶與自學習機制
更新時間: 2007-1-1 00:00:00
聯絡作者 davepy@hotmail.com
官方部落格: http://davepy.spaces.live.com

多維拼音IME秀才版將延遲到2007.6.1號發布!

  [部落格通提供的高速下載]  

Sourceforge下載    天空下載    華軍下載

 軟體介紹

    
   我的目標是專註於IME中的自然語言處理技術,構建新一代智能IME。

    多維拼音IME(DAVEPY)通過構建特有的統計語言模型來達到拼音整句轉化以及個人化自學習功能,是一種基於整句的智能型的拼音IME,採用拼音並輔助字形作為漢字的錄入方式,使用者不需要經過專門的學習和培訓,就可以方便使用並熟練掌握這種漢字輸入技術。
    多維拼音IME採用基於語句的整句轉換方式,使用者連續輸入整句話的拼音,不必人工分詞、挑選候選詞語,這樣既保證了使用者的思維流暢,又大大提高了輸入的效率。多維拼音IME採用主動式辭典更新方法,通過跟蹤使用者的輸入習慣來訓練演算法,並發現“新詞”, 從而使得IME更加貼近使用者的個人化需求。
    多維拼音IME還為使用者提供了許多特性,比如拼音字形結合輸入,從而大大提高難檢字或者生僻字的輸入精度和速度。即使面對不會拼音或者拼音記憶不完整的字詞也能很快輸入。這些特性都將在正式版中得以展現,由於個人精力和時間上的限制,測試版只專註於核心技術的體現。
    Window下的多維IME系統將只專註於構建最合適的語言模型,以盡量小的資源消耗來完成流暢的漢字輸入這一項任務。多維拼音IME不久後會開發專門Linux網路版本,網路IME將會增加更多中文處理技術,使其不在局限於簡單文字輸入,而是更像提供自然語言處理服務,更接近一個智能人機互動介面。
    DAVEPY主要通過sourceforge進行發布,最初的目標也是要構建一個合適規模的開源項目,在DAVEPY達到相對穩定和完善的版本後將會公開原始碼。多維IMELinux網路版正在籌劃中,作為自然語言處理愛好者和程式迷,我期待和更多有共同愛好的朋友一起探討,以期開發出高品質的自然語言處理產品。有關項目的籌划進度請關注多維IME官方部落格。

致謝:多維拼音IME本來只是我在業餘時間寫點東西聊以自娛而已,後來在朋友們鼓勵和勸說下終於利用空閑時間一點點地把東西寫了出來,並得以一幫朋友的測試和產品策劃,才有了今天比較長遠的計劃,在此對我的這些好友們表示衷心感謝!

 功能特色

作為研究型的產品,多維拼音IME將專註於:

  • 更精準的語言模型,以不斷提高使用者體驗
  • 更強大的自學習功能,以實現軟體個人化

除了上述兩項特性外,正式版將加入一些具有專利技術的輔助輸入方式以及涉及自然語言處理的有趣技術:

  • 拼音字形結合輸入
  • 智能提示與建議
  • 拼音以及英文單詞錯誤修正

另外,多維拼音IME也具有一些常見的小工具:

  • 簡拼輸入
  • 模糊拼音輸入
  • 軟鍵盤
  • 線上使用者自造詞
  • 使用者自造詞工具

 使用說明

基本說明:
DAVEPY主要展示兩大功能:一是整句輸入功能(當然也可以逐詞輸入),一是個人化自學習功能。對於整句輸入而言,使用者的輸入方式如果越接近一次輸入一個句子的行為,那麼拼音流轉化為漢語句子的精度就越高。多維拼音IME具有很強自學習功能,不僅可以學慣用戶用字,用詞,還能學慣用戶造句方式,隨著使用者使用時間的增長,整個IME系統會越來越接近使用者輸入習慣,從而達到更加流暢和高效的輸入。

安裝說明:
DAVEPY所需的辭典將通過特定的訓練程式定期在大規模語料中訓練擷取,新的辭典等資料會連同IME新版本一起發布。如果系統中已經安裝了DAVEPY,再次運行安裝程式時程式會提示是否覆蓋已有版本,如果選擇了“是”,安裝程式會自動覆蓋掉以前安裝的所有資料,並保留使用者個人化資料,這樣既可以保證新的安裝不會帶來任何垃圾檔案,也不會影響使用者以前自訂的資料。使用者也可以在安裝程式中選擇只更新辭典,IME整合軟體工具可以將目前使用者的辭典和新的辭典進行合并,在保留使用者個人化資料的同時更新資料。

基本用法:
空格”鍵:鍵輸入漢字;
“斷行符號”鍵:鍵輸入拼音字母;
“←”,“→”鍵:左右方向鍵移動前後游標,主要用於插入或者刪除拼音字母;
“↑”,“↓”鍵:上下方向鍵用於每次以一個音節跨度前後移動游標,游標移動的同時會顯示當前音節對應的候選詞語,主要是用來 調整整句輸入中自動計算錯誤某些詞,這個手動編輯過程同時也會調動系統的學習程式加以學習;
“PgUp”,“PgDn”鍵:上下翻頁鍵用來對當前候選詞語進行翻頁。

有用技巧:
1. “Ctrl+S”鍵:按Ctrl加S鍵在搜尋引擎中搜尋當前拼音對應的中文詞語,彈出IE瀏覽器顯示搜尋結果,預設搜尋引擎為Google。
2. “Tab”鍵:對於因使用者手動選擇而形成的“新詞”,當使用者再次輸入此新詞的前面部分漢字時,系統會以反白的方式自動補全其它部分,此時當使用者按“Tab”鍵的時候就會輸入整個新詞。如,如果系統已經學習到了一個新詞“Google搜尋”,那麼當使用者輸入“穀”的時候,系統會自動在“穀”後面以反白方式顯示“歌搜尋”。

您的反饋意見是我持續改進多維IME系統的動力,您可以通過多維IMEMSN:davepy@hotmail.com 與我聯絡,也可以在多維IME官方部落格上留言:http://davepy.spaces.live.com/ 。當然,如果你是我的朋友,你肯定知道更便捷的方式可以聯絡到我:)。

 已知問題

1. 在firefox中不能游標跟隨。(未修複)

註:這裡的“已修複”和“未修複”是指對當前下載的版本而言。

 Copyright@2006-2007 戴維 All Rights Reserved

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.