標籤:linux 翻譯
近來在學習linux跟shell指令碼。英文又多年不用還給教師了。遇到不懂的單詞都要開個詞霸網頁詞典來翻譯,久了多有不爽。偶然找到http://www.iteye.com/topic/819440中提到一個翻譯英文單詞的shell指令碼,可惜是多年以前的,並且用的還是如今被牆的Google,當然失效了。
translate() { wget -qO- "http://ajax.googleapis.com/ajax/services/language/translate?v=1.0&q=$1&langpair=${2:-en}|${3:-zh}" | sed -E -n ‘s/[[:alnum:]": {}]+"translatedText":"([^"]+)".*/\1/p‘; return 0; }
為了方便自己學習和練手,修改成金山詞典的。苦於半桶水的水平,反覆用了好些管道和sed進行過濾和排版,最後勉強可用。寫出來交流交流,讓各路高手給小弟指正一下:
translate() { echo echo "${1}:" wget -qO- "http://www.iciba.com/$1"| sed -n ‘/"prons"/,/"net_paraphrase"/p‘| sed -e ‘s/<[^>]*>//g‘ -e ‘s/[[:space:]]//g‘| tr -d ‘\n‘| sed -e ‘s/]/]\t/‘ -e ‘s/[a-z]*\./\n&/g‘ echo echo return 0; }
把這段函數放到~/.bashrc裡面,重開一個終端就可以用了:
$ translate computercomputer:英[kmpju:t(r)] 美[kmpjut]n.(電子)電腦,電腦$
這個地方自己一直不是很滿意,感覺總有更簡潔的方法來實現:
sed -n ‘/"prons"/,/"net_paraphrase"/p‘ //定位需要的代碼塊,我選擇從讀音到簡單詞義部分sed -e ‘s/<[^>]*>//g‘ -e ‘s/[[:space:]]//g‘ //刪除所有<...>的HTML標記和空格tr -d ‘\n‘ //刪除所有換行,把文字都排成一行sed -e ‘s/]/]\t/‘ -e ‘s/[a-z]*\./\n&/g‘ //音標之間加TAB,詞性前加換行
本文出自 “willron學習筆記” 部落格,請務必保留此出處http://willron.blog.51cto.com/4871077/1574834
shell指令碼——翻譯英文單詞