將下面的文字分割成5段
1、其他文字2、3.879(其他文字中包括小數)3.123加4、加其他(其他文字中包括數字和頓號)4、(其他文字為空白)5.其他文字
(數字開頭後面跟著頓號和點符號)1、其他文字2、3.879(其他文字中包括小數)3.123加4、加其他(其他文字中包括數字和頓號)4、(其他文字為空白)5.其他文字
如果不用正則,PHP下有其他解決辦法嗎?
回複內容:
將下面的文字分割成5段
1、其他文字2、3.879(其他文字中包括小數)3.123加4、加其他(其他文字中包括數字和頓號)4、(其他文字為空白)5.其他文字
(數字開頭後面跟著頓號和點符號)1、其他文字2、3.879(其他文字中包括小數)3.123加4、加其他(其他文字中包括數字和頓號)4、(其他文字為空白)5.其他文字
如果不用正則,PHP下有其他解決辦法嗎?
是指這個特例還是指普遍情況?
如果是普遍情況的話,不可能在不解讀文字語義的情況下靠純正則實現。
正則需要足夠的約定條件來明確,比如說,是否每個行號後面的標點符號都按你上面的例子一樣,1、2、4後面就是頓號,3、5後面就是點號?
暫時先按照你這個特例來弄一個來玩玩。(其他文字為空白)這部分我先當作刪掉處理了……
$t="1、其他文字2、3.879(其他文字中包括小數3.154)3.123加4、加其他(其他文字中包括數字和頓號)4、5.其他文字";$re='~1、[^\d]+|2、[^、]+(?=3\.)|3\..+(?=4、)|4、.*(?=5.)|5\..*~x';if (preg_match_all($re, $t, $tokens, PREG_PATTERN_ORDER)) {foreach ($tokens[0] as $w) {echo "
".$w."
";}}
說實話我覺得用簡單正則(數字、點號、頓號、其他四種情況)把整段話拆散,依次讀入並逐步按邏輯規則歸檔的方式來做(類似於readline的形式逐行讀取)最明確,適用面也是最廣的,因為這樣至少有完善的緩衝回退機制(例如讀到2、時即可輸出1、,後再次讀到下一個頓號時可以回退到上一個3.輸出,讀到最後一個.後回退到上一個4、輸出)。正則的非捕捉匹配在複雜情況下實在不是太給力啊……