求一個Regex

來源:互聯網
上載者:User
將下面的文字分割成5段

1、其他文字2、3.879(其他文字中包括小數)3.123加4、加其他(其他文字中包括數字和頓號)4、(其他文字為空白)5.其他文字
(數字開頭後面跟著頓號和點符號)1、其他文字2、3.879(其他文字中包括小數)3.123加4、加其他(其他文字中包括數字和頓號)4、(其他文字為空白)5.其他文字

如果不用正則,PHP下有其他解決辦法嗎?

回複內容:

將下面的文字分割成5段

1、其他文字2、3.879(其他文字中包括小數)3.123加4、加其他(其他文字中包括數字和頓號)4、(其他文字為空白)5.其他文字
(數字開頭後面跟著頓號和點符號)1、其他文字2、3.879(其他文字中包括小數)3.123加4、加其他(其他文字中包括數字和頓號)4、(其他文字為空白)5.其他文字

如果不用正則,PHP下有其他解決辦法嗎?

是指這個特例還是指普遍情況?
如果是普遍情況的話,不可能在不解讀文字語義的情況下靠純正則實現。
正則需要足夠的約定條件來明確,比如說,是否每個行號後面的標點符號都按你上面的例子一樣,1、2、4後面就是頓號,3、5後面就是點號?

暫時先按照你這個特例來弄一個來玩玩。(其他文字為空白)這部分我先當作刪掉處理了……

$t="1、其他文字2、3.879(其他文字中包括小數3.154)3.123加4、加其他(其他文字中包括數字和頓號)4、5.其他文字";$re='~1、[^\d]+|2、[^、]+(?=3\.)|3\..+(?=4、)|4、.*(?=5.)|5\..*~x';if (preg_match_all($re, $t, $tokens, PREG_PATTERN_ORDER)) {foreach ($tokens[0] as $w) {echo "
".$w."
";}}

說實話我覺得用簡單正則(數字、點號、頓號、其他四種情況)把整段話拆散,依次讀入並逐步按邏輯規則歸檔的方式來做(類似於readline的形式逐行讀取)最明確,適用面也是最廣的,因為這樣至少有完善的緩衝回退機制(例如讀到2、時即可輸出1、,後再次讀到下一個頓號時可以回退到上一個3.輸出,讀到最後一個.後回退到上一個4、輸出)。正則的非捕捉匹配在複雜情況下實在不是太給力啊……

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.