php實現html標籤閉合檢測與處理

來源:互聯網
上載者:User
php如何?html標籤閉合檢測與處理?本文主要介紹了php實現html標籤閉合檢測與修複方法,可實現針對html標籤中結束標籤的檢測與補全功能。希望對大家有所協助。

本文執行個體講述了php實現html標籤閉合檢測與修複方法。分享給大家供大家參考。具體如下:

html標籤閉合檢測與修複,說的有點大 , 並沒有考慮的很完整,沒有使用Regex, 適用於html檔案中只有開始標籤沒有結束標籤, 是有結束標籤沒有開始標籤的情況。標籤閉合的位置需要根據需求調整


<?php$str = '<p data="<li></li>">  <img src="http://www.baidu.com/123123.png"/>  <p2>    <a>content</a>  </p2>    <ul>      <li>      </li>    </ul>    <p>    content full    </p>    this is content</test1>    this is content</test2>    <test4 data="liujinjing"> This is cont    <li></li>    <test3 data="liujinjing"> This is content<p3></p3></p4></p></p><p6 style="width:90px; "> this is content';$str_len = strlen($str);//記錄起始標籤$pre_data = array();//記錄起始標籤位置$pre_pos = array();$last_data = array();$error_data = array();$error_pos = array();$i = 0;//標記為 < 開始$start_flag = false;while( $i < $str_len ) {  if($str[$i]=="<" && $str[$i+1]!='/' && $str[$i+1]!='!') {    $i++;    $_tmp_str = '';    //標記為 < 開始    $start_flag = true;    //標記空白    $space_flag = false;    while($str[$i]!=">" && $str[$i]!="'" && $str[$i]!='"' && $str[$i] !='/' && $i<$str_len){      if($str[$i]==' ') {        $space_flag = true;      }      if(!$space_flag) {        $_tmp_str .= $str[$i];        }      $i++;    }    $pre_data[] = $_tmp_str;    $pre_pos[] = $i;  } else if ($str[$i]=="<" && $str[$i+1]=='/') {    $i += 2;    $_tmp_str = '';    while($str[$i]!=">" && $i<$str_len){      $_tmp_str .= $str[$i];      $i++;    }    $last_data[] = $_tmp_str;    //查看開始標籤的上一個值    if(count($pre_data)>0) {      $last_pre_node = getLastNode($pre_data, 1);      if($last_pre_node == $_tmp_str) {        //配對上, 刪除對應位置的值        array_pop($pre_data);        array_pop($pre_pos);        array_pop($last_data);      } else {      //沒有配對上, 有兩種情況        //情況一: 只有閉合標籤, 沒有開始標籤        //情況二:只有開始標籤, 沒有閉合標籤        array_pop($last_data);        $error_data[] = $_tmp_str;        $error_pos[] = $i;      }    } else {        array_pop($last_data);        $error_data[] = $_tmp_str;        $error_pos[] = $i;          }  }else if ($str[$i]=="<" && $str[$i+1]=="!") {    $i++;    while($i<$str_len) {      if($str[$i]=="-" && $str[$i+1]=="-" && $str[$i+2]==">") {        $i++;        break;      } else {        $i++;      }    }    $i++;  }else if($str[$i]=='/' && $str[$i+1]=='>') {    //跳過自動單個閉合標籤    if($start_flag) {      array_pop($pre_data);      array_pop($pre_pos);      $i+=2;    }  }else if($str[$i]=="/" && $str[$i+1]=="*"){    $i++;    while($i<$str_len) {      if($str[$i]=="*" && $str[$i+1]=="/") {        $i++;        break;      } else {        $i++;    }    $i++;  }  }else if($str[$i]=="'"){    $i++;    while($str[$i]!="'" && $i<$str_len) {      $i++;    }    $i++;  } else if($str[$i]=='"'){    $i++;    while($str[$i]!='"' && $i<$str_len ) {      $i++;    }    $i++;  } else {    $i++;  }}//確定起始標籤的位置function confirm_pre_pos($str, $pre_pos){  $str_len = strlen($str);  $j=$pre_pos;  while($j < $str_len) {    if($str[$j] == '"') {      $j++;      while ($j<$str_len) {        if($str[$j]=='"') {          $j++;          break;        }        $j++;      }    }    else if($str[$j] == "'") {      $j++;      while ($j<$str_len) {        if($str[$j]=="'") {          $j++;          break;        }        $j++;      }    }    else if($str[$j]==">") {      $j++;      while ($j<$str_len) {        if($str[$j]=="<") {          //退回到原有內容位置          $j--;          break;        }        $j++;      }      break;    }     else {      $j++;    }  }  return $j;}//確定起始標籤的位置function confirm_err_pos($str, $err_pos){  $j=$err_pos;  $j--;  while($j > 0) {    if($str[$j] == '"') {      $j--;      while ($j<$str_len) {        if($str[$j]=='"') {          $j--;          break;        }        $j--;      }    }    else if($str[$j] == "'") {      $j--;      while ($j<$str_len) {        if($str[$j]=="'") {          $j--;          break;        }        $j--;      }    }    else if($str[$j]==">") {      $j++;      break;    }     else {      $j--;    }  }  return $j;}//擷取數組的倒數第num個值function getLastNode(array $arr, $num){  $len = count($arr);  if($len > $num) {    return $arr[$len-$num];  } else {    return $arr[0];  }}//整理資料, 主要是向後看, 進一步進行檢查function sort_data(&$pre_data, &$pre_pos, &$error_data, &$error_pos){  $rem_key_array = array();  $rem_i_array = array();  //擷取需要刪除的值  foreach($error_data as $key=>$value){    $count = count($pre_data);    for($i=($count-1) ; $i>=0; $i--) {      if($pre_data[$i] == $value && !in_array($i, $rem_i_array)) {        $rem_key_array[] = $key;        $rem_i_array[] = $i;        break;      }    }  }  //刪除起始標籤相應的值  foreach($rem_key_array as $_item) {    unset($error_pos[$_item]);    unset($error_data[$_item]);  }  //刪除結束標籤相應的值  foreach($rem_i_array as $_item) {    unset($pre_data[$_item]);    unset($pre_pos[$_item]);  }}//整理資料, 閉合標籤function modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos){  $move_log = array();  //只有閉合標籤的資料  foreach ($error_data as $key => $value) {    // code...    $_tmp_move_count = 0;    foreach ($move_log as $pos_key => $move_value) {      // code...      if($error_pos[$key]>=$pos_key) {        $_tmp_move_count += $move_value;      }    }    $data = insert_data($str, $value, $error_pos[$key]+$_tmp_move_count, false);    $str = $data['str'];    $move_log[$data['pos']] = $data['move_count'];  }  //只有起始標籤的資料  foreach ($pre_data as $key => $value) {    // code...    $_tmp_move_count = 0;    foreach ($move_log as $pos_key => $move_value) {      // code...      if($pre_pos[$key]>=$pos_key) {        $_tmp_move_count += $move_value;      }    }    $data = insert_data($str, $value, $pre_pos[$key]+$_tmp_move_count, true);    $str = $data['str'];    $move_log[$data['pos']] = $data['move_count'];  }  return $str;}//插入資料, $type 表示插入資料的方式function insert_data($str, $insert_data, $pos, $type) {  $len = strlen($str);  //起始標籤類型  if($type==true) {    $move_count = strlen($insert_data)+3;    $pos = confirm_pre_pos($str, $pos);    $pre_str = substr($str, 0, $pos);    $end_str = substr($str, $pos);    $mid_str = "</" . $insert_data . ">";  //閉合標籤類型  } else {    $pos = confirm_err_pos($str, $pos);    $move_count = strlen($insert_data) + 2;    $pre_str = substr($str, 0, $pos);    $end_str = substr($str, $pos);    $mid_str = "<" . $insert_data . ">";  }  $str = $pre_str.$mid_str.$end_str;  return array('str'=>$str, 'pos'=>$pos, 'move_count'=>$move_count);}sort_data($pre_data, $pre_pos, $error_data, $error_pos);$new_str = modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos);echo $new_str;// print_r($pre_data);// print_r($pre_pos);// print_r($error_data);// print_r($error_pos);// echo strlen($str);// foreach($pre_pos as $value){//   $value = confirm_pre_pos($str, $value);//   for($i=$value-5; $i<=$value; $i++) {//     echo $str[$i];//   }//   echo "\n";// }// foreach($error_pos as $value){//   for($i=$value-5; $i<=$value; $i++) {//     echo $str[$i];//   }//   echo "\n";// }?>

相關推薦:

php 檢測png圖片是否完整的執行個體代碼

php 檢測檔案類型的函數

php 檢測字元編碼代碼_PHP教程

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.