首頁 >後端開發 >php教程 >html標籤閉合檢測與修復

html標籤閉合檢測與修復

WBOY
WBOY原創
2016-07-25 09:01:091394瀏覽
html标签闭合检测与修复,说的有点大 , 并没有考虑的很完整,没有使用正则表达式, 适用于html文件中只有开始标签没有结束标签, 是有结束标签没有开始标签的情况。标签闭合的位置需要根据需求调整
  1. $str = '
  2. content
  3. content full
  4. this is content
  5. this is content
  6. This is cont
  7. This is content
  • this is content';
  • $str_len = strlen($str);
  • //記錄起始標籤
  • $pre_data = array();
  • //記錄起始標籤位置
  • $pre_pos = array();
  • $last_data = array();
  • $error_data = array ();
  • $error_pos = array();
  • $i = 0;
  • //標記為$start_flag = false;
  • while( $i
  • if($str[$i]==" $i++;
  • $_tmp_str = '';
  • //標記為 $start_flag = true;
  • / /標記空白
  • $space_flag = false;
  • while($str[$i]!=">" && $str[$i]!="'" && $str[$i]!='" ' && $str[$i] !='/' && $i
  • if($str[$i]==' ') {
  • $space_flag = true;
  • }
  • if(!$space_flag) {
  • $_tmp_str .= $str[$i];
  • }
  • $i++;
  • }
  • }
  • $i++; $pre_data[] = $_tmp_str;
  • $pre_pos[] = $i;
  • } else if ($str[$i]=="
  • $i += 2;
  • $_tmp_str = '';
  • while($str[$i]!=">" && $i $_tmp_str .= $str[$i];
  • $i++;
  • }
  • $last_data[] = $_tmp_str;
  • $last_data[] = $_tmp_str;
  • //查看開始標籤的上一個值
  • if(count($pre_data)>0) {
  • $last_pre_node = getLastNode($pre_data, 1);
  • if($last_pre_node == $_tmp_str) {
  • //配對上, 刪除對應位置的值
  • array_pop($pre_data);
  • array_pop($pre_pos);
  • array_pop($last_data);
  • } else {
  • //沒有配對上, 有兩種情況
  • //情況一: 只有閉合標籤, 沒有開始標籤
  • //情況二:只有開始標籤, 沒有閉合標籤
  • array_pop ($last_data);
  • $error_data[] = $_tmp_str;
  • $error_pos[] = $i;
  • }
  • } else {
  • array_pop($last_data );
  • $error_data[] = $_tmp_str;
  • $error_pos[] = $i;
  • }
  • }else if ($str[$i]=="
  • $i++;
  • while($i
  • if( $str[$i]=="-" && $str[$i+1]=="-" && $str[$i+2]==">") {
  • $i++;
  • break;
  • } else {
  • $i++;
  • }
  • }
  • $i++;
  • }
  • $i++;
  • } $str[$i]=='/' && $str[$i+1]=='>') {
  • //跳過自動單一閉合標籤
  • if($start_flag) {
  • array_pop($pre_data);
  • array_pop($pre_pos);
  • $i+=2;
  • }
  • }else if($str[$i]= ="/" && $str[$i+1]=="*"){
  • $i++;
  • while($i
  • if($str[$i]=="*" && $str[$i+1]=="/") {
  • $i++;
  • break;
  • } else {
  • $i++;
  • }
  • $i++;
  • }
  • }else if($str[$i]=="'") {
  • $i++;
  • while($str[$i]!="'" && $i $i++;
  • }
  • $i++;
  • } else if($str[$i]=='"'){
  • $i++;
  • while($str[$ i]!='"' && $i $i++;
  • }
  • $i++;
  • } else {
  • $i++;
  • }
  • }
  • //確定起始標籤的位置
  • function confirm_pre_pos($str, $pre_pos){
  • $str_len = strlen($str);
  • $j=$pre_pos;
  • while($j
  • if($str[$j] == '"') {
  • $j++;
  • while ($j if($str[$j]=='"') {
  • $j++;
  • break;
  • }
  • $j++;
  • }
  • }
  • else if($str[$j] == "'") {
  • $j++;
  • while ($j if ($str[$j]=="'") { $j++; break; } $j++; } }
  • else if($str[$j]==">") {
  • $j++;
  • while ($j if($str[$j ]==" //退回到原有內容位置
  • $j--;
  • break;
  • }
  • $j++;
  • }
  • break ;
  • }
  • else {
  • $j++;
  • }
  • }
  • return $j;
  • }
  • 🎜>
  • //確定起始標籤的位置
  • function confirm_err_pos($str, $err_pos){
  • $j=$err_pos;
  • $j--;
  • while($j > 0 ) {
  • if($str[$j] == '"') {
  • $j--;
  • while ($j if($str [$j]=='"') {
  • $j--;
  • break;
  • }
  • $j--;
  • }
  • }
  • else if($str[$j] == "'") {
  • $j--;
  • while ($j if($str[$j]==" '") {
  • $j--;
  • break;
  • }
  • $j--;
  • }
  • }
  • else if($str[$ j]==">") {
  • $j++;
  • break;
  • }
  • else {
  • $j--;
  • }
  • }
  • $j--;
  • }
  • }
  • return $j;
  • }
  • //取得陣列的倒數第num個值
  • function getLastNode(array $arr, $num) {
  • $len = count($arr);
  • if($len > $num) {
  • return $arr[$len-$num];
  • } else {
  • return $ arr[0];
  • }
  • }
  • //整理數據, 主要是向後看,進一步進行檢查
  • function sort_data(&$pre_data, &$pre_pos, &$error_data , &$error_pos){
  • $rem_key_array = array();
  • $rem_i_array = array();
  • // 取得需要刪除的值 foreach($error_dataas $key=>$value){
  • $count = count($pre_data);
  • for($i=($count-1) ; $i>=0; $i- -) {
  • if($pre_data[$i] == $value && !in_array($i, $rem_i_array)) {
  • $rem_key_array[] = $key;
  • $rem_i_array[] = $ i;
  • break;
  • }
  • }
  • }
  • //刪除起始標籤對應的值
  • foreach($rem_key_array as $_item) {
  • unset ($error_pos[$_item]);
  • unset($error_data[$_item]);
  • }
  • //刪除結束標籤對應的值
  • foreach($rem_i_array as $_item ) {
  • unset($pre_data[$_item]);
  • unset($pre_pos[$_item]);
  • }
  • }
  • //整理數據,閉合標籤
  • function modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos){
  • $move_log = array();
  • //只有閉合標籤的資料
  • foreach ($error_data as $key => $value) {
  • # code...
  • $_tmp_move_count = 0;
  • foreach ($move_log as $pos_key => $move_value) {
  • # code...
  • if($error_pos[$key]>=$pos_key) {
  • $_tmp_move_count += $move_value;
  • }
  • }
  • $data = insert_data($str, $value, $error_pos[$key]+$_tmp_move_count, false);
  • $str = $data['str'];
  • $move_log[$data['str'];
  • $move_log[$data['str'];
  • $move_log[$data[ 'pos']] = $data['move_count'];
  • }
  • //只有起始標籤的資料
  • foreach ($pre_data as $key => $value) {
  • # code...
  • $_tmp_move_count = 0;
  • foreach ($move_log as $pos_key => $move_value) {
  • # code...
  • if($pre_value) {
  • # code...
  • if($pre_pos[$ key]>=$pos_key) {
  • $_tmp_move_count += $move_value;
  • }
  • }
  • $data = insert_data($str, $value, $pre_pos[$key]+ $_tmp_move_count, true);
  • $str = $data['str'];
  • $move_log[$data['pos']] = $data['move_count'];
  • }
  • return $str;
  • }
  • //插入數據, $type 表示插入數據的方式
  • function insert_data($str, $insert_data, $pos, $type) {
  • $len = strlen($str);
  • //起始標籤類型
  • if($type ==true) {
  • $move_count = strlen($insert_data)+3;
  • $pos = confirm_pre_pos($str, $pos);
  • $ pre_str = substr($str, 0, $pos);
  • $end_str = substr($str, $pos);
  • $mid_str = "" . $insert_data . "> ";
  • //閉合標籤類型
  • } else {
  • $pos = confirm_err_pos($str, $pos);
  • $move_count = strlenove_count =count ($insert_data) + 2; $pre_str = substr($str, 0, $pos); $end_str = substr($str, $pos); $mid_str = ""; }
  • $str = $pre_str.$mid_str.$end_str;
  • return array('str'=>$str, 'pos'=>$pos, 'move_count'=> ;$ move_count);
  • }
  • sort_data($pre_data, $pre_pos, $error_data, $error_pos);
  • $new_str = 修改_data($str, $pre_data, $prepos_data, $pre_pos, $error_data, $error_pos);
  • echo $new_str;
  • // print_r($pre_data);
  • // print_r($pre_pos);
  • // print_r($error_data);
  • // print_r($error_pos);
  • // echo strlen($str);
  • // foreach($pre_pos as $value){
  • // $value = recognize_pre_pos($str, $value);
  • // for($i=$value-5; $i// echo $str[$i];
  • // }
  • // echo "n";
  • // }
  • // foreach($error_pos as $value){
  • // for($i=$value-5; $i// echo $str[$i];
  • // }
  • // echo "n ";
  • // }
  • ?>
  • 複製程式碼


    陳述:
    本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
    上一篇:php九宮格日誌下一篇:php九宮格日誌