这篇文章主要介绍了php实现html标签闭合检测与修复方法,可实现针对html标签中结束标签的检测与补全功能,非常具有实用价值,需要的朋友可以参考下
本文实例讲述了php实现html标签闭合检测与修复方法。分享给大家供大家参考。具体如下:
html标签闭合检测与修复,,说的有点大 , 并没有考虑的很完整,没有使用正则表达式, 适用于html文件中只有开始标签没有结束标签, 是有结束标签没有开始标签的情况。标签闭合的位置需要根据需求调整
">
content
content full
this is content
this is content
This is cont
This is content
this is content';
$str_len = strlen($str);
//记录起始标签
$pre_data = array();
//记录起始标签位置
$pre_pos = array();
$last_data = array();
$error_data = array();
$error_pos = array();
$i = 0;
//标记为 " && $str[$i]!="'" && $str[$i]!='"' && $str[$i] !='http://www.jb51.net/' && $i" && $i0) {
$last_pre_node = getLastNode($pre_data, 1);
if($last_pre_node == $_tmp_str) {
//配对上, 删除对应位置的值
array_pop($pre_data);
array_pop($pre_pos);
array_pop($last_data);
} else {
//没有配对上, 有两种情况
//情况一: 只有闭合标签, 没有开始标签
//情况二:只有开始标签, 没有闭合标签
array_pop($last_data);
$error_data[] = $_tmp_str;
$error_pos[] = $i;
}
} else {
array_pop($last_data);
$error_data[] = $_tmp_str;
$error_pos[] = $i;
}
}else if ($str[$i]=="") {
$i++;
break;
} else {
$i++;
}
}
$i++;
}else if($str[$i]=='http://www.jb51.net/' && $str[$i+1]=='>') {
//跳过自动单个闭合标签
if($start_flag) {
array_pop($pre_data);
array_pop($pre_pos);
$i+=2;
}
}else if($str[$i]=="http://www.jb51.net/" && $str[$i+1]=="*"){
$i++;
while($i") {
$j++;
while ($j 0) {
if($str[$j] == '"') {
$j--;
while ($j") {
$j++;
break;
}
else {
$j--;
}
}
return $j;
}
//获取数组的倒数第num个值
function getLastNode(array $arr, $num){
$len = count($arr);
if($len > $num) {
return $arr[$len-$num];
} else {
return $arr[0];
}
}
//整理数据, 主要是向后看, 进一步进行检查
function sort_data(&$pre_data, &$pre_pos, &$error_data, &$error_pos){
$rem_key_array = array();
$rem_i_array = array();
//获取需要删除的值
foreach($error_data as $key=>$value){
$count = count($pre_data);
for($i=($count-1) ; $i>=0; $i--) {
if($pre_data[$i] == $value && !in_array($i, $rem_i_array)) {
$rem_key_array[] = $key;
$rem_i_array[] = $i;
break;
}
}
}
//删除起始标签相应的值
foreach($rem_key_array as $_item) {
unset($error_pos[$_item]);
unset($error_data[$_item]);
}
//删除结束标签相应的值
foreach($rem_i_array as $_item) {
unset($pre_data[$_item]);
unset($pre_pos[$_item]);
}
}
//整理数据, 闭合标签
function modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos){
$move_log = array();
//只有闭合标签的数据
foreach ($error_data as $key => $value) {
// code...
$_tmp_move_count = 0;
foreach ($move_log as $pos_key => $move_value) {
// code...
if($error_pos[$key]>=$pos_key) {
$_tmp_move_count += $move_value;
}
}
$data = insert_data($str, $value, $error_pos[$key]+$_tmp_move_count, false);
$str = $data['str'];
$move_log[$data['pos']] = $data['move_count'];
}
//只有起始标签的数据
foreach ($pre_data as $key => $value) {
// code...
$_tmp_move_count = 0;
foreach ($move_log as $pos_key => $move_value) {
// code...
if($pre_pos[$key]>=$pos_key) {
$_tmp_move_count += $move_value;
}
}
$data = insert_data($str, $value, $pre_pos[$key]+$_tmp_move_count, true);
$str = $data['str'];
$move_log[$data['pos']] = $data['move_count'];
}
return $str;
}
//插入数据, $type 表示插入数据的方式
function insert_data($str, $insert_data, $pos, $type) {
$len = strlen($str);
//起始标签类型
if($type==true) {
$move_count = strlen($insert_data)+3;
$pos = confirm_pre_pos($str, $pos);
$pre_str = substr($str, 0, $pos);
$end_str = substr($str, $pos);
$mid_str = "" . $insert_data . ">";
//闭合标签类型
} else {
$pos = confirm_err_pos($str, $pos);
$move_count = strlen($insert_data) + 2;
$pre_str = substr($str, 0, $pos);
$end_str = substr($str, $pos);
$mid_str = "";
}
$str = $pre_str.$mid_str.$end_str;
return array('str'=>$str, 'pos'=>$pos, 'move_count'=>$move_count);
}
sort_data($pre_data, $pre_pos, $error_data, $error_pos);
$new_str = modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos);
echo $new_str;
// print_r($pre_data);
// print_r($pre_pos);
// print_r($error_data);
// print_r($error_pos);
// echo strlen($str);
// foreach($pre_pos as $value){
// $value = confirm_pre_pos($str, $value);
// for($i=$value-5; $i
希望本文所述对大家的php程序设计有所帮助。
Kenyataan:Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn