>  기사  >  백엔드 개발  >  HTML 태그 폐쇄 감지 및 복구

HTML 태그 폐쇄 감지 및 복구

WBOY
WBOY원래의
2016-07-25 09:01:091373검색
html标签闭合检测与修复,说的有点大 , 并没有考虑的很完整,没有使用正则表达式, 适用于html文件中只有开始标签没有结束标签, 是有结束标签没有开始标签的情况。标签闭合的位置需要根据需求调整
  1. $str = '
  2. content
  3. content full
  4. this is content
  5. this is content
  6. This is cont
  7. This is content
  • 콘텐츠입니다';
  • $str_len = strlen($str);
  • //녹화 시작 시작 태그
  • $pre_data = array();
  • //시작 태그 위치 기록
  • $pre_pos = array();
  • $last_data = array();
  • $error_data = array();
  • $error_pos = array();
  • $i = 0;
  • //< start
  • $start_flag = false;
  • 로 표시됨
  • while( $i < $str_len ) {
  • if($str[$i]=="<" && $str[$i 1]!='/' && $str[ $i 1]!='!') {
  • $i ;
  • $_tmp_str = '';
  • // < start
  • $start_flag = true;
  • 로 표시됨
  • //공백으로 표시
  • $space_flag = false;
  • while($str[$i]!=">" && $str[$i]!="'" && $str[$i ]!='"' && $str[$i] !='/' && $i<$str_len){
  • if($str[$i]==' ') {
  • $ space_flag = true;
  • }
  • if(!$space_flag) {
  • $_tmp_str .= $str[$i]
  • }
  • $i ;
  • }
  • $pre_data[] = $_tmp_str;
  • $pre_pos[] = $i;
  • } else if ($str[$i]=="<" && $str[$i 1]=='/') {
  • $i = 2;
  • $_tmp_str = '';
  • while($str[$i]!="> " && $i<$str_len){
  • $_tmp_str .= $str[$i];
  • $i ;
  • }
  • $last_data[] = $_tmp_str;
  • //시작 태그의 이전 값 보기
  • if(count($pre_data)>0) {
  • $last_pre_node = getLastNode($pre_data, 1);
  • if( $ last_pre_node == $_tmp_str) {
  • //페어링 시 해당 위치의 값을 삭제
  • array_pop($pre_data);
  • array_pop($pre_pos);
  • array_pop($last_data);
  • } else {
  • //일치 없음, 두 가지 경우
  • //사례 1: 닫는 태그만 있고 시작 태그는 없음
  • //사례 2: 시작 태그만 있음 , 닫는 태그 없음
  • array_pop($last_data);
  • $error_data[] = $_tmp_str;
  • $error_pos[] = $i;
  • }
  • } else {
  • array_pop($last_data);
  • $error_data[] = $_tmp_str;
  • $error_pos[] = $i;
  • }
  • }else if ($ str[ $i]=="<" && $str[$i 1]=="!") {
  • $i ;
  • while($i<$str_len) {
  • if($str[$i]=="-" && $str[$i 1]=="-" && $str[$i 2]==">") {
  • $ i ;
  • break;
  • } else {
  • $i ;
  • }
  • }
  • $i ;
  • }else if($str[$i]=='/' && $str[$i 1]=='>') {
  • //자동 단일 닫기 태그 건너뛰기
  • if ($start_flag) {
  • array_pop($pre_data);
  • array_pop($pre_pos);
  • $i =2;
  • }
  • }else if($ str [$i]=="/" && $str[$i 1]=="*"){
  • $i ;
  • while($i<$str_len) {
  • if($str[$i]=="*" && $str[$i 1]=="/") {
  • $i ;
  • break;
  • } else {
  • $i ;
  • }
  • $i ;
  • }
  • }else if($str[$i]== " '"){
  • $i ;
  • while($str[$i]!="'" && $i<$str_len) {
  • $i ;
  • }
  • $i ;
  • } else if($str[$i]=='"'){
  • $i ;
  • while( $ str[$i]!='"' && $i<$str_len ) {
  • $i ;
  • }
  • $i ;
  • } else {
  • $ i ;
  • }
  • }
  • //시작 태그 위치 결정
  • function verify_pre_pos($str, $pre_pos){
  • $str_len = strlen( $str );
  • $j=$pre_pos;
  • while($j < $str_len) {
  • if($str[$j] == '"') {
  • $j ;
  • while ($j<$str_len) {
  • if($str[$j]=='"') {
  • $j ;
  • break;
  • }
  • $ j ;
  • }
  • }
  • else if($str[$j] == "'") {
  • $j ;
  • while ($j<$str_len ) {
  • if($str[$j]=="'") {
  • $j ;
  • break;
  • }
  • $j ;
  • }
  • }
  • else if($str[$j]==">") {
  • $j ;
  • while ($j<$str_len) {
  • if($str[$ j]=="<") {
  • //원래 내용 위치로 복귀
  • $j--;
  • break;
  • }
  • $j ;
  • }
  • break;
  • }
  • else {
  • $j ;
  • }
  • }
  • return $j;
  • }
  • //시작 태그 위치 결정
  • function verify_err_pos($str, $err_pos){
  • $j=$err_pos;
  • $j--;
  • while($ j > 0) {
  • if($str[$j] == '"') {
  • $j--;
  • while ($j<$str_len) {
  • if ($str[$j]=='"') {
  • $j--;
  • break;
  • }
  • $j--;
  • }
  • }
  • else if($str[$j] == "'") {
  • $j--;
  • while ($j<$str_len) {
  • if($str[$j ] ==="'") {
  • $j--;
  • break;
  • }
  • $j--;
  • }
  • }
  • else if ($ str[$j]==">") {
  • $j ;
  • break;
  • }
  • else {
  • $j--;
  • }
  • }
  • return $j;
  • }
  • //배열 맨 아래에서 숫자 값 가져오기
  • function getLastNode (배열 $arr , $num){
  • $len = count($arr);
  • if($len > $num) {
  • return $arr[$len-$num];
  • } else {
  • return $arr[0];
  • }
  • }
  • //데이터 정리, 주로 과거를 살펴보고 추가 검사 수행
  • function sort_data(&$pre_data , &$ pre_pos, &$error_data, &$error_pos){
  • $rem_key_array = array();
  • $rem_i_array = array();
  • //필요한 값을 가져옵니다. 삭제 예정
  • foreach($error_data as $key=>$value){
  • $count = count($pre_data);
  • for($i=($count- 1) ; $i> =0; $i--) {
  • if($pre_data[$i] == $value && !in_array($i, $rem_i_array)) {
  • $rem_key_array[] = $key;
  • $rem_i_array[] = $i;
  • break;
  • }
  • }
  • }
  • //시작 태그의 해당 값 삭제
  • foreach($rem_key_array as $_item ) {
  • unset($error_pos[$_item]);
  • unset($error_data[$_item]);
  • }
  • //해당 항목 삭제 종료 태그 값
  • foreach ($rem_i_array as $_item) {
  • unset($pre_data[$_item]);
  • unset($pre_pos[$_item]);
  • }
  • }
  • //데이터 정리 및 태그 닫기
  • function 수정_data($str, $pre_data, $pre_pos, $error_data, $error_pos){
  • $move_log = array();
  • / /닫힌 태그에 대한 데이터만
  • foreach ($error_data as $key => $value) {
  • # 코드...
  • $_tmp_move_count = 0;
  • foreach ($move_log as $pos_key = > $move_value) {
  • # 코드...
  • if($error_pos[$key]>=$pos_key) {
  • $_tmp_move_count = $ move_value;
  • }
  • }
  • $data = insert_data($str, $value, $error_pos[$key] $_tmp_move_count, false);
  • $str = $data ['str'];
  • $move_log[$data['pos']] = $data['move_count'];
  • }
  • //데이터만 시작 태그
  • foreach ($pre_data as $key => $value) {
  • # 코드...
  • $_tmp_move_count = 0;
  • foreach ($move_log as $pos_key => $move_value) {
  • # 코드...
  • if($pre_pos[$key]>=$pos_key) {
  • $_tmp_move_count = $move_value;
  • }
  • }
  • $data = insert_data($str, $ value, $pre_pos[$key] $_tmp_move_count, true);
  • $str = $data['str'];
  • $ move_log[$data['pos']] = $ data['move_count'];
  • }
  • return $str;
  • }
  • //Insert data, $type 데이터를 삽입하는 방법을 나타냅니다
  • function insert_data($str, $insert_data, $pos, $type) {
  • $len = strlen($str );
  • //태그 유형 시작
  • if($type==true) {
  • $move_count = strlen($insert_data) 3;
  • $pos = verify_pre_pos($str, $pos);
  • $pre_str = substr($str, 0, $pos);
  • $end_str = substr($str, $pos);
  • $mid_str = "< /" . $insert_data . ">";
  • //닫는 태그 유형
  • } else {
  • $ pos = verify_err_pos($str, $pos);
  • $move_count = strlen($insert_data) 2;
  • $pre_str = substr($str, 0, $pos);
  • $end_str = substr($str, $ pos);
  • $mid_str = "<" $insert_data .
  • $str = $pre_str.$mid_str.$end_str;
  • return array('str'=>$str, 'pos'=>$pos, 'move_count'=> ;$move_count);
  • }
  • sort_data($pre_data, $pre_pos, $error_data, $error_pos);
  • $new_str = 수정_데이터($str, $pre_data, $pre_pos, $error_data, $error_pos);
  • echo $new_str;
  • // print_r($pre_data);
  • // print_r($pre_pos);
  • // print_r($error_data);
  • // print_r($error_pos);
  • // echo strlen($str);
  • // foreach($pre_pos를 $value로){
  • // $value = verify_pre_pos($str, $value);
  • // for($i=$value-5; $i<=$value; $i ) {
  • // echo $str[$i];
  • // }
  • // echo "n";
  • // }
  • // foreach($error_pos를 $value로){
  • // for($i=$value-5; $i<=$value; $i ) {
  • // echo $str[$i];
  • // }
  • // echo "n ";
  • // }
  • ?>
  • 复제대码


    성명:
    본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.