いくつかのコードを簡単に説明します。
最初の ~(<[^>] ?>)~si
この正規表現は <…………> の内容と一致します。簡単に言うと、すべての
2 番目の ~<([a-z0-9] )[^/>]*?/>~si
この正規表現は <……/> の内容と一致します。
3 番目の ~([a-z0-9] )[^/>]*?>~si
この正規表現のような単一の閉じたタグです< ;/...> の内容に一致します。つまり、
4 番目の ~<([a-z0-9] )[^/>]*?>~si
などの終了タグは <.. .. ..>これは最初のタグとは異なります。HTML タグには次のような数字と文字しか含まれていないためです。
5 番目のタグ~~si
説明の必要はありません。HTMl コメント
残りはソース コードで確認できます。PHP ソース コードの添付:
コードをコピー コードは次のとおりです。
/**
* HTML を取得し、自動的に完了して閉じます
*
* param $html
*
* param $length
*
* param $end
*/
function subHtml($html, $length=50) {
$ result = '';
$tagStack = array();
$contents = preg_split("~(<[^>] ?>) ~si", $ html, -1, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE);
foreach($contents as $tag) {
if (trim($tag) == "") continue;
if (preg_match ("~< ([a-z0-9] )[^/>]*?/>~si", $tag)) {
$result .= $tag>} else if (preg_match("~ ([a-z0-9] )[^/>]*?>~si", $tag, $match)) {
if ($tagStack[count($ tagStack)-1] == $match[1]) {
array_pop($tagStack);
$result .= $tag;
}
} else if (preg_match("~< ([a-z0 -9] )[^/>]*?>~si", $tag, $match)) {
array_push($tagStack, $match[1]);
$ result .= $tag ;
} else if (preg_match("~~si", $tag)) {
$result .= $tag; >} else {
if ($len mstrlen($tag) < $length) {
$result .= $tag;
$len = mstrlen($tag);
;
$str = msubstr($tag, 0, $length - $len 1);
$result .= $str;
}
}
} !empty($tagStack )) {
$result .= '' .array_pop($tagStack) .
}
return $result; /**
* 中国語の文字列を取得
*
* param $string string
*
* param $start 開始ビット
*
* param $length length
*
* param $charset エンコーディング
*
* param $dot 追加文字列
*/
function msubstr($string, $start, $length, $dot = '', $charset = 'UTF-8') {
$string = str_replace(array(' &', '" ', '<', '>', ' ')、array('&', '"', '<', '>', ' '), $string); 🎜>if (strlen ($string) return $string;
}
if (strto lower($charset) == 'utf-8') {
$ n = $tn = $noc = 0;
while ($n
$n = 2;
} elseif (224 $tn = 3;
$n = 3;
} elseif (240 $tn = 4; = 4;
} elseif (248 $tn = 5;
$n = 5; 252 || $t == 253) {
$tn = 6;
$n;
>if ($noc >= $length) {
break;
}
}
if ($noc >$length) {
$n -= $tn; >}
$strcut = substr($string, 0, $n);
} else {
for($i = 0; $i $ strcut .= ord( $string[$i]) > $string[$i] : $string[$i];
}
}
strcut . $dot;
/**
* 中国語と英語を含む文字列の長さを取得します。
*/
function mstrlen($str, $charset = 'UTF-8') {
if (function_exists('mb_substr') ) {
$length = mb_strlen($str, $charset);
} elseif (function_exists('iconv_substr')) {
$length = iconv_strlen($str, $charset); else {
preg_match_all("/[x01-x7f]|[xc2-xdf][x80-xbf]|xe0[xa0-xbf][x80-xbf]|[xe1-xef][x80-xbf][x80 -xbf]|xf0 [x90-xbf][x80-f][x80-xbf]|[xf1-xf7][x80-xbf][x80-xbf][x80-xbf]/", $text, $ar) ;
$ length = count($ar[0]);
return $length;
$str = " 1s テスト 124";
echo subHtml($str);
?>