まず、インターネットから Snoopy.class.php をダウンロードします
メソッド呼び出し:
コードをコピー コードは次のとおりです:
< ?php
require 'lib/Snoopy.class.php';
require 'lib/WebCrawl.class.php';//次のコードが含まれます
$go=new WebCrawl( 'http://www .baidu.com');
echo $go->getCharset()
コードをコピーします コードは次のとおりです:
class WebCrawl
{
private $url;
プライベート $request;
public $charset_arr=array(
'gb2312',
'utf-8',
'big5',
'gbk',
'ascii',
' cp936'、
'ibm037'、
'ibm437'、
'ibm500'、
'asmo-708'、
'dos-720'、
'ibm737'、
'ibm775'、
'ibm850'、
'ibm852'、
'ibm855'、
'ibm857'、
'ibm00858'、
'ibm861'、
'ibm860'、
'dos-862'、
'ibm863'、
'ibm864'、
'ibm865'、
'cp866'、
'ibm869'、
'ibm870'、
'windows-874'、
'cp875'、
'shift_jis'、
'ks_c_5601-1987'、
'ibm1026'、
'ibm01047 '、
'ibm01047'、
'ibm01040'、
'ibm01041'、
'ibm01042'、
'ibm01043'、
'ibm01044'、
'ibm01045' 、
'ibm01046'、
'ibm01047'、
'ibm01048'、
'ibm01049'、
'utf-16'、
'unicodefffe'、
'windows -1250'、
'windows-1251'、
'windows-1252'、
'windows-1253'、
'windows-1254'、
'windows-1255'、
'windows-1256'、
'windows-1257'、
'windows-1258'、
'johab'、
'macintosh'、
'x-mac-japanese' 、
'x-mac-chinesetrad'、
'x-mac-korean'、
'x-mac-arabic'、
'x-mac-hebrew'、
'x -mac-ギリシャ語'、
'x-mac-キリル文字'、
'x-mac-chinesesimp'、
'x-mac-ルーマニア語'、
'x-mac-ウクライナ語'、
'x-mac-thai'、
'x-mac-ce'、
'x-mac-icelandic'、
'x-mac-turkish'、
'x- mac-croatian'、
'x-chinese-cns'、
'x-cp20001'、
'x-chinese-eten'、
'x-cp20003'、
'x -cp20004'、
'x-cp20005'、
'x-ia5'、
'x-ia5-ドイツ語'、
'x-ia5-スウェーデン語'、
'x- ia5-norwegian'、
'us-ascii'、
'x-cp20261'、
'x-cp20269'、
'ibm273'、
'ibm277'、
' ibm278'、
'ibm280'、
'ibm284'、
'ibm285'、
'ibm290'、
'ibm420'、
'ibm423'、
'ibm424 '、
'x-ebcdic-koreanextended'、
'ibm-thai'、
'koi8-r'、
'ibm871'、
'ibm880'、
'ibm905 '、
'ibm00924'、
'x-cp20936'、
'x-cp20949'、
'cp1025'、
'koi8-u'、
'iso-8859 -1'、
'iso-8859-2'、
'iso-8859-3'、
'iso-8859-4'、
'iso-8859-5'、
'iso-8859-6'、
'iso-8859-7'、
'iso-8859-8'、
'iso-8859-9'、
'iso-8859- 13'、
'iso-8859-15'、
'x-europa'、
'iso-8859-8-i'、
'iso-2022-jp'、
'csiso2022jp'、
'iso-2022-jp'、
'iso-2022-kr'、
'x-cp50227'、
'euc-jp'、
'euc- cn'、
'euc-kr'、
'hz-gb-2312'、
'gb18030'、
'x-iscii-de'、
'x-iscii-be '、
'x-iscii-ta'、
'x-iscii-te'、
'x-iscii-as'、
'x-iscii-or'、
' x-iscii-ka'、
'x-iscii-ma'、
'x-iscii-gu'、
'x-iscii-pa'、
'utf-7'、
'utf-32'、
'utf-32be'
);
パブリック関数 __construct($url)
{
$this->url=$url;
}
//打开网站
private function open($url)
{
if($this->request!==null)
{
if( $this->request->status==200)
{
true を返す;
}
else
{
return false;
}
}
else
{
$this->request=new Snoopy();
$this->request->fetch($url);
if($this->request->status==200)
{
$this->request->results=strto lower($this->request->results) ;
$charset=$this->getCharset();
if($charset!="utf-8")
{
if($charset=="windows-1252")
{
$this->request-> results=$this->uni_decode($this->request->results);
}
else
{
$this->request->results=mb_convert_encoding($this->request->results,"UTF-8",$charset);
}
}
true を返します。
}
else
{
return false;
}
}
}
//获取网站title,keywords,description
public function getWebinfo()
{
$info=array(
'title' =>''、
'キーワード'=>''、
'desc'=>''、
'ip'=>''
);
if(!$this->open($this->url)){return $info;exit;}
// print_r($this->request->results);exit;
preg_match('/