2013-06-23 04:33:51 W3SVC1539885 198.56.185.162 GET /robots.txt - 80 - 66.249.75.65 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 404 0 2
この日付の形式は固定する必要があると思います。たとえば、
$log = '2013-06-23 04:33:51 W3SVC1539885 198.56.185.162 GET /robots.txt - 80 - 66.249.75.65 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 404 0 2';var_dump( explode(' ', $log) ); /**array(14) { [0]=> string(10) "2013-06-23" [1]=> string(8) "04:33:51" [2]=> string(12) "W3SVC1539885" [3]=> string(14) "198.56.185.162" [4]=> string(3) "GET" [5]=> string(11) "/robots.txt" [6]=> string(1) "-" [7]=> string(2) "80" [8]=> string(1) "-" [9]=> string(12) "66.249.75.65" [10]=> string(72) "Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html)" [11]=> string(3) "404" [12]=> string(1) "0" [13]=> string(1) "2"}*/
$log = '2013-06-23 04:33:51 W3SVC1539885 198.56.185.162 GET /robots.txt - 80 - 66.249.75.65 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 404 0 2';var_dump( explode(' ', $log) ); /**array(14) { [0]=> string(10) "2013-06-23" [1]=> string(8) "04:33:51" [2]=> string(12) "W3SVC1539885" [3]=> string(14) "198.56.185.162" [4]=> string(3) "GET" [5]=> string(11) "/robots.txt" [6]=> string(1) "-" [7]=> string(2) "80" [8]=> string(1) "-" [9]=> string(12) "66.249.75.65" [10]=> string(72) "Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html)" [11]=> string(3) "404" [12]=> string(1) "0" [13]=> string(1) "2"}*/
$log = '2013-06-23 04:33:51 W3SVC1539885 198.56.185.162 GET /robots.txt - 80 - 66.249.75.65 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 404 0 2';var_dump( explode(' ', $log) ); /**array(14) { [0]=> string(10) "2013-06-23" [1]=> string(8) "04:33:51" [2]=> string(12) "W3SVC1539885" [3]=> string(14) "198.56.185.162" [4]=> string(3) "GET" [5]=> string(11) "/robots.txt" [6]=> string(1) "-" [7]=> string(2) "80" [8]=> string(1) "-" [9]=> string(12) "66.249.75.65" [10]=> string(72) "Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html)" [11]=> string(3) "404" [12]=> string(1) "0" [13]=> string(1) "2"}*/のようにスペースで区切ることができるようにする必要があると思います
ただし、サーバーログのすべての行がこのようになっているわけではないので、通常の形式にしたいと思います。他の形式を除外する式。
この点は無駄にはできません
ログ ファイルは一般に非常に大きいです
ループ内で 1 行ずつ読み取り、配列に分割する必要があります