Heim  >  Artikel  >  Datenbank  >  apache访问日志access.log的解析以及如何将其导入mysql_MySQL

apache访问日志access.log的解析以及如何将其导入mysql_MySQL

WBOY
WBOYOriginal
2016-06-01 13:29:37982Durchsuche

Apache

bitsCN.com

apache访问日志access.log的解析以及如何将其导入mysql
 

access.log导入mysqlload data local inf

首先,我们对apache访问日志进行一个解读,

 

220.181.108.92  -  -  [22/Aug/2013:23:59:59 +0800]  "GET /min/f=/media/js/jquery-1.7.2.media/js/global_interaction.js&201308221836 HTTP/1.1"  200  70550  "http://adfdfs.com.cn1071-2130-1.html"   "Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9) Gecko Minefield/3.0"

 

第一项信息是远程主机的地址,即它表明访问网站的究竟是谁。

 

第二项是空白,用一个“-”占位符替代。实际上绝大多数时候这一项都是如此。这个位置用于记录浏览者的标识,这不只是浏览者的登录名字,而是浏览者的email地址或者其他唯一标识符,通常只是"-";

 

第三项也是空白用一个占位符"-"来替代。这个位置用于记录浏览者进行身份验证时提供的名字。当然,如果网站的某些内容要求用户进行身份验证,那么这项信息是不会空白的。但是,对于大多数网站来说,日志文件的大多数记录中这一项仍旧是空白的。

 

第四项,表示访问者的访问时间记录,无需多解释,时间信息最后的“+800”表示服务器所处时区位于UTC之后的8小时。

 

第五项,是整个日志记录中最有用的信息,它告诉我们服务器收到的是一个什么样的请求

 

第六项,200状态代码

 

第七项,70500,是服务器发送给客户端的总字节数

 

第八项,客户在提出请求时所在的目录或URL。

 

第九项,客户端的详细信息

 

根据需求可以建张表

 

CREATE TABLE IF NOT EXISTS `apache_log` (

  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT 'id号',

  `hostip` char(32) NOT NULL  DEFAULT '0.0.0.0' COMMENT '远程主机的IP地址',

  `marking` char(30)  COMMENT '浏览者的标识',

  `client_name` char(30)  COMMENT '浏览者的名字',

  `addtime` char(64) NOT NULL COMMENT '浏览时间',

  `time_zone` char(8) NOT NULL COMMENT '时区',

  `method` char(8)  NOT NULL COMMENT '方法',

  `resource` char(64)  NOT NULL COMMENT ' 请求的资源',

  `protocol` char(8)  COMMENT '请求使用的协议',

  `status` int(5)  COMMENT '状态代码',

  `bytes` int(5)  COMMENT '发送给客户端的总字节数',

  `refer` char(128)  COMMENT '客户在提出请求时所在的目录或URL',  

  `client_info` char(128)  COMMENT '客户在提出请求时所在的目录或URL',

  PRIMARY KEY (`id`)

) ENGINE=MyISAM DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

 

先用awk处理apache日志,将每一项都用空格分开,那么大家看到下面的好多数字就迷惑了,这到底是个什么东西呢。首先awk '{print 0 ,像apache日志的文本中每行写入一个0,原因是,表结构的第一个字段是自增列,我只要把0导入,0表示默认值,它就可以自动增长了。

cat apache_log| awk '{print 0 " "$1 " "$2 " "$3" "  for (i=4;i> apache_log.txt

 

 

mysql> load data  infile "/root/apache_log.txt" into table apache_log fields terminated by " " lines terminated by '/n';

 

ERROR 13 (HY000): Can't get stat of '/root/apache_log.txt' (Errcode: 13 - Permission denied)

 

mysql> load data local  infile "/root/apache_log.txt" into table apache_log fields terminated by " " lines terminated by '/n';

 

Query OK, 2000 rows affected, 2672 warnings (0.61 sec)

Records: 2000  Deleted: 0  Skipped: 0  Warnings: 2672

 

顺便比较一下load data infile 和load data local infile 区别

 

如果你没有给出local,则服务器按如下方法对其进行定位:

1)如果你的filename为绝对路径,则服务器从根目录开始查找该文件.

2)如果你的filename为相对路径,则服务器从数据库的数据目录中开始查找该文件.

如果你给出了local,则文件将按以下方式进行定位:

1)如果你的filename为绝对路径,则客户机从根目录开始查找该文件.

2)如果你的filename为相对路径,则客户机从当前目录开始查找该文件.

 

mysql> desc apache_log;

+--------------+-----------+------+-----+---------+----------------+

| Field        | Type      | Null | Key | Default | Extra          |

+--------------+-----------+------+-----+---------+----------------+

| id           | int(11)   | NO   | PRI | NULL    | auto_increment |

| hostip       | char(32)  | NO   |     | 0.0.0.0 |                |

| marking      | char(30)  | YES  |     | NULL    |                |

| browser_name | char(30)  | YES  |     | NULL    |                |

| addtime      | char(64)  | NO   |     | NULL    |                |

| time_zone    | char(8)   | NO   |     | NULL    |                |

| method       | char(8)   | NO   |     | NULL    |                |

| resource     | char(64)  | NO   |     | NULL    |                |

| protocol     | char(8)   | YES  |     | NULL    |                |

| status       | int(5)    | YES  |     | NULL    |                |

| bytes        | int(5)    | YES  |     | NULL    |                |

| refer        | char(128) | YES  |     | NULL    |                |

| client_info  | char(128) | YES  |     | NULL    |                |

+--------------+-----------+------+-----+---------+----------------+

13 rows in set (0.00 sec)

 

mysql> select * from apache_log limit 3;

+----+-----------------+---------+--------------+-----------------------+-----------+--------+--------------------------------------------+----------+--------+-------+-------+------------------------------------------------------------------------------------+

| id | hostip          | marking | browser_name | addtime               | time_zone | method | resource                                   | protocol | status | bytes | refer | client_info                                                                        |

+----+-----------------+---------+--------------+-----------------------+-----------+--------+--------------------------------------------+----------+--------+-------+-------+------------------------------------------------------------------------------------+

|  1 | 220.181.108.116 | -       | -            | [21/Aug/2013:23:59:59 | +0800]    | "GET   | /search/prj/tag/2089-2124-2350-2354-1.html | HTTP/1.1 |    200 |  8181 | "-"   | "Mozilla/5.0(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)" |

|  2 | 220.181.165.5   | -       | -            | [21/Aug/2013:23:59:59 | +0800]    | "GET   | /event/bushanping/admin_login.php          | HTTP/1.1 |    200 | 32095 | "-"   | "Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;rv:1.9.1.1)Gecko/20090715Firefox/3.5.1"  |

|  3 | 220.181.165.136 | -       | -            | [21/Aug/2013:23:59:59 | +0800]    | "GET   | /search/diy/server-status/                 | HTTP/1.1 |    404 | 21795 | "-"   | "Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;rv:1.9.1.1)Gecko/20090715Firefox/3.5.1"  |

+----+-----------------+---------+--------------+-----------------------+-----------+--------+--------------------------------------------+----------+--------+-------+-------+------------------------------------------------------------------------------------+

3 rows in set (0.00 sec)

 

导入成功
 

bitsCN.com
Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn