截取与分析日志文件的特定行数的操作

首页

数据库

mysql教程

截取与分析日志文件的特定行数的操作_MySQL

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 27, 2016 pm 01:46 PM

文件日志

在进行操作系统和数据库系统管理时，经常会遇到在日志文件中查找某个字符，或者按照时间截取某个时间段的日志进行分析。
今天早上就遇到一个MySQL数据库上的问题，mysql数据库在0-3点的时候，数据库会话连接，tps，cpu和iowait等都比平时大了许多。
为了定位这个时间段内，到底发生了那些慢查询，消耗了资源，就需要在slow.log慢查询日志进行查询，截取和分析。

在处理过程中，对几种常用的日志截取方法进行了汇总和测试：

截取日志段的的方法汇总与测试
方式一：确定时间段的行号，使用head和tail命令截取 搜索时间： Time: 151212 00:00:00 先到gg，到文件最前面，然后搜索 /Time: 151212 ，得到： 1979016 # Time: 151212 0:00:15

文件总行数为： # wc -l slow-query-169-1212.log 1999422 slow-query-169-1212.log 1999422 limit 0,20;

然后在到文件最后面，G, 搜索4点之后开始的文件 /Time: 151212 4 ，得到： 1987392 # Time: 151212 4:00:05

确定需要查询的时间段行号后，使用head和tail命令进行截取： >>> 1987392 - 1979016; 8376

需要截取的日志，最后行号为 1979016，想用head 命令，然后在用tail命令截取最后的 8376 行即可，命令为： head -n 1979016 slow-query-169-1212.log | tail -n 8376 > slow-query-169-1212_00-03.log

方式二：确定时间段的行号，使用sed命令截取 截取 151212 0-3点之间的慢查询日志： sed -n '1979016,1987392p' slow-query-169-1212.log > slow-query-169-1212_00-03.log

>>> 1987392 - 1979016; 8376 该部分文件，应该有 8376 行数据；确认正常；

方式三：确定时间段行号后，使用awk命令截取 截取 151212 0-3点之间的慢查询日志： awk -F"\n" '{if(NR>=1979016&&NR slow-query-169-1212_00-03.log

方式四：不需先确定行号，直接用sed取出日志段 slow log都是以 # Time: 151212 0:00:15 开头，直接用sed 取出其中的日志： sed -n '/^# Time: 151212 0/,/^# Time: 151212 4/p' slow-query-169-1212.log > part.log --这样的效果，就和刚才上面的效果相同，取出了0 -3 点之间的数据

如果是想取出 151211 这一天的数据，则命令为： sed -n '/^# Time: 151211/,/^# Time: 151212/p' slow-query-169-1212.log > part.log --取出了151211 这一天的日志

注意，使用sed 时，两行之间的选择项一定要对应，不然结果就不是想要的结果了： sed -n '/^# Time: 151212/,/^# Time: 151212 4/p' slow-query-169-1212.log > part.log --前后两个时间点不同，搜索的是全部 # Time: 151212开头的

使用pt工具对截取的日志进行分析 分析这段时间的日志的命令如下： /usr/local/pt/bin/pt-query-digest /data/bbs/slow-query-169-1212_00-03.log > /data/bbs/slow-query-169-1212_00-03-report.log

这是默认的分析和排序方法，可以根据需求，选择其他pt报告分析方法

注1 vim中两种查询方式： 命令模式下，按‘/’，然后输入要查找的字符，Enter。？和/的区别是，一个向前（下）找，一个向后（上）。另外，‘*’可以查找当前光标下的word（完全符合），‘g*’则部分符合，以#代替*表示向后（上）找

注2 几种文件处理方法的简单举例： sed是按行处理的，不会将整个文件加载到内存中，可以放心使用要切出从2012-02-09到2012-09-10的所有数据行，（假设你的日志文件以yyyy-MM-dd的日期格式开头）只需要： sed -n '/^2012-02-09/,/^2012-09-10/p' whole.log > part.log

无论怎么样你都必须使用某一个程序把这个文件读出来，并且用一定的规则来加以过滤。在Linux中，使用cat和grep对文件进行操作已经可以说是最经济合理的了。占用一定的系统资源是肯定的，具体的话跟你使用的cat，grep以及linux内核都有一定关系，所以可能会略有不同。一般不要在系统里出现那么大的日志文件，最好在一开始就做好日志的大小限制以及合理的日志转储和备份。

显示文件的第2到第6行 sed -n '2,6p' file

需要加-n参数. head -n 6 file|tail -n 4

awk 也能达到要求 awk -F"\n" '{if(NR>=2&&NR

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

解释酸的特性（原子，一致性，隔离，耐用性）。Apr 16, 2025 am 12:20 AM

ACID属性包括原子性、一致性、隔离性和持久性，是数据库设计的基石。1.原子性确保事务要么完全成功，要么完全失败。2.一致性保证数据库在事务前后保持一致状态。3.隔离性确保事务之间互不干扰。4.持久性确保事务提交后数据永久保存。

MySQL：数据库管理系统与编程语言Apr 16, 2025 am 12:19 AM

MySQL既是数据库管理系统（DBMS），也与编程语言紧密相关。1）作为DBMS，MySQL用于存储、组织和检索数据，优化索引可提高查询性能。2）通过SQL与编程语言结合，嵌入在如Python中，使用ORM工具如SQLAlchemy可简化操作。3）性能优化包括索引、查询、缓存、分库分表和事务管理。

mySQL：使用SQL命令管理数据Apr 16, 2025 am 12:19 AM

MySQL使用SQL命令管理数据。1.基本命令包括SELECT、INSERT、UPDATE和DELETE。2.高级用法涉及JOIN、子查询和聚合函数。3.常见错误有语法、逻辑和性能问题。4.优化技巧包括使用索引、避免SELECT*和使用LIMIT。

MySQL的目的：有效存储和管理数据Apr 16, 2025 am 12:16 AM

MySQL是一种高效的关系型数据库管理系统，适用于存储和管理数据。其优势包括高性能查询、灵活的事务处理和丰富的数据类型。实际应用中，MySQL常用于电商平台、社交网络和内容管理系统，但需注意性能优化、数据安全和扩展性。

SQL和MySQL：了解关系Apr 16, 2025 am 12:14 AM

SQL和MySQL的关系是标准语言与具体实现的关系。1.SQL是用于管理和操作关系数据库的标准语言，允许进行数据的增、删、改、查。2.MySQL是一个具体的数据库管理系统，使用SQL作为其操作语言，并提供高效的数据存储和管理。

说明InnoDB重做日志和撤消日志的作用。Apr 15, 2025 am 12:16 AM

InnoDB使用redologs和undologs确保数据一致性和可靠性。1.redologs记录数据页修改，确保崩溃恢复和事务持久性。2.undologs记录数据原始值，支持事务回滚和MVCC。

在解释输出（类型，键，行，额外）中要查找的关键指标是什么？Apr 15, 2025 am 12:15 AM

EXPLAIN命令的关键指标包括type、key、rows和Extra。1）type反映查询的访问类型，值越高效率越高，如const优于ALL。2）key显示使用的索引，NULL表示无索引。3）rows预估扫描行数，影响查询性能。4）Extra提供额外信息，如Usingfilesort提示需要优化。

在解释中使用临时状态以及如何避免它是什么？Apr 15, 2025 am 12:14 AM

Usingtemporary在MySQL查询中表示需要创建临时表，常见于使用DISTINCT、GROUPBY或非索引列的ORDERBY。可以通过优化索引和重写查询避免其出现，提升查询性能。具体来说，Usingtemporary出现在EXPLAIN输出中时，意味着MySQL需要创建临时表来处理查询。这通常发生在以下情况：1)使用DISTINCT或GROUPBY时进行去重或分组；2)ORDERBY包含非索引列时进行排序；3)使用复杂的子查询或联接操作。优化方法包括：1)为ORDERBY和GROUPB

See all articles