MySQL”海量数据”查询性能分析_MySQL-mysql教程-PHP中文網

首頁

資料庫

mysql教程

MySQL”海量数据”查询性能分析_MySQL

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 01, 2016 pm 01:50 PM

查詢結構

bitsCN.com

最近做了一次MySQL所谓的”海量数据”查询性能分析.

表结构

dt dt2 dt3 it it2 it3 id id id id id id int PK ext1 ext1 varchar(256) time time time time time time int/datetime KEY ext2 ext2 ext2 ext2 varchar(128)

说明, MyISAM引擎, dt表示时间字段使用datetime类型, it表示时间字段使用int类型.

初始数据

首先生成100K个UNIX时间戳(int), 然后随机选取10M次, 每一次往6个表里插入一条记录(当time字段是datetime类型时, 做类型转换). 所以每一个表都有10M条记录. ext1和ext2字段会用随机的字符串填充.

SQL查询

使用的查询SQL语句如:

select SQL_NO_CACHE count(*) from it where time>10000;select SQL_NO_CACHE count(*) from dt where time>from_unixtime(10000);select SQL_NO_CACHE * from it where time>10000 order by time limit 1;select SQL_NO_CACHE * from it use key(PRIMARY) where time>10000 order by id limit 1;

SQL_NO_CACHE用于消除查询结果缓存的影响. use key用于指定查询时使用的索引. 统计每一条SQL的执行时间(单位s)和满足WHERE条件的记录总数(total), it-tm表示在dt表上执行SQL的耗时, 并explain得到key和extra, 结果如下.

where total select orderby key it-tm dt-tm it2-tm dt2-tm it3-tm dt3-tm extra time>10000 8999050 count(*) time 3.52 4.28 3.74 4.49 3.53 4.47 where; index count(time) time 3.44 4.00 3.69 4.36 3.56 4.26 where; index count(id) NULL 1.44 1.92 4.30 4.60 4.79 4.98 where * time time 0.00 0.00 0.00 0.00 0.00 0.00 where * id time 14.81 15.38 19.37 20.30 20.94 21.42 where; filesort * id PK 0.00 0.03 0.00 0.02 0.00 0.04 where time>50000 4987990 count(*) 1.90 2.36 2.02 2.41 1.99 2.42 count(time) 1.90 2.23 2.01 2.32 1.96 2.29 count(id) 1.48 1.91 4.25 4.61 4.80 5.12 * time 0.00 0.00 0.00 0.00 0.00 0.00 * id 8.15 8.77 10.74 11.36 11.59 11.79 * id 0.00 0.00 0.00 0.00 0.00 0.00 time>80000 1991982 count(*) 0.76 0.95 0.83 0.98 0.80 1.00 count(time) 0.77 0.91 0.81 0.91 0.83 0.92 count(id) 1.38 1.86 4.17 4.49 4.71 5.02 * time 0.00 0.00 0.00 0.00 0.00 0.00 * id 3.26 3.44 4.26 4.51 4.56 4.76 * id 0.00 0.00 0.00 0.00 0.00 0.00 time>99900 10871 count(*) 0.00 0.00 0.00 0.01 0.01 0.00 count(time) 0.01 0.01 0.01 0.00 0.01 0.01 count(id) 0.01 0.01 0.02 0.03 0.02 0.02 * time 0.00 0.00 0.00 0.00 0.00 0.00 * id 0.02 0.02 0.03 0.03 0.03 0.03 * id 0.00 0.00 0.00 0.00 0.00 0.00

分析和结论

count(*), count(time)和count(id)的对比. 结果有较大变化. 当表的字段只有2个且查询条件较宽松(即符合条件的记录数较多)时, count(id)比count(*)快很多, 但是, 当表中还有其它的字段时, count(id)反而更慢了. 虽然id是主键, time是索引列, 但是select count(id) where time并没有用到索引, 而是进行全表扫描. 当对count(*)进行ignore key(time)时, 查询时间和count(id)相同.证明当结果集较大时索引导致查询变慢,应该是全表扫描进行的是连续的磁盘IO和内存操作, 而使用索引是进行随机的磁盘IO和内存操作, 并且MyISAM存储索引的BTree结构占用更多的空间. 当WHERE条件约束更严格, total的值小到一定程度时, 全表扫描比使用索引慢, 因为索引极大减少了磁盘IO和内存操作.

排序字段和索引的使用. 当有排序且LIMIT(偏移为0)时,如果查询时使用的索引不是排序字段的索引, 那么速度非常慢. 当偏移不为0时, 如果使用排序列的索引, 要考虑偏移可能导致扫描的记录数, 所以应该根据情况选取合适的索引.

判断符合条件的记录是否存在, 使用select * limit 1速度要比select count(*)计数快得多.

时间字段类型的选择. int比datetime快, 但差距不是很明显.

无论如何, 条件限制得越严格, 查询就会越快.

另外, 根据随机id更新时, 大约能达到5K行/s.

列的先后顺序对查询性能的影响也非常大.

bitsCN.com

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

如何查证JBL耳机的真假信息Dec 29, 2023 pm 10:54 PM

jbl耳机是很多听音乐用户的首选，好评如潮，但是对于假货大家还是非常的害怕的，那么jbl耳机怎么查询真伪来避免这个问题呢？下面就看看怎么查询吧。jbl耳机怎么查询真伪：1、首先进入“中国商品信息验证中心”。2、然后输入查询码，即可查看是否正确从而判断是不是真货。3、也可以去通过耳机声音的清晰度来进行分辨。正牌的耳机声音是非常的清晰的，音质也不会出现改变。假牌的耳机声音会有很多的掺杂，音质也是特别的差。4、大家可以将自己的耳机声音开到最大，看看是不是很和谐，真耳机声音都是一样的。但是假耳机的声音开

steam怎么查询账号idFeb 07, 2024 pm 12:09 PM

Steam是一个整合游戏下载平台，玩家可以在该平台上购买正版的游戏，也可以跟其他玩家进行沟通讨论交流。有小伙伴知道steam怎么查询账号id吗，下面小编就给大家详细介绍一下steam查询账号id的方法，有需要的小伙伴可以来看一看。查询方法：1、双击打开软件，点击上方菜单栏中的"查看"。2、然后点击下方选项列表中的"设置"。3、在打开的窗口界面中，点击左侧栏中的"账户"选项，然后找到右侧中的"账户名称"即可查询到账号id。

买过比特币怎么查询,怎么看自己买没买过比特币Feb 04, 2024 am 08:09 AM

现在怎么买比特币的800字公众号文章随着比特币的价格飙升，越来越多的人开始关注比特币，也有越来越多的人想要投资比特币。但是，投资比特币也是有风险的，所以在投资之前，需要了解相关知识，并做好风险控制。那么现在怎么买比特币呢？首先，为了投资比特币，您需要准备一个比特币钱包。比特币钱包是一种软件，用于存储、发送和接收比特币资金。根据您的需求，有多种类型的比特币钱包可供选择，例如硬件钱包、软件钱包和网络钱包。每种钱包都有其独特的特点，您可以根据自己的需求选择适合自己的。其次，你需要选择一个可靠的比特币交

PHP表单处理：表单数据查询与筛选Aug 07, 2023 pm 06:17 PM

PHP表单处理：表单数据查询与筛选引言在Web开发中，表单是一种重要的交互方式，用户可以通过表单向服务器提交数据并进行进一步的处理。本文将介绍如何使用PHP处理表单数据的查询与筛选功能。表单的设计与提交首先，我们需要设计一个包含查询与筛选功能的表单。常见的表单元素包括输入框、下拉列表、单选框、复选框等，根据具体需求进行设计。用户在提交表单时，会将数据以POS

PHP如何查询Oracle数据库中的数据Jul 13, 2023 pm 07:34 PM

PHP如何查询Oracle数据库中的数据随着互联网时代的到来，网站和应用程序的开发越来越普遍。而数据库作为数据存储和管理的关键技术，也成为了开发者们必备的工具之一。其中，Oracle数据库作为一款功能强大、稳定可靠的关系型数据库管理系统，在企业级应用中得到了广泛应用。而在开发网站或应用程序时，如何使用PHP进行Oracle数据库的查询是一个非常重要的问题。在

查询从节点X开始，距离最多为D的子树中的最小权重Aug 25, 2023 am 11:25 AM

在进行计算机编程时，有时需要求出源自特定节点的子树的最小权重，条件是该子树不能包含距离指定节点超过D个单位的节点。这个问题出现在各个领域和应用中，包括图论、基于树的算法和网络优化。子树是较大树结构的子集，指定的节点作为子树的根节点。子树包含根节点的所有后代及其连接边。节点的权重是指分配给该节点的特定值，可以表示其重要性、重要性或其他相关指标。在这个问题中，目标是找到子树中所有节点中的最小权重，同时将子树限制在距离根节点最多D个单位的节点。在下面的文章中，我们将深入研究从子树中挖掘最小权重的复杂性

如何通过优化查询中的LIKE操作来提高MySQL性能May 11, 2023 am 08:11 AM

MySQL是目前最流行的关系型数据库之一，但是在处理大量数据时，MySQL的性能可能会受到影响。其中，一种常见的性能瓶颈是查询中的LIKE操作。在MySQL中，LIKE操作是用来模糊匹配字符串的，它可以在查询数据表时用来查找包含指定字符或者模式的数据记录。但是，在大型数据表中，如果使用LIKE操作，它会对数据库的性能造成影响。为了解决这个问题，我们可

MySQL中如何进行数据的时序存储和查询？Jul 30, 2023 pm 03:09 PM

MySQL中如何进行数据的时序存储和查询？在许多应用场景中，对于数据的时序性要求是非常常见的，比如传感器数据的监测、日志记录等。MySQL作为一种常用的关系型数据库，也提供了一些方法来进行时序数据的存储和查询。一种常见的方法是使用时间戳字段来存储数据的时间信息。在MySQL中，可以使用TIMESTAMP或DATETIME类型的字段来存储时间。TIMESTAM

See all articles