在innodb层使用一个常量WAIT_FOR_READ来控制当需要等待从磁盘读取数据时,需要等待的时间,其默认值在5.5及5.1的版本中都是5000u
在innodb层使用一个常量WAIT_FOR_READ来控制当需要等待从磁盘读取数据时,需要等待的时间,其默认值在5.5及5.1的版本中都是5000us(5ms),,而现在比较牛的存储设备(flush/ssd)一般能在100us内完成读操作,BUG64258认为这个值应该是个可配置的选项,通过设定符合的值以符合我们的硬件设备性能。
这是个static静态变量,在文件buf0buf.c中会用到WAIT_FOR_READ:
在两个函数buf_page_get_gen和buf_page_get_zip会被调用到,这里我们只考虑前者,看看在什么情况下会进入sleep状态
这是个通用的获取数据库page的函数,比较冗长,在经过检查bufferpool、异步请求磁盘页以及对压缩页的处理等一大堆代码后,调用如下代码段:
io_fix的含义不是很了解,看看注释:
其中这里用到的是BUF_IO_READ,应该是read pending,可能是正在等待磁盘读的一个IO状态标识。
从代码里,我们可以看到,当当前的block->page->io_fix为BUF_IO_READ时,会不停的在一个for(;;)里循环,每次检查后,会sleep WAIT_FOR_READ us后再次检查。如果这是一个高速存储设备,sleep的时间太长显然是不合理的。
以下是一个简单的patch,增加了一个选项innobase_wait_for_read,来制sleep的时间,基于percona5.5.18
手头有ssd测试环境的同学,帮忙测试看看有木有效果...