首頁  >  文章  >  資料庫  >  MySQL執行緒處於Opening tables的問題解決(附範例)

MySQL執行緒處於Opening tables的問題解決(附範例)

不言
不言轉載
2019-01-26 11:30:115491瀏覽

這篇文章帶給大家的內容是關於MySQL執行緒處於Opening tables的問題解決(附範例),有一定的參考價值,有需要的朋友可以參考一下,希望對你有幫助。

問題描述

最近有一台MySQL5.6.21的伺服器,在應用程式發布後,並發執行緒Threads_running迅速升高,達到2000左右,大量執行緒處於等待Opening tables、closing tables狀態,應用端相關邏輯存取逾時。

【分析過程】

1、16:10應用程式發布結束後,Opened_tables不斷增加,如下圖所示:
MySQL執行緒處於Opening tables的問題解決(附範例)

查看當時故障期間抓取的pt-stalk日誌文件,時間點2019-01-18 16:29:37,Open_tables 的值為3430,而table_open_cache的設定值為2000。
當Open_tables值大於table_open_cache值時,每次新的session開啟表,有些無法命中table cache,而必須重新開啟表。這樣反應出來的現象就是有大量的執行緒處於opening tables狀態。

2、這個實例下的表,加上系統資料庫下總計851張,遠小於table_open_cache的2000,為什麼會導致Open_tables達到3430呢
從官方文件中可以得到解釋,
https://dev.mysql.com/doc/refman/5.6/en/table-cache.html

table_open_cache is related to max_connections. For example, for 200 concurrent running connections, specify a table cache size of at least 200 * N, where N is the maximum number of tables per join in any of the queries which you execute.

當時並發線程數達到1980,假設這些並發連線中有30%是訪問2張表,其他都是單表,那麼cache size就會達到(1980*30%*2 1980*70%*1)=2574

3、QPS在發布前後都比較平穩,從外部請求來看並沒有突增的連線請求,但在發布後threads_running上升到接近2000的高位,一直持續。猜測是由於某個發佈的SQL語句觸發了問題。

4、查看當時抓取的processlist信息,有一句SQL並發訪問很高,查詢了8張物理表,SQL樣本如下:

<code>select id,name,email from table1 left join table2<br/>union all<br/>select id,name,email from table3 left join table4<br/>union all<br/>select id,name,email from table5 left join table6<br/>union all<br/>select id,name,email from table7 left join table8<br/>where id in (&#39;aaa&#39;);</code>

5、在測試環境中建立相同的8張表,清空表緩存,單一session執行SQL前後對比,Open_tables的值會增加8,如果高並發的情況下,Open_tables的值就會大幅增加。

問題重現

在測試環境上模擬高並發存取的場景,並發1000個執行緒同時執行上面的SQL語句,重現了生產環境類似的現象,Open_tables迅速達到3800,大量進程處於Opening tables、closing tables狀態。

優化方案

1、 定位到問題原因後,我們與開發同事溝通,建議優化該SQL,降低單句SQL查詢表的數量或大幅降低該SQL的並發存取頻率。
不過開發同事還沒來的及優化,生產環境故障又出現了。當時DBA排障時將table_open_cache從2000增加4000,CPU使用率上升,效果並不明顯,等待Opening tables的問題依然存在。

2、 分析故障期間抓取的pstack信息,用pt-pmp聚合後,看到大量線程在open_table時等待mutex資源:

#0  0x0000003f0900e334 in __lll_lock_wait () from /lib64/libpthread.so.0
#1  0x0000003f0900960e in _L_lock_995 () from /lib64/libpthread.so.0
#2  0x0000003f09009576 in pthread_mutex_lock () from /lib64/libpthread.so.0
#3  0x000000000069ce98 in open_table(THD*, TABLE_LIST*, Open_table_context*) ()
#4  0x000000000069f2ba in open_tables(THD*, TABLE_LIST**, unsigned int*, unsigned int, Prelocking_strategy*) ()
#5  0x000000000069f3df in open_normal_and_derived_tables(THD*, TABLE_LIST*, unsigned int) ()
#6  0x00000000006de821 in execute_sqlcom_select(THD*, TABLE_LIST*) ()
#7  0x00000000006e13cf in mysql_execute_command(THD*) ()
#8  0x00000000006e4d8f in mysql_parse(THD*, char*, unsigned int, Parser_state*) ()
#9  0x00000000006e62cb in dispatch_command(enum_server_command, THD*, char*, unsigned int) ()
#10 0x00000000006b304f in do_handle_one_connection(THD*) ()
#11 0x00000000006b3177 in handle_one_connection ()
#12 0x0000000000afe5ca in pfs_spawn_thread ()
#13 0x0000003f09007aa1 in start_thread () from /lib64/libpthread.so.0
#14 0x0000003f088e893d in clone () from /lib64/libc.so.6

這時table_cache_manager中的mutex衝突非常嚴重。
由於MySQL5.6.21下table_open_cache_instances參數的預設值為1,想到增大table_open_cache_instances參數,增加表格快取分區,應該可以緩解爭用。

3、 在測試環境上,我們調整兩個參數table_open_cache_instances=32,table_open_cache=6000,同樣並發1000個執行緒執行問題SQL,這次等待Opening tables、closing tables的執行緒消失了,MySQL的執行緒消失了,MySQL的QPS也從12000上升到55000。
比較相同情況下,只調整table_open_cache=6000,等待Opening tables的進程數從861下降到203,問題有所緩解,有600多個進程已經從等待Opening tables變成運行狀態,QPS上升到40000左右,但不能根治。

原始碼分析

查了下程式碼有關table_open_cache的相關邏輯:
1、Table_cache::add_used_table函數如下,當新的連線開啟的表在table cache中不存在時,開啟表格加入used tables list:

bool Table_cache::add_used_table(THD *thd, TABLE *table)
{
  Table_cache_element *el;

  assert_owner();

  DBUG_ASSERT(table->in_use == thd);

  /*
    Try to get Table_cache_element representing this table in the cache
    from array in the TABLE_SHARE.
  */
  el= table->s->cache_element[table_cache_manager.cache_index(this)];

  if (!el)
  {
    /*
      If TABLE_SHARE doesn&#39;t have pointer to the element representing table
      in this cache, the element for the table must be absent from table the
      cache.

      Allocate new Table_cache_element object and add it to the cache
      and array in TABLE_SHARE.
    */
    DBUG_ASSERT(! my_hash_search(&m_cache,
                                 (uchar*)table->s->table_cache_key.str,
                                 table->s->table_cache_key.length));

    if (!(el= new Table_cache_element(table->s)))
      return true;

    if (my_hash_insert(&m_cache, (uchar*)el))
    {
      delete el;
      return true;
    }

    table->s->cache_element[table_cache_manager.cache_index(this)]= el;
  }

  /* Add table to the used tables list */  
  el->used_tables.push_front(table);

  m_table_count++;  free_unused_tables_if_necessary(thd);

  return false;
}

2、每次add_used_table會呼叫Table_cache::free_unused_tables_if_necessary函數,當滿足m_table_count > table_cache_size_per_necessary函數,當滿足m_table_count > table_cache_size_per_instance &tablem_unun;中多餘的cache。其中table_cache_size_per_instance= table_cache_size / table_cache_instances,MySQL5.6的預設配置是2000/1=2000,當m_table_count值大於2000並且m_unused_tables非空時就執行行中的這樣m_table_count就是Open_tables的值正常會維持在2000上下。

void Table_cache::free_unused_tables_if_necessary(THD *thd)
{
  /*
    We have too many TABLE instances around let us try to get rid of them.

    Note that we might need to free more than one TABLE object, and thus
    need the below loop, in case when table_cache_size is changed dynamically,
    at server run time.
  */
  if (m_table_count > table_cache_size_per_instance && m_unused_tables)
  {
    mysql_mutex_lock(&LOCK_open);
    while (m_table_count > table_cache_size_per_instance &&
           m_unused_tables)
    {
      TABLE *table_to_free= m_unused_tables;      
      remove_table(table_to_free);
      intern_close_table(table_to_free);
      thd->status_var.table_open_cache_overflows++;
    }
    mysql_mutex_unlock(&LOCK_open);
  }
}

3、增大table_cache_instances為32,當Open_tables超過(2000/32=62)時,就會滿足條件,加速上述邏輯中m_unused_tables的清理,使得table cache中數量進一步減少,會導致Table_open_cache_overflows升高。

4、当table_open_cache_instances从1增大到32时,1个LOCK_open锁分散到32个m_lock的mutex上,大大降低了锁的争用。

/** Acquire lock on table cache instance. */
  void lock() { mysql_mutex_lock(&m_lock); }
  /** Release lock on table cache instance. */
  void unlock() { mysql_mutex_unlock(&m_lock); }

解决问题

我们生产环境同时采取下面优化措施,问题得以解决:
1、 读写分离,增加read节点,分散master库的压力;
2、 调整table_open_cache_instances=16;
3、 调整table_open_cache=6000;

总结

当出现Opening tables等待问题时,
1、建议找出打开表频繁的SQL语句,优化该SQL,降低单句SQL查询表的数量或大幅降低该SQL的并发访问频率。

2、设置合适的table cache,同时增大table_open_cache_instances和 table_open_cache参数的值。

以上是MySQL執行緒處於Opening tables的問題解決(附範例)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:cnblogs.com。如有侵權,請聯絡admin@php.cn刪除