Mysql怎么判断繁忙 checkpoint机制 innodb的主要参数

阅读量：5892 次

发布时间：2019-06-19

本文共 13091 字，大约阅读时间需要 43 分钟。

Mysql怎么判断繁忙，innodb的主要参数，checkpoint机制,show engine innodb status

2018年07月13日 15:45:36 阅读数：295

show engine innodb status \G

mysql> show engine innodb status \G

---LOG

（Innodb 事务日志相关信息，包括当前的日志序列号（Log sequence number），已经刷新同步到那个序列号，最近的check point到那个序列号了。除此之外，还显示了系统从启动到现在已经做了多少次check point，多少次日志刷新。）

---（注：小括号为官方解释。）

Log sequence number 2560255（当前的日志序列号,log buffer中已经写入的LSN值,//字节，日志生成的最新位置，最新位置出现在log buffer中）

Log flushed up to 2560255（刷新到日志重做日志文件的lsn,已经刷新到redo logfile的LSN值//字节，日志已经写入到log file的位置，1-2=log buffer日志量，最好是<=1M）

Pages flushed up to 2560255（写入磁盘的脏页的lsn。记录在checkpoint中//字节，脏页的数量(日志字节数来衡量)，2-3=脏页的数量(日志字节为单位)）

Last checkpoint at 2560246（刷新到磁盘的lsn,最近一次checkpoint时的LSN值//字节，共享表空间上的日志记录点，最后一次检查点，及崩溃恢复时指定的起点，3-4就是崩溃恢复多跑的日志，值越大说明需要提升checkpoint的跟进速度）

0 pending(挂起) log flushes, 0 pending chkp writes

10 log i/o's done, 0.00 log i/o's/second

解析：

Log sequence number：日志序列号：现在已经产生到的日志量（字节）
- 不同时刻的lsn的值的差值/时间差==日志的产生速度

Log flushed up to：刷出去了多少日志
- Log sequence number - Log flushed up to== 当前logbuffer的值
- 所以，此值应<<1M
- 不同时刻的差值/时间间隔==日志的写入速度

Pages flushed up to
- Log sequence number - Pages flushed up to 值很小，说明脏页写入的很快

Last checkpoint at：检查点。系统启动的时候，日志恢复的起点，肯定比Pfut的值低。防止系统崩
- Log flushed up to - Last checkpoint at == 系统要恢复的日志数
- Pages flushed up to - Last checkpoint at == checkpoint的跟进速度，如果大的话，说明checkpoint需要增大。

这里写图片描述

问：有5个2个G的日志，Log flushed up to - Pages flushed up to 的值必须保证至少是多大？

答：6个G。因为，当前用着一个，必须保证想覆盖的下一个是写进去的，所以，只能是3个日志没写进去，即6个G。

四个参数能反应出来什么

1.日志的生成速度？

不同时刻的Log sequence number的值的差/时间差==每秒生成的日志量

2.日志的写入速度？

Log flushed up to

3.脏页的写入速度？

Log flushed up to - Pages flushed up to ==脏页的写入速度

4.数据库的启动时间是多少？

启动时要回滚的日志数

Checkpoint详解

引子

checkpoint是一个内部事件，这个事件激活以后会触发数据库写进程(DBWR)将数据缓冲(DATABUFFER CACHE)中的脏数据块写出到数据文件中。

check point是做什么的

在数据库系统中，写日志和写数据文件是数据库中IO消耗最大的两种操作，在这两种操作中写数据文件属于分散写，写日志文件是顺序写，因此为了保证数据库的性能，通常数据库都是保证在提交(commit)完成之前要先保证日志都被写入到日志文件中，而脏数据块则保存在数据缓存(buffer cache)中再不定期的分批写入到数据文件中。也就是说日志写入和提交操作是同步的，而数据写入和提交操作是不同步的。这样就存在一个问题，当一个数据库崩溃的时候并不能保证缓存里面的脏数据全部写入到数据文件中，这样在实例启动的时候就要使用日志文件进行恢复操作，将数据库恢复到崩溃之前的状态，保证数据的一致性。检查点是这个过程中的重要机制，通过它来确定，恢复时哪些重做日志应该被扫描并应用于恢复。

一般所说的checkpoint是一个数据库事件(event)，checkpoint事件由checkpoint进程(LGWR/CKPT进程)发出，当checkpoint事件发生时DBWn会将脏块写入到磁盘中，同时数据文件和控制文件的文件头也会被更新以记录checkpoint信息。

作用

checkpoint主要2个作用：

保证数据库的一致性，这是指将脏数据写入到硬盘，保证内存和硬盘上的数据是一样的;

缩短实例恢复的时间，实例恢复要把实例异常关闭前没有写出到硬盘的脏数据通过日志进行恢复。如果脏块过多，实例恢复的时间也会很长，检查点的发生可以减少脏块的数量，从而提高实例恢复的时间。

通俗的说checkpoint就像word的自动保存一样。

Checkpoint所做的事情

将缓冲池（buffer pool）中的脏页刷回磁盘。每次刷新多少页到磁盘，每次从哪里取脏页，以及什么时间触发Checkpoint。在InnoDB存储引擎内部，Checkpoint负责这些事。

checkpoint分类

有2种Checkpoint：

Sharp Checkpoint（完全检查点）

Fuzzy Checkpoint（模糊检查点）

checkpoint的具体解释

1.Sharp Checkpoint（完全检查点）

数据库关闭时，会将所有的脏页都刷新回磁盘，这是默认的工作方式。参数 innodb_fast_shutdown=1

2.Fuzzy Checkpoint（模糊检查点）

但是若在数据库运行时也使用完全检查点，那数据库的可用性就会受到很大影响。

所以，在InnoDB存储引擎内部使用Fuzzy Checkpoint进行页的刷新，即只刷新一部分脏页，而不是将所有的脏页刷回磁盘。

Fuzzy checkpoint工作过程

先读LRU list，把一部分脏页（相对冷的）写到磁盘上；

再找Frush list，把最早脏的写到磁盘上。（更新检查点）

Fuzzy Checkpoint又分为4种

①Master Thread Checkpoint

②FLUSH_LRU_LIST Checkpoint

③Async/Sync Flush Checkpoint（异步/同步 flush检查点）

④Dirty Page too much Checkpoint

1）Master Thread Checkpoint

对于Master Thread 中发生的Checkpoint，差不多以每秒或每十秒的速度从缓冲池的脏页列表中刷新一定比例的页回去磁盘。这个过程是异步的，即此时InnoDB存储引擎可以进行其他的操作，用户查询线程不会阻塞。

–》即：常规性的fuzzy checkpoint，写入操作不阻塞用户线程

2）FLUSH_LRU_LIST Checkpoint

FLUSH_LRU_LIST Checkpoint是因为InnoDB存储引擎需要保证LRU列表中需要有差不多100个空闲页可供使用。在innodb1.1X版本以前，需要检查LRU列表中是否有足够的可用空间操作发生在用户查询线程中，显然会阻塞用户的查询操作。若没有100个可用空闲页，那么innodb会将LRU列表末端的页移除。如果这些页中有脏页，那就要进行Checkpoint，而这些页是来自LRU列表的，因此成为FLUSH_LRU_LIST Checkpoint。

–》即：Flush lru list checkpoint：flush list上的脏页数量超过阈值；会阻塞用户线程。

3）Async/Sync Flush list Checkpoint

（在数据库的报错日志里能够看到！）

Async/Sync Flush list Checkpoint指的是重做日志文件不可用的情况，这时需要强制将一些页刷新回磁盘，而此时脏页是从脏页列表中选取的。若将已经写入到redo log的LSN（Log sequence number）记作redo_lsn，将已经刷新回磁盘最新页的LSN记为checkpoint_lsn，则可定义：

redo_lsn - checkpoint_lsn == checkpoint_age

又定义：

async_water_mark==75% * total_redo_log_file_size
sync_water_mark==90% * total_redo_log_file_size

假设每个redo log的大小是1G，并且定义两个redo log，则redo log总共2G。

则，async_water_mark=1.5G，sync_water_mark=1.8G。则：

① checkpoint_age< async_water_mark 时，不需要刷新任何脏页到磁盘；

② **async_water_mark < checkpoint_age<
sync_water_mark**（即：有25%的日志能被覆盖时）时，触发Async Flush，从Async Flush
列表中刷新足够的脏页回磁盘。最终满足①；

③ checkpoint_age > sync_water_mark
时（即有90%的日志能被覆盖时），极少发生，除非设置的redo log太小，并且在进行类似LOAD DATA的BULK
INSERT操作。此时触发Sync Flush操作，从Flush列表中刷新足够的脏页回磁盘，使得刷新后满足①。

注意：在较早版本的innodb中，Async Flush list Checkpoint会阻塞发现问题的用户查询线程，而Sync Flush list Checkpoint会阻塞所有的用户查询线程，并且等待脏页刷新完成。

但在5.6版本（即innodb1.2x版本）开始，这部分的刷新操作同样放入到了单独的Page Cleaner Thread中，所以不会再阻塞用户查询线程了。

这里写图片描述

4）Dirty Page too much Checkpoint

即脏页的数量太多，导致innodb存储引擎强制进行检查点。

目的：还是为了保证buffer pool缓冲池中有足够的可用的页。

可由参数 innodb_max_dirty_pages_pct 控制。

这里写图片描述

innodb_max_dirty_pages_pct参数官方文档解释：

这里写图片描述

innodb_max_dirty_pages_pct_lwm参数解释：

这里写图片描述

发现，该参数值默认为75，即：当buffer pool中脏页的数量占据75%时，强制进行Checkpoint，刷新一部分的脏页到磁盘。

（在innodb1.0x以前，该参数默认是90，之后的版本都为75。）

能够触发写操作的一些因素

1. 常规性写入操作：（影响不大）

1.master thread

2.io write 写入线程

3.每次写入的量 –》怎么控制？增加写入线程的数量。

2. flush 列表太大

会触发对用户线程的阻塞

增加后：频繁的写。（影响不大）

3. 可以覆盖的日志太少了：（影响大）

增加日志的大小和组的数量

避免同步和异步

脏页的总量【一般调成90%】（影响大）

这里写图片描述

防止因为写入操作而导致系统hang住！

控制写入操作

1.控制每次写入的量

1.innodb_io_capacity（可以调节每次写入的数据量）
- 假设我们使用闪盘，io可以达到50万iops
- 【IOPS：Input/Output Operations Per Second，即每秒进行读写（I/O）操作的次数，多用于数据库等场合，衡量随机访问的性能。】
  200,300,400,500
  看一下脏页的数量是否还是过多（指标）

2.innodb_lru_scan_depth
- 每次查找脏页的深度

3.调整log file的大小和组数

4.脏页的比例：75%（默认）、90%（推荐）（但系统崩溃的时候恢复时会比较慢）…

如何来确认系统的写入操作是大还是小

1、如何来调整写入这个操作？

innodb_io_capacity（容量）–》调大可加大脏页写入速度

innodb_lru_scan_depth –》调大可加大脏页写入速度

增加log file组数和大小

加大或者缩小innodb_max_dirty_pages_pct

2、为什么增大或者减小写入操作？

1.我们要确认系统是写入还是读取为主的系统（调不调）
如果是以写入为主的系统，就需要加大上面的相关参数。

2.观察我们的系统的io状况【iostat -x 1】【%util达到70%左右、w/s也很好，说明参数调的很好】
来确认调整的合理程度。（调多少）

3.通过double write 写入来监控我们的系统的写入压力够不够（让写入压力大一些好）

这里写图片描述

（如果w/s太大，就是写的太快，此时就应降低写功能）

wrqm/s 反映的是double write的功能
InnoDB_dblwr_writes：写的次数
InnoDB_dblwr_pages_written：写的页数
pages：writes的值能够看一次写多少页】

4.通过日志产生速度和脏页刷新速度的差值

5.脏页和pool的比值（看此时脏页的数量大小）

参数innodb_fast_shutdown脏页刷新控制参数

在关闭时，参数innodb_fast_shutdown影响着表的存储引擎为innodb的行为。该参数可取值为0、1、2，默认值为1。

0：表示在MySQL数据库关闭时，innodb需要完成所有的full purge（）和merge（合并） insert buffer
，并且将所有的脏页刷新回磁盘。这需要一段时间，有时甚至需要几个小时来完成。如果在进行innodb升级时，必须将这个参数调为0，然后再关闭数据库。

1：是参数innodb_fast_shutdown的默认值，表示不需要完成上述的full purge和merge
insert操作，但是在缓冲池中的一些数据脏页还是会刷新回磁盘。

2：表示不完成full purge和merge insert
buffer操作，也不将缓冲池中的数据脏页写回磁盘，而是将日志都写入日志文件。这样不会有任何事务的丢失，但是下次MySQL数据库启动时，会进行恢复操作。

当正常关闭MySQL数据库时，下次的启动应该会非常“正常”。但是如果没有正常地关闭数据库，比如用kill 命令关闭数据库，在MySQL数据库运行中重启了服务器，或者在关闭数据库时，将参数innodb_fast_shutdown设为了2时，下次MySQL数据库启动时都会对InnoDB存储引擎的表进行恢复操作。

恢复参数 innodb_force_recovery

参数 innodb_force_recovery 影响了整个innodb存储引擎恢复的状况。该参数值默认为0，代表当发生需要恢复时，进行所有的恢复操作，当不能进行有效恢复时，如数据页发生了corruption（损坏），mysql数据库可能发生宕机（crash），并把错误写到错误日志去。

但是，在某些情况下，可能并不需要进行完整的恢复操作，因为用户自己知道怎么恢复。比如在对一个表进行alter table操作时发生意外了，数据库重启时会对innodb表进行回滚操作，对于一个大表来说这需要很长时间，可能是几个小时。这时用户可以自行进行恢复，如可以把表删除，从备份中重新导入数据到表，可能这些操作的速度要远远快于回滚操作。

参数innodb_force_recovery 还可以设置为6个非零值：1~6。大的数字包含了前面所有小数字表示的影响：

1：SRV_FORCE_IGNORE_CORRUPT：忽略检查到的corrupt页。

2：SRV_FORCE_NO_TRX_UNDO：阻止Master Thread 线程的运行，如Master Thread线程需要进行full purge操作，而这会导致crash。

3：SRV_FORCE_NO_TRX_UNDO：不进行事务的回滚操作。

4：SRV_FORCE_NO_IBUF_MERGE：不进行插入缓冲的合并操作。

5：SRV_FORCE_NO_UNDO_LOG_SCAN：不查看撤销日志（undo log），InnoDB存储引擎会将未提交的事务视为已提交。

6：SRV_FORCE_NO_LOG_REDO：不进行前滚的操作。

需要注意：在设置了参数innodb_force_recovery大于0后，用户可以对表进行select、create和drop操作，但insert、update和delete这类DML操作是不允许的。

前滚和回滚

如果系统因为执行了一个非常大的DML或者DDL操作，导致系统hang住，我们想断掉这个操作，怎么办？

①kill thread –》要前滚

②kill process –》要回滚

数据库性能监控

1.性能指标

怎么来监控？

（1）通过show engine innodb status \G 来看log的部分：

Log sequence number 2560255 （当前的日志序列号）

Log flushed up to 2560255 （刷新到日志重做日志文件的lsn）

Pages flushed up
to 2560255 （写入磁盘的脏页的lsn。记录在checkpoint中）

Last checkpoint
at 2560246 （刷新到磁盘的lsn）

0 pending(挂起) log flushes, 0 pending chkp writes

10 log i/o's done, 0.00 log i/o's/second

（2）通过一些参数来看：

innodb_dblwr_pages_written：看写的快慢

Com_select

Com_delete

Com_update -》增删改查的统计量

Com_commit -》提交的事务数

InnoDB_dblwr_writes：写的次数

InnoDB_dblwr_pages_written：写的页数
【pages：writes的值能够看一次写多少页】

（3）iostat

观察系统的io状况的命令

压力测试的工具

测IO的：测出IOPS–》fifo、orion等

测网络的：测出吞吐量–》传包

测数据库
- tpcc-mysql ：它自己建立业务系统，模拟业务操作，进行压力测试。
- loadrunner：可以模拟我们的真实的生产系统，进行压力测试。（业务部门做的，需要开发编程等…）
- tcpcopy：引流进行压力测试。

TPCCMySQL 小工具的使用

README手册：

1.Build binaries

cd scr ; make ( you should have mysql_config available in $PATH)

2.
Load data

① create database mysqladmin create tpcc1000

② create tables mysql tpcc1000 < create_table.sql

③create indexes and FK ( this step can be done after loading data) mysql tpcc1000 < add_fkey_idx.sql

④ populate data

1）simple step tpcc_load -h127.0.0.1 -d tpcc1000 -u root -p "" -w 1000 |hostname:port| |dbname| |user| |password| |WAREHOUSES| ref. tpcc_load --help for all options