如何优化MySQL中的SQL语句

在MySQL中如何优化SQL语句

1.概述

在应用系统开发过程中，由于初期数据量小，开发人员写SQL语句时更重视功能上的实现，但是当应用系统正式上线后，随着生产数据量的急剧增长，很多SQL语句开始逐渐显露出性能问题，对生产环境的影响也越来越大，此时这些有问题的SQL语句就成为整个系统性能的瓶颈，因此我们必须要对它们进行优化。

2.通过show status命令了解各种SQL的执行频率

MySQL客户端连接成功后，通过show [session|global]status命令可以提供服务器状态信息，也可以在操作系统上使用mysqladmin extended-status命令获得这些消息。show [session|global] status可以根据需要加上参数“session”或者“global”来显示session级（当前连接）的统计结果和global级（自数据库上次启动至今）的统计结果。如果不写，默认使用参数是“session”。

下面的命令显示了当前session中所有统计参数的值：

-- 查看会话所有统计的值
SHOW STATUS LIKE '
Com_%'
;

Or
SHOW SESSION STATUS LIKE '
Com_%'
;

如何优化MySQL中的SQL语句

下面的命令显示了当前global中所有统计参数的值：

-- 查看全局所有统计的值

SHOW GLOBAL STATUS LIKE '
Com_%'
;

Com_xxx表示每个xxx语句执行的次数，我们通常比较关心的是以下几个统计参数：

Com_select：执行SELECT操作的次数，一次查询只累加1。
Com_insert：执行INSERT操作的次数，对于批量插入的INSERT操作，只累加一次。
Com_update：执行UPDATE操作的次数。
Com_delete：执行DELETE操作的次数。

上面这些参数对于所有存储引擎的表操作都会进行累计。这些参数仅适用于InnoDB存储引擎，其累加算法也稍有区别。

Innodb_rows_read：SELECT查询返回的行数。
Innodb_rows_inserted：执行INSERT操作插入的行数。
Innodb_rows_updated：执行UPDATE操作更新的行数。
Innodb_rows_deleted：执行DELETE操作删除的行数。

通过以上几个参数，可以很容易地了解当前数据库的应用系统是以插入更新为主还是以查询操作为主，以及各种类型的SQL大致的执行比例是多少。无论是提交还是回滚，更新操作的计数都会进行累加，其计数对象为执行次数。

对于事务型的应用，通过Com_commit和Com_rollback可以了解事务提交和回滚的情况，对于回滚操作非常频繁的数据库，可能意味着应用编写存在问题。此外，以下几个参数便于用户了解数据库的基本情况。

Connections：试图连接MySQL服务器的次数。
Uptime：服务器工作时间。
Slow_queries：慢查询的次数。

3.定位执行效率较低的SQL语句

可以通过以下两种方式定位执行效率较低的SQL语句。

通过慢查询日志定位那些执行效率较低的SQL语句，用--log-slow-queries[=file_name]选项启动时，mysqld写一个包含所有执行时间超过long_query_time秒的SQL语句的日志文件。
慢查询日志在查询结束以后才纪录，所以在应用系统反映执行效率出现问题的时候查询慢查询日志并不能定位问题，可以使用show processlist命令查看当前MySQL在进行的线程，包括线程的状态、是否锁表等，可以实时地查看SQL的执行情况，同时对一些锁表操作进行优化。

4.通过EXPLAIN分析低效SQL的执行计划

通过定位执行效率较低的SQL语句后，可以通过EXPLAIN或者DESC命令获取MySQL如何执行SELECT语句的信息，包括在SELECT语句执行过程中表如何连接和连接的顺序，比如想统计所有库存阶梯数量，需要关联goods_stock表和goods_stock_price表，并且对goods_stock_price.Qty字段做求和（sum）操作，相应 SQL 的执行计划如下：

EXPLAIN SELECT SUM(sp.Qty)
FROM goods_stock AS s LEFT JOIN goods_stock_price AS sp
ON s.ID=sp.GoodsStockID;

如上图所示每个列的简单解释如下：

select_type：表示 SELECT 的类型，常见的取值有：

SIMPLE（简单表，即不使用表连接或者子查询）。
PRIMARY（主查询，即外层的查询）、UNION（UNION 中的第二个或者后面的查询语句）、◎SUBQUERY（子查询中的第一个SELECT）等。

table：输出结果集的表。
type：表示表的连接类型，性能由好到差的连接类型为：

system（表中仅有一行，即常量表）。
const（单表中最多有一个匹配行，例如primary key或者unique index）。
eq_ref（对于前面的每一行，在此表中只查询一条记录，简单来说，就是多表连接中使用primary key或者unique index）。
ref（与eq_ref类似，区别在于不是使用primary key或者unique index，而是使用普通的索引）。
ref_or_null（与ref类似，区别在于条件中包含对NULL的查询）。
index_merge（索引合并优化）。
unique_subquery（in的后面是一个查询主键字段的子查询）。
index_subquery（与unique_subquery类似，区别在于in的后面是查询非唯一索引字段的子查询）。
range（单表中的范围查询）。
index（对于前面的每一行，都通过查询索引来得到数据）。
all（对于前面的每一行，都通过全表扫描来得到数据）。

possible_keys：表示查询时，可能使用的索引。
key：表示实际使用的索引。
key_len：索引字段的长度。
rows：扫描行的数量。
filtered：返回结果的行占需要读到的行(rows列的值)的百分比。
Extra：执行情况的说明和描述。

Using index（此值表示mysql将使用覆盖索引，以避免访问表）。
Using where（mysql 将在存储引擎检索行后再进行过滤，许多where条件里涉及索引中的列，当(并且如果)它读取索引时，就能被存储引擎检验，因此不是所有带where子句的查询都会显示“Using where”。“Using where”有时提示了一种可能性：查询可以从不同的索引中受益。
Using temporary（mysql 对查询结果排序时会使用临时表）。
MySQL will apply an external index sorting on the results instead of reading rows from the table in index order.。mysql有两种文件排序算法，这两种排序方式都可以在内存或者磁盘上完成，explain不会告诉你mysql将使用哪一种文件排序，也不会告诉你排序会在内存里还是磁盘上完成）。
Range checked for each record(index map: N) （没有好用的索引，新的索引将在联接的每一行上重新估算，N是显示在possible_keys列中索引的位图，并且是冗余的）。

5.确定问题并采取相应的优化措施

经过以上定位步骤，我们基本就可以分析到问题出现的原因。此时我们可以根据情况采取相应的改进措施，进行优化提高语句执行效率。在上面的例子中，已经可以确认是goods_stock是走主键索引的，但是对goods_stock_price子表的进行了全表扫描导致效率的不理想，那么应该对goods_stock_price表的GoodsStockID字段创建索引，具体命令如下：

-- 创建索引
CREATE INDEX idx_stock_price_1 ON goods_stock_price (GoodsStockID);

-- 附加删除跟查询索引语句
ALTER TABLE goods_stock_price DROP INDEX idx_stock_price_1;

SHOW INDEX FROM goods_stock_price;

创建索引后，我们再看一下这条语句的执行计划，具体如下：

EXPLAIN SELECT SUM(sp.Qty)
FROM goods_stock AS s LEFT JOIN goods_stock_price AS sp
ON s.ID=sp.GoodsStockID;

可以发现建立索引后对goods_stock_price子表需要扫描的行数明显减少（从 3 行减少到1行），可见索引的使用可以大大提高数据库的访问速度，尤其在表很庞大的时候这种优势更为明显。

在MySQL中，SQL语句是我们访问和处理数据的关键。但是，由于数据表的结构、大小和存储引擎的不同，处理数据的SQL语句也会有所不同。本文将介绍如何优化SQL语句，以提高MySQL的性能和效率。
一、使用索引提高查询性能
索引是MySQL中查询数据的基本工具，它可以让查询更快速地完成。在使用索引时，需要注意以下几点：
1.为经常查询和过滤的列创建索引。
2.使用唯一索引来约束唯一性。
3.使用前缀索引来减少索引的存储空间。
4.使用组合索引来优化多列组合查询。
二、使用正确的数据类型和字段类型
MySQL支持许多不同的数据类型，包括整数、浮点数、文本、日期和时间等。在选择数据类型时，需要考虑数据的大小和精确度。同时，在选择字段类型时，需要根据数据类型的特点来选择适当的存储引擎。
1.使用INT代替VARCHAR或CHAR存储数字类型。
2.使用DECIMAL存储精确的小数，而不是DOUBLE或FLOAT。
3.使用ENUM或SET来存储固定的选项。
4.使用TIMESTAMP代替DATETIME存储日期和时间类型。
三、优化SQL语句的查询计划
MySQL的查询优化器根据查询表达式和查询的关系，创建查询计划来执行查询。在优化查询计划时，需要注意以下几点：
1.使用EXPLAIN语句来分析SQL语句的查询计划。
2.使用JOIN或子查询时，优先选择性能更好的一种。
3.当查询需要进行排序时，使用索引排序或LIMIT子句来优化。
4.使用读写分离来优化查询性能。
总结
通过以上三个方面的优化，我们可以优化MySQL中的SQL语句，并提高其性能和效率。在实际使用中，需要根据不同的数据表和查询场景进行相应的优化，以满足不同的需求。