下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922
读书 > 数据库 >MySQL > 高性能MySQL(第3版)

高性能MySQL(第3版)

综合评级:★★★★★

定价:128.00

作者:【美】施瓦茨(Schwartz,B.)【美】扎伊采夫(Zaitsev,P.) 【美】特卡琴科(Tkachenko,V.) 著

出版社:电子工业出版社

出版日期:2013年5月

页数:764

字数:1040000

ISBN:9787121198854

书籍介绍

  《高性能MySQL(第3版)》是MySQL 领域的极佳之作,拥有广泛的影响力。第3 版更新了大量的内容,不但涵盖了新的MySQL5.5版本的新特性,也讲述了关于固态盘、高可扩展性设计和云计算环境下的数据库相关的新内容,原有的基准测试和性能优化部分也做了大量的扩展和补充。全书共分为16章和6 个附录,内容涵盖MySQL架构和历史,基准测试和性能剖析,数据库软硬件性能优化,复制、备份和恢复,高可用与高可扩展性,以及云端的MySQL和MySQL相关工具等方面的内容。每一章都是相对独立的主题,读者可以有选择性地单独阅读。

  《高性能MySQL(第3版)》不但适合数据库管理员(DBA)阅读,也适合开发人员参考学习。不管是数据库新手还是专家,相信都能从本书有所收获。

相关课程
目录

推荐序

前言

第1章 MySQL 架构与历史

1.1 MySQL 逻辑架构

1.1.1 连接管理与安全性

1.1.2 优化与执行

1.2 并发控制

1.2.1 读写锁

1.2.2 锁粒度

1.3 事务

1.3.1 隔离级别

1.3.2 死锁

1.3.3 事务日志

1.3.4 MySQL 中的事务

1.4 多版本并发控制

1.5 MySQL 的存储引擎

1.5.1 InnoDB 存储引擎

1.5.2 MyISAM 存储引擎

1.5.3 MySQL 内建的其他存储引擎

1.5.4 第三方存储引擎

1.5.5 选择合适的引擎

1.5.6 转换表的引擎

1.6 MySQL 时间线(Timeline)

1.7 MySQL 的开发模式

1.8 总结

第2章 MySQL 基准测试

2.1 为什么需要基准测试

2.2 基准测试的策略

2.2.1 测试何种指标

2.3 基准测试方法

2.3.1 设计和规划基准测试

2.3.2 基准测试应该运行多长时间

2.3.3 获取系统性能和状态

2.3.4 获得准确的测试结果

2.3.5 运行基准测试并分析结果

2.3.6 绘图的重要性

2.4 基准测试工具

2.4.1 集成式测试工具

2.4.2 单组件式测试工具

2.5 基准测试案例

2.5.1 http_load

2.5.2 MySQL 基准测试套件 .

2.5.3 sysbench

2.5.4 数据库测试套件中的dbt2 TPC-C 测试

2.5.5 Percona 的TPCC-MySQL 测试工具

2.6 总结

第3章 服务器性能剖析

3.1 性能优化简介

3.1.1 通过性能剖析进行优化

3.1.2 理解性能剖析

3.2 对应用程序进行性能剖析

3.2.1 测量php 应用程序

3.3 剖析MySQL 查询

3.3.1 剖析服务器负载

3.3.2 剖析单条查询

3.3.3 使用性能剖析

3.4 诊断间歇性问题

3.4.1 单条查询问题还是服务器问题

3.4.2 捕获诊断数据

3.4.3 一个诊断案例

3.5 其他剖析工具

3.5.1 使用USER_STATISTICS 表

3.5.2 使用strace

3.6 总结

第4章 Schema 与数据类型优化

4.1 选择优化的数据类型

4.1.1 整数类型

4.1.2 实数类型

4.1.3 字符串类型

4.1.4 日期和时间类型

4.1.5 位数据类型

4.1.6 选择标识符(identifier)

4.1.7 特殊类型数据

4.2 MySQL schema 设计中的陷阱

4.3 范式和反范式

4.3.1 范式的优点和缺点

4.3.2 反范式的优点和缺点 .

4.3.3 混用范式化和反范式化

4.4 缓存表和汇总表

4.4.1 物化视图

4.4.2 计数器表

4.5 加快ALTER TABLE 操作的速度

4.5.1 只修改.frm 文件

4.5.2 快速创建MyISAM 索引

4.6 总结

第5章 创建高性能的索引

5.1 索引基础

5.1.1 索引的类型

5.2 索引的优点

5.3 高性能的索引策略

5.3.1 独立的列

5.3.2 前缀索引和索引选择性

5.3.3 多列索引

5.3.4 选择合适的索引列顺序

5.3.5 聚簇索引

5.3.6 覆盖索引

5.3.7 使用索引扫描来做排序

5.3.8 压缩(前缀压缩)索引

5.3.9 冗余和重复索引

5.3.10 未使用的索引

5.3.11 索引和锁

5.4 索引案例学习

5.4.1 支持多种过滤条件

5.4.2 避免多个范围条件

5.4.3 优化排序

5.5 维护索引和表

5.5.1 找到并修复损坏的表 .

5.5.2 更新索引统计信息

5.5.3 减少索引和数据的碎片

5.6 总结

第6章 查询性能优化

6.1 为什么查询速度会慢

6.2 慢查询基础:优化数据访问

6.2.1 是否向服务器请求了不需要的数据

6.2.2 MySQL 是否在扫描额外的记录

6.3 重构查询的方式

6.3.1 一个复杂查询还是多个简单查询

6.3.2 切分查询

6.3.3 分解关联查询

6.4 查询执行的基础

6.4.1 MySQL 客户端/ 服务器通信协议

6.4.2 查询缓存

6.4.3 查询优化处理

6.4.4 查询执行引擎

6.4.5 返回结果给客户端

6.5 MySQL 查询优化器的局限性

6.5.1 关联子查询

6.5.2 UNION 的限制

6.5.3 索引合并优化

6.5.4 等值传递

6.5.5 并行执行

6.5.6 哈希关联

6.5.7 松散索引扫描

6.5.8 最大值和最小值优化 .

6.5.9 在同一个表上查询和更新

6.6 查询优化器的提示(hint)

6.7 优化特定类型的查询

6.7.1 优化COUNT() 查询

6.7.2 优化关联查询

6.7.3 优化子查询

6.7.4 优化GROUP BY 和DISTINCT

6.7.5 优化LIMIT 分页

6.7.6 优化SQL_CALC_FOUND_ROWS

6.7.7 优化UNION 查询

6.7.8 静态查询分析

6.7.9 使用用户自定义变量 .

6.8 案例学习

6.8.1 使用MySQL 构建一个队列表

6.8.2 计算两点之间的距离 .

6.8.3 使用用户自定义函数 .

6.9 总结

第7章 MySQL 高级特性

7.1 分区表

7.1.1 分区表的原理

7.1.2 分区表的类型

7.1.3 如何使用分区表

7.1.4 什么情况下会出问题 .

7.1.5 查询优化

7.1.6 合并表

7.2 视图

7.2.1 可更新视图

7.2.2 视图对性能的影响

7.2.3 视图的限制

7.3 外键约束

7.4 在MySQL 内部存储代码

7.4.1 存储过程和函数

7.4.2 触发器

7.4.3 事件

7.4.4 在存储程序中保留注释

7.5 游标

7.6 绑定变量

7.6.1 绑定变量的优化

7.6.2 SQL 接口的绑定变量

7.6.3 绑定变量的限制

7.7 用户自定义函数

7.8 插件

7.9 字符集和校对

7.9.1 MySQL 如何使用字符集

7.9.2 选择字符集和校对规则

7.9.3 字符集和校对规则如何影响查询

7.10 全文索引

7.10.1 自然语言的全文索引

7.10.2 布尔全文索引

7.10.3 MySQL5.1 中全文索引的变化

7.10.4 全文索引的限制和替代方案

7.10.5 全文索引的配置和优化

7.11 分布式(XA)事务

7.11.1 内部XA 事务

7.11.2 外部XA 事务

7.12 查询缓存

7.12.1 MySQL 如何判断缓存命中

7.12.2 查询缓存如何使用内存

7.12.3 什么情况下查询缓存能发挥作用

7.12.4 如何配置和维护查询缓存

7.12.5 InnoDB 和查询缓存 .

7.12.6 通用查询缓存优化

7.12.7 查询缓存的替代方案

7.13 总结

第8章 优化服务器设置

8.1 MySQL 配置的工作原理

8.1.1 语法、作用域和动态性

8.1.2 设置变量的副作用

8.1.3 入门

8.1.4 通过基准测试迭代优化

8.2 什么不该做

8.3 创建MySQL 配置文件

8.3.1 检查MySQL 服务器状态变量

8.4 配置内存使用

8.4.1 MySQL 可以使用多少内存?

8.4.2 每个连接需要的内存 .

8.4.3 为操作系统保留内存 .

8.4.4 为缓存分配内存

8.4.5 InnoDB 缓冲池(Buffer Pool)

8.4.6 MyISAM 键缓存(Key Caches)

8.4.7 线程缓存

8.4.8 表缓存(Table Cache)

8.4.9 InnoDB 数据字典(Data Dictionary)

8.5 配置MySQL 的I/O 行为

8.5.1 InnoDB I/O 配置

8.5.2 MyISAM 的I/O 配置 .

8.6 配置MySQL 并发 .

8.6.1 InnoDB 并发配置

8.6.2 MyISAM 并发配置

8.7 基于工作负载的配置

8.7.1 优化BLOB 和TEXT 的场景

8.7.2 优化排序(Filesorts).

8.8 完成基本配置

8.9 安全和稳定的设置

8.10 高级InnoDB 设置

8.11 总结

第9章 操作系统和硬件优化

9.1 什么限制了MySQL 的性能

9.2 如何为MySQL 选择CPU

9.2.1 哪个更好:更快的CPU 还是更多的CPU

9.2.2 CPU 架构

9.2.3 扩展到多个CPU 和核心

9.3 平衡内存和磁盘资源

9.3.1 随机I/O 和顺序I/O

9.3.2 缓存,读和写

9.3.3 工作集是什么

9.3.4 找到有效的内存/ 磁盘比例

9.3.5 选择硬盘

9.4 固态存储

9.4.1 闪存概述

9.4.2 闪存技术

9.4.3 闪存的基准测试

9.4.4 固态硬盘驱动器(SSD)

9.4.5 PCIe 存储设备

9.4.6 其他类型的固态存储 .

9.4.7 什么时候应该使用闪存

9.4.8 使用Flashcache

9.4.9 优化固态存储上的MySQL

9.5 为备库选择硬件

9.6 RAID 性能优化

9.6.1 RAID 的故障转移、恢复和镜像

9.6.2 平衡硬件RAID 和软件RAID

9.6.3 RAID 配置和缓存

9.7 SAN 和NAS

9.7.1 SAN 基准测试

9.7.2 使用基于NFS 或SMB 的SAN

9.7.3 MySQL 在SAN 上的性能

9.7.4 应该用SAN 吗

9.8 使用多磁盘卷

9.9 网络配置

9.10 选择操作系统

9.11 选择文件系统

9.12 选择磁盘队列调度策略

9.13 线程

9.14 内存交换区

9.15 操作系统状态

9.15.1 如何阅读vmstat 的输出

9.15.2 如何阅读iostat 的输出

9.15.3 其他有用的工具

9.15.4 CPU 密集型的机器

9.15.5 I/O 密集型的机器

9.15.6 发生内存交换的机器

9.15.7 空闲的机器

9.16 总结

第10章 复制

10.1 复制概述

10.1.1 复制解决的问题

10.1.2 复制如何工作

10.2 配置复制

10.2.1 创建复制账号

10.2.2 配置主库和备库

10.2.3 启动复制

10.2.4 从另一个服务器开始复制

10.2.5 推荐的复制配置

10.3 复制的原理

10.3.1 基于语句的复制

10.3.2 基于行的复制

10.3.3 基于行或基于语句:哪种更优

10.3.4 复制文件

10.3.5 发送复制事件到其他备库

10.3.6 复制过滤器

10.4 复制拓扑

10.4.1 一主库多备库

10.4.2 主动- 主动模式下的主- 主复制

10.4.3 主动- 被动模式下的主- 主复制

10.4.4 拥有备库的主- 主结构

10.4.5 环形复制

10.4.6 主库、分发主库以及备库

10.4.7 树或金字塔形

10.4.8 定制的复制方案

10.5 复制和容量规划

10.5.1 为什么复制无法扩展写操作

10.5.2 备库什么时候开始延迟

10.5.3 规划冗余容量

10.6 复制管理和维护

10.6.1 监控复制

10.6.2 测量备库延迟

10.6.3 确定主备是否一致

10.6.4 从主库重新同步备库

10.6.5 改变主库

10.6.6 在一个主- 主配置中交换角色

10.7 复制的问题和解决方案

10.7.1 数据损坏或丢失的错误

10.7.2 使用非事务型表

10.7.3 混合事务型和非事务型表

10.7.4 不确定语句

10.7.5 主库和备库使用不同的存储引擎

10.7.6 备库发生数据改变

10.7.7 不唯一的服务器ID .

10.7.8 未定义的服务器ID .

10.7.9 对未复制数据的依赖性

10.7.10 丢失的临时表

10.7.11 不复制所有的更新 .

10.7.12 InnoDB 加锁读引起的锁争用

10.7.13 在主- 主复制结构中写入两台主库

10.7.14 过大的复制延迟

10.7.15 来自主库的过大的包

10.7.16 受限制的复制带宽 .

10.7.17 磁盘空间不足

10.7.18 复制的局限性

10.8 复制有多快

10.9 MySQL 复制的高级特性

10.10 其他复制技术

10.11 总结

第11章 可扩展的MySQL

11.1 什么是可扩展性

11.1.1 正式的可扩展性定义

11.2 扩展MySQL

11.2.1 规划可扩展性

11.2.2 为扩展赢得时间

11.2.3 向上扩展

11.2.4 向外扩展

11.2.5 通过多实例扩展

11.2.6 通过集群扩展

11.2.7 向内扩展

11.3 负载均衡

11.3.1 直接连接

11.3.2 引入中间件

11.3.3 一主多备间的负载均衡

11.4 总结

第12章 高可用性

12.1 什么是高可用性

12.2 导致宕机的原因

12.3 如何实现高可用性

12.3.1 提升平均失效时间(MTBF)

12.3.2 降低平均恢复时间(MTTR)

12.4 避免单点失效

12.4.1 共享存储或磁盘复制

12.4.2 MySQL 同步复制

12.4.3 基于复制的冗余

12.5 故障转移和故障恢复

12.5.1 提升备库或切换角色

12.5.2 虚拟IP 地址或IP 接管

12.5.3 中间件解决方案

12.5.4 在应用中处理故障转移

12.6 总结

第13章 云端的MySQL

13.1 云的优点、缺点和相关误解

13.2 MySQL 在云端的经济价值

13.3 云中的MySQL 的可扩展性和高可用性

13.4 四种基础资源

13.5 MySQL 在云主机上的性能

13.5.1 在云端的MySQL 基准测试

13.6 MySQL 数据库即服务(DBaaS)

13.6.1 Amazon RDS

13.6.2 其他DBaaS 解决方案

13.7 总结

第14章 应用层优化

14.1 常见问题

14.2 Web 服务器问题

14.2.1 寻找最优并发度

14.3 缓存

14.3.1 应用层以下的缓存

14.3.2 应用层缓存

14.3.3 缓存控制策略

14.3.4 缓存对象分层

14.3.5 预生成内容

14.3.6 作为基础组件的缓存

14.3.7 使用HandlerSocket 和memcached

14.4 拓展MySQL

14.5 MySQL 的替代品

14.6 总结

第15章 备份与恢复

15.1 为什么要备份

15.2 定义恢复需求

15.3 设计MySQL 备份方案

15.3.1 在线备份还是离线备份

15.3.2 逻辑备份还是物理备份

15.3.3 备份什么

15.3.4 存储引擎和一致性

15.4 管理和备份二进制日志

15.4.1 二进制日志格式

15.4.2 安全地清除老的二进制日志

15.5 备份数据

15.5.1 生成逻辑备份

15.5.2 文件系统快照

15.6 从备份中恢复

15.6.1 恢复物理备份

15.6.2 还原逻辑备份

15.6.3 基于时间点的恢复

15.6.4 更高级的恢复技术

15.6.5 InnoDB 崩溃恢复

15.7 备份和恢复工具

15.7.1 MySQL Enterprise Backup

15.7.2 Percona XtraBackup .

15.7.3 mylvmbackup

15.7.4 Zmanda Recovery Manager

15.7.5 mydumper

15.7.6 mysqldump.

15.8 备份脚本化

15.9 总结

第16章 MySQL 用户工具

16.1 接口工具

16.2 命令行工具集

16.3 SQL 实用集

16.4 监测工具

16.4.1 开源的监控工具

16.4.2 商业监控系统

16.4.3 Innotop 的命令行监控

16.5 总结

附录A MySQL 分支与变种

附录B MySQL 服务器状态

附录C 大文件传输

附录D EXPLAIN

附录E 锁的调试

附录F 在MySQL 上使用Sphinx

索引

前言

我们写这本书不仅仅是为了满足MySQL 应用开发者的需求,也是为了满足MySQL 数据库管理员的需要。我们假定读者已经有了一定的MySQL 基础。我们还假定读者对于系统管理、网络和类Unix 的操作系统都有一些了解。

  本书的第二版为读者提供了大量的信息,但没有一本书是可以涵盖一个主题的所有方面的。在第二版和第三版之间的这段时间里,我们记录了数以千计有趣的问题,其中有些是我们解决的,也有一些是我们观察到其他人解决的。当我们在规划第三版的时候发现,如果要把这些主题完全覆盖,可能三千页到五千页的篇幅都还不够,这样本书的完成就遥遥无期了。在反思这个问题后,我们意识到第二版强调的广泛的覆盖度事实上有其自身的限制,从某种意义上来说也没有引导读者如何按照MySQL 的方式来思考问题。

  所以第三版和第二版的关注点有很大的不同。我们虽然还是会包含很多的信息,并且会强调同样的诸如可靠性和正确性的目标,但我们也会在本书中尝试更深入的讨论:我们会指出MySQL 为什么会这样做,而不是MySQL 做了什么。我们会使用更多的演示和案例学习来将上述原则落地。通过这样的方式,我们希望能够尝试回到下面这样的问题:“给出MySQL 的内部结构和操作,对于实际应用能带来什么帮助?为什么能有这样的帮助?如何让MySQL 适合(或者不适合)特定的需求?”

  最后,我们希望关于MySQL 内部原理的知识能够帮助大家解决本书没有覆盖到的一些情况。我们更希望读者能培养发现新问题的洞察力,能学习和实践合理的方式来设计、维护和诊断基于MySQL 的系统。

  本书是如何组织的

  本书涵盖了许多复杂的主题。在这里,我们将解释一下是如何将这些主题有序地组织在一起的,以便于阅读和学习。

  概述

  第1 章是非常基础的一章,在更深入地学习之前建议先熟悉一下这部分内容。在有效地使用MySQL 之前应当理解它是如何组织的。本章解释了MySQL 的架构及其存储引擎的关键设计。如果读者还不太熟悉关系数据库和事务的基础知识,本章也可以带来一点帮助。如果之前已经对其他关系数据库如Oracle 比较熟悉,本章也可以帮助读者了解MySQL 的入门知识。本章还包括了一点MySQL 的历史背景:MySQL 随着时间的演进、最近的公司所有权更替,以及我们认为比较重要的内容。

  打造坚实的基础

  本书前几章的内容在今后使用MySQL 的过程中可能会被不断地引用到,它们是非常基础的内容。

  第2章讨论了基准测试的基础,例如服务器可以处理的工作负载的类型、处理特定任务的速度等。基准测试是一项至关重要的技能,可用于评估服务器在不同负载下的表现,但也要明白在什么情况下基准测试不能发挥作用。

  第3章介绍了我们常用于故障诊断和服务器性能问题分析的一种面向响应时间的方法。该方法已经被证明可以解决我们曾碰到过的一些极为棘手的问题。当然也可以选择修改我们所使用的方法(实际上我们的方法也是从Cary Millsap 的方法修改而来的),但无论如何,至少不能没有方法胡乱猜测。

  从第4章到第6 章,连续介绍了三个关于良好的数据库逻辑设计和物理设计基础的话题。第4 章涵盖了不同数据类型的细节差别以及表设计的原则。第5 章则展开讨论了索引,这是数据库的物理设计。对于索引的深入理解和利用是高效使用MySQL 的基础,相信这一章会经常需要回头翻看。而第6 章则包含了分析MySQL 的查询是如何执行的,以及如何利用查询优化器的话题。该章也包含了大量常见类型查询的例子,演示了MySQL 是如何做好工作的,以及如何改写查询以利用MySQL 的特性。

  到此为止,已经覆盖了关于数据库的基础内容:表、索引、数据和查询。第7 章则在MySQL 基础知识之外介绍了MySQL 的高级特性是如何工作的。这章的内容包括分区、存储引擎、触发器,以及字符集。MySQL 中这些特性的实现可能不同于其他数据库,可能之前读者并不清楚这些不同,因此理解它们对于性能可能会带来新的收益。

  配置应用程序

  接下来的两章讲述的是如何让MySQL、应用程序及硬件一起很好地工作。第8 章介绍了如何配置MySQL,以便更好地利用硬件,达到更好的可靠性和鲁棒性。第9 章解释了如何让操作系统和硬件工作得更好。另外也深入讨论了固态硬盘,为高可扩展性应用发挥更好的性能提供了硬件配置的建议。

  上面两章都一定程度地涉及了MySQL 的内部知识。这将会是一个反复出现的主题,附录中也会有相关内容可以学习到MySQL 的内部是如何实现的,理解了这些知识将帮助读者更好地理解某些现象背后的原理。

  作为基础设施组件的MySQL

  MySQL 不是存在于真空中的,而是应用整体的一个环节,因此需要考虑整个应用架构的鲁棒性。下面的章节将告诉我们该如何做到这一点。

  第10 章讨论了MySQL 的杀手级特性:能够设置多个服务器从一台主服务器同步数据。不幸的是,复制可能也是MySQL 给很多用户带来困扰的一个特性。但实际上不应该发生这样的情况,本章将告诉你如何让复制运行得更好。

  第11章讨论了什么是可扩展性(这和性能不是一回事),应用和系统为什么会无法扩展,该怎么改善扩展性。如果能够正确地处理,MySQL 的可扩展性是足以应付任何需求的。

  第12章讲述的是和可扩展性相关但又完全不同的主题:如何保障MySQL 稳定而正确地持续运行。第13 章将告诉你当MySQL 在云计算环境中运行时会有什么不同的事情发生。

  第14章解释了什么是全方位的优化(full-stack optimization),就是从前端到后端的整体优化,从用户体验开始直到数据库。

  即使是世界上设计最好、最具可扩展性的架构,如果停电会导致彻底崩溃,无法抵御恶意攻击,解决不了应用的bug 和程序员的错误,以及其他一些灾难场景,那就不是什么好的架构。第15 章讨论了MySQL 数据库各种备份与恢复的场景。这些策略可以帮助读者减少在各种不可抗的硬件失效时的宕机时间,保证在各种灾难下的数据最终可恢复。

  其他有用的主题

  在本书的最后一章以及附录中,我们探讨了一些无法明确地放到前面章节的内容,以及一些被前面多个章节引用而需要特别注意的主题。

  第16章探索了一些可以帮助用户更有效地管理和监控MySQL 服务器的工具,有些是开源的,也有些是商业的。

  附录A 介绍了近年来成长迅速的三个主要的非MySQL 官方版本,其中一个是我们公司在维护的产品。知道还有其他什么是可用的选择是有价值的;很多MySQL 难以解决的棘手问题在其他的变种版本中说不定就不是问题了。这三个版本中的两个(Percona Server 和MariaDB)是MySQL 的完全可替换版本,所以尝试使用的成本相对来说是很低的。当然,在这里我们也需要补充一点,Oracle 提供的MySQL 官方版本对于大多数用户来说都能服务得很好。

  附录B 演示了如何检查MySQL 服务器。知道如何从服务器获取状态信息是非常重要的;而了解这些状态代表的意义则更加重要。这里将覆盖SHOW INNODB STATUS 的输出结果,因此这里包含了InnoDB 事务存储引擎的深入信息。在这个附录中讨论了很多InnoDB的内部信息。

  附录C 演示了如何高效地将大文件从一个地方复制到另外一个地方。如果要管理大量的数据,这种操作是经常都会碰到的。附录D 演示了如何真正地使用并理解EXPLAIN 命令。附录E 演示了如何破除不同查询所请求的锁互相干扰的问题。最后,附录F 介绍了Sphinx,一个基于MySQL 的高性能的全文索引系统。

热门图书
推荐新闻
技术文库
论坛推荐