亚马逊AWS上的InnoDB和TokuDB比较

2016-3-31 22:23| 发布者: joejoe0332| 查看: 1264| 评论: 0|原作者: oschina|来自: oschina

摘要: 在最近的报道，Vadim比较了Amazon Aurora和Percona Server在亚马逊云上的性能，这次，我要比较的写InnoDB和TokuDB的性能，在他的实验中使用相同的算例（性能测试集：oltp/update/update_non_index）和一个简单的计划 ...

在最近的报道，Vadim比较了Amazon Aurora和Percona Server在亚马逊云上的性能，这次，我要比较的写InnoDB和TokuDB的性能，在他的实验中使用相同的算例（性能测试集：oltp/update/update_non_index）和一个简单的计划（r3.xlarge实例,与通用的ssd、io2000和io3000卷）。

所有的运行都使用16个线程做系统测试，下面分别是InnoDB和TokuDB的MYSQL配置文件：

[mysqld]
table-open-cache-instances=32
table_open_cache=8000
innodb-flush-method = O_DIRECT
innodb-log-files-in-group = 2
innodb-log-file-size = 16G
innodb-flush-log-at-trx-commit = 1
innodb_log_compressed_pages =0
innodb-file-per-table = 1
innodb-buffer-pool-size = 20G
innodb_write_io_threads = 8
innodb_read_io_threads = 32
innodb_open_files = 1024
innodb_old_blocks_pct =10
innodb_old_blocks_time =2000
innodb_checksum_algorithm = crc32
innodb_file_format =Barracuda
innodb_io_capacity=1500
innodb_io_capacity_max=2000
metadata_locks_hash_instances=256
innodb_max_dirty_pages_pct=90
innodb_flush_neighbors=1
innodb_buffer_pool_instances=8
innodb_lru_scan_depth=4096
innodb_sync_spin_loops=30
innodb-purge-threads=16

和：

[mysqld]
tokudb_read_block_size=16K
tokudb_fanout=128
table-open-cache-instances=32
table_open_cache=8000
metadata_locks_hash_instances=256
[mysqld_safe]
thp-setting=never

你能够看到所有图的设置和完整的结果。

让我首先通过这个总结性的关于io2000流量的图表来说明下测试结果，这个图表展示了每个引擎和工作负载的写吞吐量随时间变化的情况。（所有的图表中，测试数据是1k行， so 1000实际上是 1M）：

我们能看出如下情况:

对于较小的表，InnoDB有更好的吞吐性能。
反过来也是正确的，表越大，InnoDB的吞吐性能越差（超过10M行）。
TokuDB在oltp的工作负载上的优势并不明显，相比于InnoDB来说。

让我们再深入分析在极限情况下表大小对性能的影响，表大小从1M行开始：

一直测试到50M行结束：

在第一个场景中，我们可以看到InnoDB不光是显示了较好的写性能，还显示出了较少的偏差。在第二个场景中，我们可以确认在oltp工作负载上两者的差距不大，在其他类型的工作负载上差距就很明显了。

这不足为奇，因为TokuDB的Fractal树和InnoDB的B树之间较大的差异之一就是在添加消息缓冲区到节点的实现，而这用于处理写请求（对我来说另外一个较大的差别是节点大小）。对于写密集型工作负载，TokuDB需要做的树遍历远少于InnoDB（实际上，这只在校验唯一性约束时发生，其他的写操作都是直接插入消息缓冲区，缓冲区异步刷新到更低的树节点，我推荐你去看看这篇文档了解更多细节）。

对于oltp，InnoDB在小表上有优势，因为它读取时不需要去扫描所有的消息缓冲区（在生活中没有什么是免费的，这就是TokuDB写操作的优势所在。）我怀疑在表体积很大时这个优势会失效，因为此时，所有引擎都会变成I/O密集型。

我关注的焦点在写性能上，但是作为一个小例子可以演示下一个50M的表的响应情况，oltp工作负载下线，只跑其他工作负载：

此时，你可能会有疑问为什么我关注io2000的测试结果呢（如果你没有疑问，请忍受我啰嗦两句）。因为io3000的测试结果和通用型号的SSD显示出的特点，我将其归因为延迟。你能在下面io3000的图里看出我的意思：

我说“我归因”是因为，很不幸，我没有除sysbench以外其他的输出指标（我将会在将来的测试中修正这一问题！）我曾经在工作时在生产环境中见过同样的模式，在那些场景中我能将它与磁盘的stime或者qtime增加联系起来。事实是这在相同工作负载，更低或者更高容量的磁盘中会出现，而在io2000中没有出现，增加了我对自己假设的信心。