参考资料:
《ClickHouse原理解析与应用实战》
原始链接: https://ld246.com/article/1517214401442
一、介绍
Buffer,指把数据先写入内存 Buffer 表,再周期性的刷入磁盘表中。读取数据时,会同时从 Buffer 表和磁盘表读取。
Buffer表引擎完全使用内存装载数据,不支持文件的持久化存储,所以当服务重启之后,表内的数据会被清空。Buffer表引擎不是为了面向查询场景而设计的,它的作用是充当缓冲区的角色。假设有这样一种场景,我们需要将数据写入目标MergeTree表A,由于写入的并发数很高,这可能会致MergeTree表A的合并速度慢于写入速度(因为每一次INSERT都会生成一个新的分区目录)。此时,可以引入Buffer表来缓解这类问题,将Buffer表作为数据写入的缓冲区。数据首先被写入Buffer表,当满足预设条件时,Buffer表会自动将数据刷新到目标表。
二、示例
先给例子
CREATE TABLE merge.hits_buffer AS merge.hits ENGINE = Buffer(merge, hits, 16, 10, 100, 10000, 1000000, 10000000, 100000000)
创建一张 merge.hits_buffer 表,结构与表 merge.hits 相同,使用了 Buffer 引擎。在数据写入这张表时,会先写入内存缓冲,随后再写入 merge.hits 表了。
例子中给出了 16 个缓冲区。每一个缓冲区中的数据的触发条件为:
- 缓存达到了 100 秒
- 写入了 100 万条数据
- 写入了 100MB 数据
- 同时达到了 缓存 10 秒,写入 1 万条数据,并且写入了 10MB 数据
在服务器 stop 时,或者执行 DROP TABLE 和 DETACH TABLE 时,Buffer 表内容也会写入目标表中。
三、说明
再给说明
Buffer(database, table, num_layers, min_time, max_time, min_rows, max_rows, min_bytes, max_bytes)
database
: 数据库table
: 数据要写入的磁盘表num_layers
: buffer 的个数,推荐为 16
数据在所有的 min 条件均满足时,或者有一个 max 条件满足时,则会被刷新到磁盘中。
min_time
,max_time
: 秒数min_rows
,max_rows
: 行数min_bytes
,max_bytes
: 字节数
写操作时,会随机写入 num_layers 中的一个。如果数据过大时,即超过了 max_rows 和 max_bytes 时,会直接写入磁盘中。
每一个 buffer layers 的操作都是独立进行的。
当使用默认值时,即 num_layers = 16 和 max_bytes = 100000000 时,使用的总内存为 1.6GB.
示例二:
CREATE TABLE iios_cloud.event_buffer AS iios_cloud.event_data ENGINE = Buffer(iios_cloud, event_data, 8, 100, 1000, 10000000, 20000000, 10000000, 100000000)
四、注意事项
- 如果数据库和目标表留空,数据则不会写入目标表。在 flush 时,buffer 将被清空。这个特点可以用来实现内存窗口。
- buffer 表是没有索引的,查询时会进行全表扫描。buffer 表很大时,会变的慢。
- 如果 buffer 表和目标表的列不一致,则两个表公共的列将写入目标表中。
- 如果需要改为表结构,推荐先删除 Buffer 表,再改变目标表结构,再重建 Buffer 表。
- 如果机器异常重启,则 Buffer 表内容会丢失。
- PREWHERE, FINAL and SAMPLE 语句,不支持 Buffer 表,这些语句将直接在目标表中操作,不会操作 Buffer 表中的数据。
- 在向 Buffer 表写数据时,这个 Buffer 区将会加锁,这时读请求会有延迟。
- 写入 Buffer 表的顺序,和刷新到磁盘的顺序,不一定是一致的。如果要同时使用 Buffer 表和 CollapsingMergeTree 表,可以将 num_layers 设置为 1,来避免这个问题。
- 如果目标表是 replicated,Buffer 表不能保证一条数据只写入一次??
五、性能
每秒可以发起几千个请求。如果每个请求只有一条数,则 QPS 只有几千;如果每个请求的日志数大,则 QPS 可以达到百万级。
经过测试,使用少量线程(1-3),大包发送(2000-4000)的情况下,使用 Buffer 引擎和直接使用 MergeTree 引擎的性能是无差异的。