TSDB 的备份机制

TSDB 的备份机制

假设你有存储了TB级数据的 TSDB 。你如何管理这些数据的备份？你是否认为数据太大而无法备份，并盲目依赖数据库多副本来保证数据安全？那么你就麻烦了。

为什么多副本无法完美解决数据可靠性

多副本是指在不同的硬件资源上创建相同数据的多个副本，并保持这些数据的一致性状态。副本可以防止硬件故障，即如果某个节点或磁盘失效，你的数据不应该丢失或损坏，因为至少应该保留一份数据副本。我们安全吗？
不：

如何防止这些问题？使用传统的备份。

有多种数据备份选项，比如附近的 HDD、磁带、专用存储系统、Amazon S3、Google Cloud Storage 等。

S3 和 GCS 是备份最有前途的存储选项。它们价格低廉、可靠且耐用。但它们有一些限制：

有没有办法克服这些限制？如果满足某些条件，答案是肯定的：

如果数据库根据这些条件存储所有数据，那么在 S3 或 GCS 上设置廉价且快速的增量备份就相当容易。通过在旧备份和新备份之间服务器端复制共享的不可变文件，也可以加快完整备份的速度。GCS 和 S3 都支持服务器端对象复制。当在同一个桶中复制任何大小的对象时，此操作通常很快，因为只复制元数据。

哪种数据结构符合上述原则并可用作 TSDB 的构建块？B-tree——大多数数据库的核心？LMDB？PGDATA 或 Postgresql 的 TOAST？

不。这些数据结构都会修改磁盘上的文件内容。

LSM tree 符合上述所有条件：

LSM 树可以用于构建键值存储，例如 LevelDB 或 RocksDB。这些构建块可以用于创建任意复杂的数据库：

理论上，如果这些数据库将所有数据存储在类似 LSM 的数据结构中，它们都可以支持增量备份。但是，当新文件不断添加且旧文件不断从数据库中删除时，如何从实时数据中进行备份？由于 LSM 类数据结构中的文件不可变，通过硬链接进行即时快照然后从快照中备份数据是很容易的。