架构 | 肖斌的博客

前言：分库分表后的“第二天”挑战在大规模微服务架构的演进过程中，分库分表（Sharding）常被视为解决海量数据存储与高并发写入挑战的“银弹”。当我们兴奋地使用 Apache ShardingSphere 将单体数据库拆分为 16 个分库、1024 个分表，看着系统吞吐量直线飙升时，往往会忽略随之而来的一个严峻问题——运维与一致性。在分库分表上线的“第二天”，开发与运维团队通常会面临以下灵魂拷问： DDL 噩梦：当业务需求变更，逻辑表需要增加一个字段时，DBA 是否必须手动连接 16 个数据库，执行 1024 次 ALTER TABLE？微服务“人格分裂”：在微服务多实例部署场景下，如果实例 A 修改了表结构，实例 B 如何感知？如果实例 B 不知道，依然在用旧的元数据组装 SQL，岂不是会报错？架构选型困惑：听说 ShardingSphere 有 JDBC 和 Proxy 两种模式，我们是否还需要引入 Zookeeper？这会不会让架构变得太复杂？基于实战经验，本文将从 DDL 变更一致性到微服务元数据同步，系统性地剖析这一问题并给出完整解决方案。第一部分：如何优雅地管理成百上千张表？在单体数据库时代，执行一条 ALTER TABLE 是轻松愉快的事情。但在分库分表架构下，一个逻辑表（Logic Table）可能对应分布在不同物理节点上的几十甚至上百个物理表（Actual Tables）。如果采用人工维护，不仅效率极低，而且极易出现“漏网之鱼”——即部分分表成功，部分失败，导致数据节点间的 Schema 不一致，引发应用层的灾难性错误。解决方案：ShardingSphere-JDBC + Flyway / Liquibase 在 Java 生态中，推荐将 ShardingSphere-JDBC 与 Flyway 或 Liquibase 等数据库版本管理工具结合使用。核心流程如下：一次编写：开发人员只需像操作单库一样，编写一份标准的 SQL 变更脚本（如 V1.0.1__add_column_to_user.sql）。版本管理：将脚本放入项目的 resources/db/migration 目录下，并纳入 Git 版本控制。自动执行：应用启动时，Flyway 自动处理数据库迁移。透明广播：这是最关键的一步。Flyway 连接的不是真实的物理数据源，而是 ShardingSphere-JDBC 提供的逻辑数据源。ShardingSphere-JDBC 内部会拦截这条 DDL 语句，识别出它是对逻辑表的操作，然后利用其核心能力，自动将该 DDL 广播到所有相关的底层物理分库分表中执行。为什么这种方式是最佳实践？ ...