Apache Cassandra 是一套开源分布式 Key-Value 存储系统。它最初由 Facebook 开发,用于储存特别大的数据
主要特性
- 分布式
- 基于 column 的结构化
- 高伸展性
Cassandra 的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式网络服务,对 Cassandra 的一个写操作,会被复制到其他节点上去,对 Cassandra 的读操作,也会被路由到某个节点上面去读取。对于一个 Cassandra 群集来说,扩展性能 是比较简单的事情,只管在群集里面添加节点就可以了。
突出特性
- 模式灵活- 使用 Cassandra,像文档存储,不必提前解决记录中的字段。你可以在系统运行时随意的添加或移除字段。这是一个惊人的效率提升,特别是在大型部署上。
- 真正的可扩展性- Cassandra 是纯粹意义上的水平扩展。为给集群添加更多容量,可以指向另一台电脑。你不必重启任何进程,改变应用查询,或手动迁移任何数据。
- 多数据中心识别- 你可以调整你的节点布局来避免某一个数据中心起火,一个备用的数据中心将至少有每条记录的完全复制。
- 范围查询- 如果你不喜欢全部的键值查询,则可以设置键的范围来查询。
- 列表数据结构- 在混合模式可以将超级列添加到 5 维。对于每个用户的索引,这是非常方便的。
- 分布式写操作- 有可以在任何地方任何时间集中读或写任何数据。并且不会有任何单点失败。
为什么要使用cassandra
(1)分布式的海量数据储存和处理
(2)极高的性能
(3)极致的可靠性(去中心化的架构,无单点故障)
(4)优秀的线性可扩展能力
(5)对多地多数据中心部署的原生支持
(6)运维和管理需要理解的概念简单
(7)使用对开发者非常友好的类SQL语言CQL
(8)强大的生态,活跃的国际社区
(9)不断紧跟最新技术趋势(k8s, 云原生,多模,存储计算分离),使他持续具有强大的生命力
参考文章