Cassandra是一套开源分布式NoSQL数据库系统,它最初由Facebook开发,并在2008年7月正式开源,此后,由于
Cassandra良好的可扩展性,受到IBM、Twitter和Rackspace等大型公司的支持,成为了一种流行的分布式结构化数据存储方案。下面
看Mirantis的Denis Makogon给我们带来的精彩报道。
以下为译文: Apache Cassandra NoSQL数据库Apache Cassandra是极高性能、可扩展、分布式NoSQL数据库,使用灵活,简单分区行存储数据模型,可以对商业服务器和跨数据中心进行无单点故障的海量 数据存储处理。它最初由Avinash Lakshman(Amazon Dynamo的开发者)和Prashant Malik在Facebook开发的,旨在解决他们的Inbox-search问题,然后在2008年7月正式开源,并自那时以来,由于IBM、 Twitter和Rackspace的大力支持,Cassandra一直以惊人的速度发展,2010年2月以来,Cassandra成为Apache顶级 项目。 Cassandra放弃广泛应用的Master-Slave设置转而支持点对点集群,这使Cassandra没有单点故障,由于没有 master服务器,当面对大量的请求时,会使所有的Slave服务器毫无用处。任何数量的商业服务器集群可以集成到Cassandra集群,虽然这个架 构在后台部署更复杂,但是我们用户操作起来很方便。由于不需要区分Master和Slave节点,这将允许你在任何数据中心里可以给任意集群添加任意数量 的机器,每个服务器接受来自任何客户机的请求,服务器之间都是平等的。 Cassandra擅长什么
……不需要在数据库层进行ACID事务处理(原子性、一致性、隔离性和持久性)。 Cassandra 擅长在线事务:请求需要在短时间内完全执行,否则,用户会感觉到延迟,这种查询需要在毫秒级内执行,而不是数百或数千毫秒。由于Cassandra的多个 缓存级别,你的数据可以以令人难以置信的速度处理。由于Cassandra的日志结构存储设计,每次写操作都是快速的,并且每次写操作都提交日志,当停机 时间或数据丢失难以接受时,Cassandra是一个极好的选择。 Cassandra在数据管理方面(分析)也非常优秀,当前的版 本,MapReduce支持存储数据。MapReduce是谷歌推广的一种算法,它允许跨服务器在大数据集上并行分析查询,这不是实时进行,但它能够处理 庞大的数据集搜寻你所需要的信息。因为Cassandra同时提供在线和分析解决方案,你可以使用单一的技术来完成大部分的数据需求,这将有助于开发、 QA和运营效率。 Cassandra和OpenStack现在应该清楚了,随着OpenStack抽象服务器基础设施,以及定义了Cassandra需要的数据中心,简化所有阶段的开发、部署和操作,Cassandra和OpenStack至少在概念上能很好的匹配了。 然而,直到最近,管理OpenStack Cassandra仍是困难的。使用Orchestrator模板可以提供数据库实例,但由最终用户管理正常的安全策略(例如不能从广域网访问数据库),在很大程度上是不切实际的。但是,Trove OpenStack DBaaS解决方案已经出来了,它提供一个API让用户通过in-VM代理进行互动,以及通过定义的管理接口可以进行交互操作。 |