各种NoSQL的比较

2013-10-30 09:48| 发布者: joejoe0332| 查看: 13676| 评论: 0|原作者: Linux中国|来自: Linux中国

摘要: 　　即使关系型数据库依然是非常有用的工具，但它们持续几十年的垄断地位就要走到头了。现在已经存在无数能撼动关系型数据库地位的 NoSQL，当然，这些 NoSQL 还无法完全取代它们。（也就是说，关系型数据库还是处理 ...

应用场景：

使用案例：

可用于客户关系管理（CRM），内容管理系统（CMS）；可用于主主互备甚至多机互备

开发语言： C/C++

主要特性： 快到掉渣

许可证： BSD

数据传输格式： 类似 Telnet 式的交换

Redis 是一个内存数据库（in-memory database，简称 IMDB，将数据放在内存进行读写，这才是“快到掉渣”的真正原因 —— 译者注），磁盘只是提供数据持久化（即将内存的数据写到磁盘）的功能（这类数据库被称为“disk backed”数据库）
当前不支持将磁盘作为 swap 分区，虚拟内存（VM）和 Diskstore 方式都没加到此版本（Redis 的数据持久化共有4种方式：定时快照、基于语句追加、虚拟内存、diskstore。其中 VM 方式由于性能不好以及不稳定的问题，已经被作者放弃，而 diskstore 方式还在实验阶段 —— 译者注）
主从备份
存储结构为简单的 key/value 或 hash 表
但是操作比较复杂，比如：ZREVRANGEBYSCORE
支持 INCR（INCR key 就是将key中存储的数值加一 —— 译者注）命令（对限速和统计有帮助）
支持sets数据类型（以及 union/diff/inter）
支持 lists （以及 queue/blocking pop）
支持 hash sets （多级对象）
支持 sorted sets（高效率的表，在范围查找方面有优势）
支持事务处理！
缓存中的数据可被标记为过期
Pub/Sub 实现了消息订阅和推送！

应用场景：

使用案例：

股价系统、分析系统、实时数据收集系统、实时通信系统、以及取代 memcached

Google Bigtable 的衍生品

开发语言： Java

主要特性： 支持几十亿行*几百万列的大表

许可证： Apache

数据传输格式： HTTP/REST （也支持 Thrift 开发框架）

仿造 Google 的 BigTable
使用 Hadoop 的 HDFS 文件系统作为存储
使用 Hadoop 的映射和简化（map/reduce）编程模型
查询条件被推送到服务器端，由服务器端执行扫描和过滤
对实时查询进行优化
高性能的 Thrift gateway（访问 HBase 的接口之一，特点是利用 Thrift 序列化支持多种语言，可用于异构系统在线访问 HBase 表数据 —— 译者注）
使用 HTTP 通信协议，支持 XML、Protobuf 以及二进制格式
支持基于 Jruby（JIRB）的shell
当配置信息有更改时，支持 rolling restart（轮流重启数据节点）
随机读写性能与 MySQL 一样
一个集群可由不同类型的结点组成

应用场景：

使用案例：

搜索引擎；日志分析系统；扫描大型二维非关系型数据表。

开发语言： Java

主要特性： BigTable 和 Dynamo的完美结合（Cassandra 以 Amazon 专有的完全分布式的 Dynamo 为基础，结合了Google BigTable基于 Column Family 的数据模型 —— 译者注）

许可证： Apache

数据传输格式： Thrift 和自定义二进制 CQL3（即 Cassandra 查询语言第3版 —— 译者注）

可以灵活调整对数据的分布式或备份式存储（通过设置N，R，W之间的关系）（NRW是数据库布署模型中的概念，N是存储网络中复制数据的节点数，R是网络中读数据的节点数，W是网络中写数据的节点数。一个环境中N值是固定的，设置不同的WR值组合能在数据可用性和数据一致性之间取得不同的平衡，可参考 CAP 定理 —— 译者注）
按列查询，按keys值排序后存储（需要包含你想要搜索的任何信息）（Cassandra 的数据模型借鉴自 BigTable 的列式存储，列式存储可以理解成这样，将行ID、列簇号，列号以及时间戳一起，组成一个Key，然后将Value按Key的顺序进行存储 —— 译者注）
类似 BigTable 的特性：列、列簇
支持分布式 hash 表，使用“类 SQL” 语言 —— CQL（但没有 SQL 中的 JOIN 语句）
可以为数据设置一个过期时间（使用 INSERT 指令）
写性能远高于读性能（读性能的瓶颈是磁盘 IO）
可使用 Hadoop 的映射和简化（map/reduce）编程模型
所有节点都相似，这点与 Hadop/HBase 架构不同
可靠的跨数据中心备份解决方案

应用场景：