设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 IT综合资讯 查看内容

各种NoSQL的比较

2013-10-30 09:48| 发布者: joejoe0332| 查看: 13501| 评论: 0|原作者: Linux中国|来自: Linux中国

摘要:   即使关系型数据库依然是非常有用的工具,但它们持续几十年的垄断地位就要走到头了。现在已经存在无数能撼动关系型数据库地位的 NoSQL,当然,这些 NoSQL 还无法完全取代它们。(也就是说,关系型数据库还是处理 ...


应用场景:

  • 用于随机数据量多、需要预定义查询的地方
  • 用于版本控制比较重要的地方

使用案例:

可用于客户关系管理(CRM),内容管理系统(CMS);可用于主主互备甚至多机互备

Redis 2.4版

开发语言: C/C++

主要特性: 快到掉渣

许可证: BSD

数据传输格式: 类似 Telnet 式的交换

  • Redis 是一个内存数据库(in-memory database,简称 IMDB,将数据放在内存进行读写,这才是“快到掉渣”的真正原因 —— 译者注),磁盘只是提供数据持久化(即将内存的数据写到磁盘)的功能(这类数据库被称为“disk backed”数据库)
  • 当前不支持将磁盘作为 swap 分区,虚拟内存(VM)和 Diskstore 方式都没加到此版本(Redis 的数据持久化共有4种方式:定时快照、基于语句追加、虚拟内存、diskstore。其中 VM 方式由于性能不好以及不稳定的问题,已经被作者放弃,而 diskstore 方式还在实验阶段 —— 译者注)
  • 主从备份
  • 存储结构为简单的 key/value 或 hash 表
  • 但是操作比较复杂,比如:ZREVRANGEBYSCORE
  • 支持 INCR(INCR key 就是将key中存储的数值加一 —— 译者注)命令(对限速和统计有帮助)
  • 支持sets数据类型(以及 union/diff/inter)
  • 支持 lists (以及 queue/blocking pop)
  • 支持 hash sets (多级对象)
  • 支持 sorted sets(高效率的表,在范围查找方面有优势)
  • 支持事务处理!
  • 缓存中的数据可被标记为过期
  • Pub/Sub 实现了消息订阅和推送!

应用场景:

  • 适合布署快速多变的小规模数据(可以完全运行在存在中)

使用案例:

股价系统、分析系统、实时数据收集系统、实时通信系统、以及取代 memcached

Google Bigtable 的衍生品

HBase 0.92.0 版

开发语言: Java

主要特性: 支持几十亿行*几百万列的大表

许可证: Apache

数据传输格式: HTTP/REST (也支持 Thrift 开发框架)

  • 仿造 Google 的 BigTable
  • 使用 Hadoop 的 HDFS 文件系统作为存储
  • 使用 Hadoop 的映射和简化(map/reduce)编程模型
  • 查询条件被推送到服务器端,由服务器端执行扫描和过滤
  • 对实时查询进行优化
  • 高性能的 Thrift gateway(访问 HBase 的接口之一,特点是利用 Thrift 序列化支持多种语言,可用于异构系统在线访问 HBase 表数据 —— 译者注)
  • 使用 HTTP 通信协议,支持 XML、Protobuf 以及二进制格式
  • 支持基于 Jruby(JIRB)的shell
  • 当配置信息有更改时,支持 rolling restart(轮流重启数据节点)
  • 随机读写性能与 MySQL 一样
  • 一个集群可由不同类型的结点组成

应用场景:

  • Hadoop 可能是在大数据上跑 Map/Reduce 业务的最佳选择
  • 如果你已经搭建了 Hadoop/HDFS 架构,HBase 也是你最佳的选择。

使用案例:

搜索引擎;日志分析系统;扫描大型二维非关系型数据表。

Cassandra 1.2版

开发语言: Java

主要特性: BigTable 和 Dynamo的完美结合(Cassandra 以 Amazon 专有的完全分布式的 Dynamo 为基础,结合了Google BigTable基于 Column Family 的数据模型 —— 译者注)

许可证: Apache

数据传输格式: Thrift 和自定义二进制 CQL3(即 Cassandra 查询语言第3版 —— 译者注)

  • 可以灵活调整对数据的分布式或备份式存储(通过设置N,R,W之间的关系)(NRW是数据库布署模型中的概 念,N是存储网络中复制数据的节点数,R是网络中读数据的节点数,W是网络中写数据的节点数。一个环境中N值是固定的,设置不同的WR值组合能在数据可用 性和数据一致性之间取得不同的平衡,可参考 CAP 定理 —— 译者注)
  • 按列查询,按keys值排序后存储(需要包含你想要搜索的任何信息)(Cassandra 的数据模型借鉴自 BigTable 的列式存储,列式存储可以理解成这样,将行ID、列簇号,列号以及时间戳一起,组成一个Key,然后将Value按Key的顺序进行存储 —— 译者注)
  • 类似 BigTable 的特性:列、列簇
  • 支持分布式 hash 表,使用“类 SQL” 语言 —— CQL(但没有 SQL 中的 JOIN 语句)
  • 可以为数据设置一个过期时间(使用 INSERT 指令)
  • 写性能远高于读性能(读性能的瓶颈是磁盘 IO)
  • 可使用 Hadoop 的映射和简化(map/reduce)编程模型
  • 所有节点都相似,这点与 Hadop/HBase 架构不同
  • 可靠的跨数据中心备份解决方案

应用场景:

  • 写操作多于读操作的环境(比如日志系统)
  • 如果系统全部由 JAVA 组成(“没人会因为使用了 Apache 许可下的产品而被炒鱿鱼”(此句貌似是网上有人针对“Apache considered harmful”一文所作的回应 —— 译者注))

使用案例:

银行、金融机构;写性能强于读性能,所以 Cassandra 天生就是用来作数据分析的。

Hypertable 0.9.6.5版

开发语言: C++

主要特性: HBase 的精简版,但比 HBase 更快

许可证: GPL 2.0

数据传输格式: Thrift,C++库,或者 HQL shell

  • 采用与 Google BigTable 相似的设计
  • 运行在 Hadoop HDFS 之上
  • 使用自己的“类 SQL”语言 —— HQL
  • 可以根据 key 值、单元(cell)进行查找,可以在列簇上查找
  • 查询数据可以指定 key 或者列的范围
  • 由百度公司赞助(百度早在2009年就成为这个项目的赞助商了 —— 好吧译者表示有点大惊小怪了:P)
  • 能保留一个值的 N 个历史版本
  • 表在命名空间内定义
  • 使用 Hadoop 的 Map/reduce 模型

应用场景:

  • 假如你需要一个更好的HBase,就用Hypertable吧

使用案例:

与HBase一样,就是搜索引擎被换了下;分析日志数据的系统;适用于浏览大规模二维非关系型数据表。

Accumulo 1.4版

开发语言: Java 和 C++

主要特性: 一个有着单元级安全的 BigTable

许可证: Apache

数据传输格式: Thrift

  • 另一个 BigTable 的复制品,也是跑在 Hadoop 的上层
  • 单元级安全保证
  • 允许使用比内存容量更大的数据列
  • 通过 C++ 的 STL 可保持数据从 JAVA 环境的内存映射出来
  • 使用 Hadoop 的 Map/reduce 模型
  • 支持在服务器端编程

应用场景:

  • HBase的替代品

使用案例:

与HBase一样,就是搜索引擎被换了下;分析日志数据的系统;适用于浏览大规模二维非关系型数据表。


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部