讲讲NoSQL比较火的三个数据库MemcachedRedisMongoDB

38次阅读

共计 3224 个字符,预计需要花费 9 分钟才能阅读完成。

前言

NoSQL,泛指非关系型的数据库。随着互联网不断的发展,传统的关系数据库在应付新互联网模式的网站,特别是超大规模和高并发的 SNS 类型的纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL 数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。而今天主要讲用得比较多的三个 NoSQL:Memcached、Redis、MongoDB。

Memcached

优点
1.Memcached 可以利用多核优势,单实例吞吐量极高,可以达到几十万 QPS(取决于 key、value 的字节大小以及服务器硬件性能,日常环境中 QPS 高峰大约在 4 -6w 左右)。适用于最大程度扛量。

2. 支持直接配置为 session handle。

缺点
1. 只支持简单的 key/value 数据结构,不像 Redis 可以支持丰富的数据类型。

2. 无法进行持久化,数据不能备份,只能用于缓存使用,且重启后数据全部丢失。

3. 无法进行数据同步,不能将 MC 中的数据迁移到其他 MC 实例中。

4.Memcached 内存分配采用 Slab Allocation 机制管理内存,value 大小分布差异较大时会造成内存利用率降低,并引发低利用率时依然出现踢出等问题。需要用户注重 value 设计。

Redis

优点
1. 支持多种数据结构,如 string(字符串)、list(双向链表)、dict(hash 表)、set(集合)、zset(排序 set)、hyperloglog(基数估算)。

2. 支持持久化操作,可以进行 aof 及 rdb 数据持久化到磁盘,从而进行数据备份或数据恢复等操作,较好的防止数据丢失的手段。

3. 支持通过 Replication 进行数据复制,通过 master-slave 机制,可以实时进行数据的同步复制,支持多级复制和增量复制,master-slave 机制是 Redis 进行 HA 的重要手段。

4. 单线程请求,所有命令串行执行,并发情况下不需要考虑数据一致性问题。

5. 支持 pub/sub 消息订阅机制,可以用来进行消息订阅与通知。

6. 支持简单的事务需求,但业界使用场景很少,并不成熟。

缺点
1.Redis 只能使用单线程,性能受限于 CPU 性能,故单实例 CPU 最高才可能达到 5 -6wQPS 每秒(取决于数据结构,数据大小以及服务器硬件性能,日常环境中 QPS 高峰大约在 1 -2w 左右)。

2. 支持简单的事务需求,但业界使用场景很少,并不成熟,既是优点也是缺点。

3.Redis 在 string 类型上会消耗较多内存,可以使用 dict(hash 表)压缩存储以降低内存耗用。

MongoDB

优点
1. 更高的写负载,MongoDB 拥有更高的插入速度。

2. 处理很大的规模的单表,当数据表太大的时候可以很容易的分割表。

3. 高可用性,设置 M - S 不仅方便而且很快,MongoDB 还可以快速、安全及自动化的实现节点(数据中心)故障转移。

4. 快速的查询,MongoDB 支持二维空间索引,比如管道,因此可以快速及精确的从指定位置获取数据。MongoDB 在启动后会将数据库中的数据以文件映射的方式加载到内存中。如果内存资源相当丰富的话,这将极大地提高数据库的查询速度。

5. 非结构化数据的爆发增长,增加列在有些情况下可能锁定整个数据库,或者增加负载从而导致性能下降,由于 MongoDB 的弱数据结构模式,添加 1 个新字段不会对旧表格有任何影响,整个过程会非常快速。

缺点
1. 不支持事务。

2.MongoDB 占用空间过大。

3.MongoDB 没有成熟的维护工具。

Memcached、Redis、MongoDB 的区别

1. 性能
三者的性能都比较高,总的来讲:Memcached 和 Redis 差不多,要高于 MongoDB。

2. 便利性
Memcached 数据结构单一。

Redis 丰富一些,数据操作方面,Redis 更好一些,较少的网络 IO 次数。

MongoDB 支持丰富的数据表达,索引,最类似关系型数据库,支持的查询语言非常丰富。

3. 存储空间
Memcached 可以修改最大可用内存,采用 LRU 算法。

Redis 在 2.0 版本后增加了自己的 VM 特性,突破物理内存的限制;可以对 key value 设置过期时间(类似 memcached)。

MongoDB 适合大数据量的存储,依赖操作系统 VM 做内存管理,吃内存也比较厉害,服务不要和别的服务在一起。

4. 可用性
Memcached 本身没有数据冗余机制,也没必要;对于故障预防,采用依赖成熟的 hash 或者环状的算法,解决单点故障引起的抖动问题。

Redis,依赖客户端来实现分布式读写;主从复制时,每次从节点重新连接主节点都要依赖整个快照, 无增量复制,因性能和效率问题,所以单点问题比较复杂;不支持自动 sharding, 需要依赖程序设定一致 hash 机制。一种替代方案是,不用 redis 本身的复制机制,采用自己做主动复制(多份存储),或者改成增量复制的方式(需要自己实现),一致性问题和性能的权衡。

MongoDB 支持 master-slave,replicaset(内部采用 paxos 选举算法,自动故障恢复),auto sharding 机制,对客户端屏蔽了故障转移和切分机制。

5. 可靠性
Memcached 不支持,通常用在做缓存,提升性能。

Redis 支持(快照、AOF):依赖快照进行持久化,aof 增强了可靠性的同时,对性能有所影响。

MongoDB 从 1.8 版本开始采用 binlog 方式支持持久化的可靠性。

6. 一致性
Memcached 在并发场景下,用 cas 保证一致性。

Redis 事务支持比较弱,只能保证事务中的每个操作连续执行。

MongoDB 不支持事务。
7. 数据分析

MongoDB 内置了数据分析的功能(mapreduce),其他两者不支持。

8. 应用场景
Memcached:用于在动态系统中减少数据库负载,提升性能;做缓存,提高性能(适合读多写少,对于数据量比较大,可以采用 sharding)。

Redis:数据量较小的高性能操作和运算上。

MongoDB:主要解决海量数据的访问效率问题。

总结分析

1. 若是简单的存取 key-value(主要是读)这样的数据用 Memcached 好一些。若是要支持数据持久化,量也不大,操作很频繁,多数据类型(如集合、散列之类的),用列表类型做队列之类的高级应用,就用 Redis,但如果是数据量比较大时就采用 MongoDB。

2.Memcached 的很多客户端更加成熟稳定,Redis 协议比 Memcached 复杂。Redis 不可能比 Memcached 快?但是测试结果基本是 Redis 占绝对优势。

3. 云数据库 Memcached 版实例中的数据是存储在内存中的,当出现宕机、机房断电等意外,或是云数据库 Memcached 版实例在正常升级维护时,内存中的数据均会丢失。因此,云数据库 Memcached 版不能作为持久化的数据存储服务使用。Redis 的数据都存放在内存中,如果没有配置持久化,Redis 重启后数据就全丢失了,于是需要开启 Redis 的持久化功能,将数据保存到磁盘上,当 Redis 重启后,可以从磁盘中恢复数据,实现持久化。

4. 对于 Redis 和 MongoDB 来说,大家一般称之为 Redis 缓存、MongoDB 数据库。Redis 主要把数据存储在内存中,其“缓存”的性质远大于其“数据存储“的性质,其中数据的增删改查也只是像变量操作一样简单;MongoDB 却是一个“存储数据”的系统,增删改查可以添加很多条件,就像 SQL 数据库一样灵活。

5.MongoDB 和 Redis 都是 NoSQL,采用结构型数据存储。二者在使用场景中,存在一定的区别,这也主要由于二者在内存映射的处理过程,持久化的处理方法不同。MongoDB 建议集群部署,更多的考虑到集群方案,Redis 更偏重于进程顺序写入,虽然支持集群,也仅限于主 - 从模式。

相关资料

Nosql 简介 Redis,Memchche,MongoDb 的区别

正文完
 0