什么是 NOSQL
NoSQL(NoSQL = Not Only SQL),意即“不仅仅是 SQL”,是一项全新的数据库理念,泛指非关系型的数据库。
为什么需要 NOSQL
随着互联网的高速崛起,网站的用户群的增加,访问量的上升,传统数据库上都开始出现了性能瓶颈,web 程序不再仅仅专注在功能上,同时也在追求性能。所以 NOSQL 数据库应运而上,具体表现为对如下三高问题的解决:
· High performance – 对数据库高并发读写的需求
web2.0 网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要达到每秒上万次读写请求。关系数据库应付上万次 SQL 查询还勉强顶得住,但是应付上万次 SQL 写数据请求,硬盘 IO 就已经无法承受了。其实对于普通的 BBS 网站,往往也存在对高并发写请求的需求,例如网站的实时统计在线用户状态,记录热门帖子的点击次数,投票计数等,因此这是一个相当普遍的需求。
· Huge Storage – 对海量数据的高效率存储和访问的需求
类似 Facebook,twitter,Friendfeed 这样的 SNS 网站,每天用户产生海量的用户动态,以 Friendfeed 为例,一个月就达到了 2.5 亿条用户动态,对于关系数据库来说,在一张 2.5 亿条记录的表里面进行 SQL 查询,效率是极其低下乃至不可忍受的。再例如大型 web 网站的用户登录系统,例如腾讯,盛大,动辄数以亿计的帐号,关系数据库也很难应付。
· High Scalability && HighAvailability- 对数据库的高可扩展性和高可用性的需求
在基于 web 的架构当中,数据库是最难进行横向扩展的,当一个应用系统的用户量和访问量与日俱增的时候,你的数据库却没有办法像 web server 和 app server 那样简单的通过添加更多的硬件和服务节点来扩展性能和负载能力。对于很多需要提供 24 小时不间断服务的网站来说,对数据库系统进行升级和扩展是非常痛苦的事情,往往需要停机维护和数据迁移。
什么是 Redis
Redis 是用 C 语言开发的一个开源的高性能键值对(key-value)数据库,官方提供测试数据,50 个并发执行 100000 个请求, 读的速度是 110000 次 /s, 写的速度是 81000 次 /s,且 Redis 通过提供多种键值数据类型来适应不同场景下的存储需求,目前为止 Redis 支持的键值数据类型如下:
· 字符串类型 string(常用:json/xml)
· 散列类型 hash(key value key–value(map) )
· 列表类型 list linkedlist 用户列表
· 集合类型 set
· 有序集合类型 sortedset
Redis 的应用场景
· 缓存(数据查询、短连接、新闻内容、商品内容等等)
· 聊天室的在线好友列表
· 任务队列(开发中常用 ActiveMQ 或者 RabbitMQ)(秒杀、抢购、12306 等等)
· 应用排行榜
· 网站访问统计
· 数据过期处理(可以精确到毫秒)
· 分布式集群架构中的 session 分离
字符串类型 string
字符串类型是 Redis 中最为基础的数据存储类型,字符串在 Redis 中是二进制保存,因此是安全的,这便意味着该类型存入和获取的数据相同。
在 Redis 中字符串类型的 Value 最多可以容纳的数据长度是 512M。
哈希类型 hash
Redis 中的 Hash 类型可以看成具有 StringKey 和 String Value 的 map 容器。
所以该类型非常适合于存储值对象的信息。
如 username、password 和 age 等。
如果 Hash 中包含很少的字段,那么该类型的数据也将仅占用很少的磁盘空间。
每一个 Hash 可以存储 4294967295 个键值对。
列表类型 list
在 Redis 中,List 类型是按照插入顺序排序的字符串链表。和数据结构中的普通链表一样,我们可以在其头部 (left) 和尾部 (right) 添加新的元素。
在插入时,如果该键不存在,Redis 将为该键创建一个新的链表。
如果链表中所有的元素均被移除,那么该键也将会被从数据库中删除。
List 中可以包含的最大元素数量是 4294967295
集合类型 set
在 Redis 中,我们可以将 Set 类型看作为没有排序的字符集合,和 List 类型一样,我们也可以在该类型的数据值上执行添加、删除或判断某一元素是否存在等操作。需要说明的是,这些操作的时间复杂度为 O(1),即常量时间内完成次操作。Set 可包含的最大元素数量是 4294967295,和 List 类型不同的是,Set 集合中不允许出现重复的元素。
其他:
Redis5.0 新增 API Timesand cluster api RDB 现在存储 LFU 和 LRU LFU –》叫做最近最少使用算法 LRU—> 叫做最近最常使用算法
集群管理器从 Ruby 移植到 C 代码 通过 Redis 脚本可以直接创建
新的 sorted set 命令 ZPOPMIN/MAX 和 阻塞变种 作用去除集合中分值最大和最小的值
主动内存碎片整理
增强 HyperLogLog 实现 通过算法估算内存基数
更好的内存统计报告
更好的帮助命令
客户端经常连接和断开性能更好
错误修复和改进
jemjemalloc 升级到 5.1 版本 内存分配器