在没有呈现数据库之前,数据存储在文本中,这种数据存储形式不论是治理还是查问,效率都是极其低下的,数据之间没有关联性。到了1970年,IBM研究员 E.F.Codd 发表了论文"A Relational Model of Data for Large Shared Data Banks",该论文中第一次提出了关系模型的概念,为关系型数据库奠定了根底,才有了前面涌现的如IBM的DB2、甲骨文的Oracle等优良的关系型数据库。始终到上世纪90年代,数据库都是以关系型数据库为主。但随着数据量的增长,关系型数据库已无奈满足更多的利用场景,数据库畛域便随之呈现了非关系型数据库。
数据库分类
数据库用于数据的存储和拜访,不同类型的数据库也会满足不同的场景需要。如果你的数据库对事务没有要求,且读写是高并发的,那么你能够抉择一款非关系型数据库。如果你的数据库次要存储历史数据,且拜访频率少,那么你能够抉择一款高压缩比,且读优化的数据库。如果你的数据库既有交易类业务,又有简单剖析类业务,那么你能够抉择一款有混合存储引擎的数据库。
数据库依照数据模型来划分,可分为关系型数据库和非关系型数据库。关系型数据库的数据是高度组织化和结构化的,能够应用结构化查询语言进行简单的查问。非关系型数据库的数据是非结构化的,没有申明性查询语言,代表着不仅仅是SQL。关系型数据库重视事务的强一致性,而非关系型数据库重视可扩展性。数据库市场应用宽泛的关系型数据库有 Oracle 、 MySQL 、 SQL Server ,数据库市场应用宽泛的非关系型数据库有 Redis 、MongoDB 。
数据库依照数据分布来划分,可分为集中式数据库和分布式数据库。集中式数据库是一个或者多个数据库实例治理一份数据,每个数据库实例都能够看到全副数据,属于 Shared-Everything 架构。分布式数据库是每个数据库实例治理本人的数据,全量数据是所有数据库实例治理的数据的总和,属于 Shared-Nothing 架构。
数据库依照数据处理来划分,可分为 OLTP 数据库、OLAP 数据库以及 HTAP 数据库,StoneDB 就是一款一体化实时 HTAP 数据库,前面几个课程会给大家深刻介绍。OLTP 数据库实用于交易类零碎,特色是大并发的小型事务处理,单次解决的数据量小。OLAP 数据库实用于剖析类零碎,特色是并发小,零碎吞吐量高,单次解决的数据量大。HTAP 数据库是一种新型的架构,指的是混合事务和剖析处理过程,呈现 HTAP 的目标是突破 OLTP 和 OLAP 之间的壁垒。
数据库瓶颈
传统数据库通过五十多年的倒退,不论是数据库自身的稳定性,还是数据库厂商的技术支持度,都曾经十分的成熟。数据库厂商在官网提供的丰盛学习材料,对使用者来说很容易学习这款数据库。但随着时代的倒退,特地是呈现互联网技术,数据库的数据量是指数增长的,那么传统数据库不仅在并发和存储上存在瓶颈,在可扩展性也是无限的。
当传统关系型数据库呈现无奈满足业务场景的需要,如呈现高并发的海量数据存储时,呈现了分布式数据库。分布式数据库由多台服务器组成,不仅提供更多的连贯拜访,还提供更多的存储容量,在可扩展性方面也是线性的。分布式数据库解决了传统数据库的瓶颈,然而分布式数据库也不是完满的无懈可击。
在事务一致性方面,传统数据库很容易保障 ACID ,而分布式数据库由多个数据库实例组成,散布在一个网络环境中,为了保障事务的一致性,引入了两阶段提交、三阶段提交、弥补事务。分布式事务在治理开销也是较大的,比方对乐观锁的反对,尽管一致性读无需持有锁,但查问也可能会被阻塞。
在基于老本的执行打算方面,因为数据分布在不同的节点,再加上分布式算法的复杂度,SQL 是否能保障有一个稳固的执行打算。
在数据一致性方面,分布式数据库以多正本进行存储时,数据的一致性问题变得更为简单。假如正在更新某个正本时服务器产生故障,在这种状况下如何确保故障复原后服务器上的正本与其余正本保持一致。
国产数据库
多年来国外数据库厂商处于相对的主导地位,随着近几年IT国产化策略的提出,国内涌现出了多个数据库厂商,造成了百家争鸣。有倒退多年的关系型数据库,如达梦、人大金仓、南大通用等;有势头猛进的分布式交易型数据库,如 TiDB 、 OceanBase 等;也有操之过急的分布式剖析型数据库 GaussDB 。
(国产数据库)
StoneDB 作为自主设计、研发的国内首款基于 MySQL 内核打造的开源 HTAP 数据库,在同一个数据库实例中采纳行列混合存储的计划,解决了 TP 和 AP 的问题,同时可实现与 MySQL 的无缝切换。因为100%兼容 MySQL ,让运维变的更简略,用户的体验感也更加。
下节课咱们将带大家深刻理解 StoneDB 的零碎架构和性能特点,请继续关注。对于StoneDB的任何问题,都能够加我V征询:StoneDB_2022 。