共计 3843 个字符,预计需要花费 10 分钟才能阅读完成。
本文探讨了互联网公司的技术架构,波及 DNS、负载平衡、长连贯、API 网关、PUSH 推送、微服务、分布式事务以及相干撑持的根底服务。次要是为了学习,心愿能够给大家一个参考。
整体架构
APP、PC 以及第三方等调用方通过传统的域名解析服务 LocalDNS 获取负载均衡器的 IP,APP 能够通过 HttpDNS 的形式来实现更实时和灵便精准的域名解析服务。
通过负载均衡器达到对立接入层,对立接入层保护长连贯。
API 网关作为微服务的入口,负责协定转换、申请路由、认证鉴权、流量管制、数据缓存等。业务 Server 通过 PUSH 推送零碎来实现对端的实时推送,如 IM、告诉等性能。
业务 Server 之间通过专有的 RPC 协定实现互相调用,并通过 NAT 网关调用内部第三方服务。
域名解析
传统 DNS
DNS(Domain Name System)域名零碎,一种分布式网络目录服务,用于域名与 IP 地址的互相转换,可能使人更不便的拜访互联网,而不必去记住机器的 IP 地址。
DNS 的解析过程如下:
- 客户端递归查问 LocalDNS(个别是 ISP 互联网服务提供商提供的边缘 DNS 服务器)获取 IP。
- LocalDNS 迭代查问获取 IP,即一直的获取域名服务器的地址进行查问。
HttpDNS
挪动解析(HttpDNS)基于 Http 协定向 DNS 服务器发送域名解析申请,代替了基于 DNS 协定向运营商 LocalDNS 发动解析申请的传统形式。
它能够防止 LocalDNS 造成的域名劫持和跨网拜访问题,解决挪动互联网服务中域名解析异样带来的困扰。
以腾讯云 HttpDNS 为参考,相较于传统 LocalDNS 的劣势比照:
负载平衡
为了解决单台机器的性能问题以及单点问题,须要通过负载平衡将多台机器进行程度扩大,将申请流量散发到不同的服务器下面。
客户端的流量首先会达到负载平衡服务器,由负载平衡服务器通过肯定的调度算法将流量散发到不同的应用服务器下面。
同时负载平衡服务器也会对应用服务器做周期性的健康检查,当发现故障节点时便动静的将节点从应用服务器集群中剔除,以此来保障利用的高可用。
网络负载平衡次要有硬件与软件两种实现形式,支流负载平衡解决方案中,硬件厂商以 F5 为代表,软件次要为 LVS、NGINX、HAProxy。
技术原理上分为 L4 四层负载平衡和 L7 七层负载平衡。
L4 vs L7
L4 四层负载平衡工作于处于 OSI 模型的传输层,次要工作是转发。它在接管到客户端报文后,须要理解传输层的协定内容,依据预设的转发模式和调度算法将报文转发到应用服务器。
以 TCP 为例,当一个 TCP 连贯的初始 SYN 报文达到时,调度器就抉择一台服务器,将报文转发给它。
尔后通过查发报文的 IP 和 TCP 报文头地址,保障此连贯的后继报文被转发到该服务器。
L7 七层负载平衡工作在 OSI 模型的应用层,次要工作就是代理。七层负载平衡会与客户端建设一条残缺的连贯并将应用层的申请解析进去,再依照调度算法抉择一个应用服务器,并与应用服务器建设另外一条连贯将申请发送过来。
LVS 转发模式
LVS(IP 负载平衡技术)工作在 L4 四层以下,转发模式有:
- DR 模式
- NAT 模式
- TUNNEL 模式
- FULL NAT 模式
①DR 模式(间接路由)
改写申请报文的 MAC 地址,将申请发送到实在服务器,而实在服务器将响应间接返回给客户。
要求调度器与实在服务器都有一块网卡连在同一物理网段上,并且实在服务器须要配置 VIP。
②NAT 模式(网络地址转换)
调度器重写申请报文的指标地址,依据预设的调度算法,将申请分派给后端的实在服务器;实在服务器的响应报文通过调度器时,报文的源地址被重写,再返回给客户,实现整个负载调度过程。要求负载平衡须要以网关的模式存在于网络中。
③TUNNEL 模式
调度器把申请报文通过 IP 隧道转发至实在服务器,而实在服务器将响应间接返回给客户,所以调度器只解决申请报文。要求实在服务器反对隧道协定和配置 VIP。
④FULL NAT 模式
在 NAT 模式的根底上做一次源地址转换(即 SNAT),做 SNAT 的益处是能够让应答流量通过失常的三层路由回到负载平衡上,这样负载平衡就不须要以网关的模式存在于网络中了。
性能要逊色于 NAT 模式,实在服务器会失落客户端的实在 IP 地址。
调度算法
①轮询
将内部申请按程序轮流调配到集群中的实在服务器上,它均等地看待每一台服务器,而不论服务器上理论的连接数和零碎负载。
②加权轮询
权值越大调配到的拜访概率越高,次要用于后端每台服务器性能不平衡的状况下,达到正当无效的地利用主机资源。
③起码连贯
将网络申请调度到已建设的链接数起码的服务器上。如果集群零碎的实在服务器具备相近的零碎性能,采纳 ” 最小连贯 ” 调度算法能够较好地平衡负载。
④哈希
将指定的 Key 的哈希值与服务器数目进行取模运算,获取要求的服务器的序号 一致性哈希。
思考到分布式系统每个节点都有可能生效,并且新的节点很可能动静的减少进来,一致性哈希能够保障当零碎的节点数目发生变化时尽可能减少拜访节点的挪动。
API 网关
API 网关(API Gateway)是一个服务器集群,对外的惟一入口。从面向对象设计的角度看,它与外观模式相似。
API 网关封装了零碎外部架构,对外提供 REST/HTTP 的拜访 API。同时还具备其余非业务相干的职责,如身份验证、监控、负载平衡、缓存、流量管制等。
API 治理
API 网关外围性能是 API 治理。提供 API 的残缺生命周期治理,包含创立、保护、公布、运行、下线等根底性能;提供测试,预公布,公布等多种环境;提供版本治理,版本回滚。
API 配置包含前端配置和后端配置:
- 前端配置指的是 Http 相干的配置,如 HTTP 办法、URL 门路,申请参数等。
- 后端配置指的是微服务的相干配置,如服务名称、服务参数等。这样通过 API 配置,就实现了前端 Http 到后端微服务的转换。
全异步
因为 API 网关次要解决的是网络 I/O,那么通过非阻塞 I/O 以及 I/O 多路复用,就能够达到应用大量线程承载海量并发解决,防止线程上下文切换,大大增加零碎吞吐量,缩小机器老本。
罕用解决方案有 Tomcat/Jetty+NIO+Servlet3.1 和 Netty+NIO,这里举荐 Netty+NIO,能实现更高的吞吐量。
Spring 5.0 推出的 WebFlux 反应式编程模型,特点是异步的、事件驱动的、非阻塞,外部就是基于 Netty+NIO 或者 Servlet 3.1 Non-Blocking IO 容器实现的。
链式解决
链式解决即通过责任链模式,基于 Filter 链的形式提供了网关根本的性能,例如:路由、协定转换、缓存、限流、监控、日志。也能够依据理论的业务须要进行扩大,但留神不要做耗时操作。
Spring Cloud Gateway(基于 Spring WebFlux)的工作机制大体如下:
- Gateway 接管客户端申请。
- 客户端申请与路由信息进行匹配,匹配胜利的才可能被发往相应的上游服务。
- 申请通过 Filter 过滤器链,执行 pre 解决逻辑,如批改申请头信息等。
- 申请被转发至上游服务并返回响应。
- 响应通过 Filter 过滤器链,执行 post 解决逻辑。
- 向客户端响应应答。
申请限流
申请限流是在面对未知流量的状况下,避免零碎被冲垮的最初一道无效的防线。能够针对集群、业务零碎和具体 API 维度进行限流。
具体实现能够分为集群版和单机版,区别就是集群版是应用后端对立缓存如 Redis 存储数据,但有肯定的性能损耗;单机版则在本机内存中进行存储(举荐)。
罕用的限流算法:
- 计数器
- 漏桶
- 令牌桶(举荐)
熔断降级
①服务熔断
当上游的服务因为某种原因忽然变得不可用或响应过慢,上游服务为了保障本人整体服务的可用性,不再持续调用指标服务,间接返回,疾速开释资源。如果指标服务状况恶化则复原调用。
熔断是为了解决服务雪崩,特地是在微服务体系下,通常在框架层面进行解决。
外部机制采纳的是断路器模式,其外部状态转换图如下:
②服务降级
当负荷超出零碎整体负载承受能力时,为了保障外围服务的可用,通常能够对非核心服务进行降级。
如果返回缓存内容或者间接返回,服务降级的粒度能够是 API 维度、性能维度、甚至是零碎维度,然而都须要事先进行服务级别的梳理和定义。
实在场景下,通常是在服务器负载超出阈值报警之后,管理员决定是扩容还是降级。
业务隔离
API 网关对立了非业务层面的解决,但如果有业务解决的逻辑,不同业务之间就可能会相互影响。
要进行业务零碎的隔离,通常能够采纳线程池隔离和集群隔离,但对于 Java 而言,线程是比拟重的资源,举荐应用集群隔离。
PUSH 推送
音讯推送零碎针对不同的场景推出多种推送类型,满足用户的个性化推送需要,并集成了苹果、华为、小米、FCM 等厂商渠道的推送性能,在提供控制台疾速推送能力的同时,也提供了服务端接入计划,不便用户疾速集成挪动终端推送性能,与用户放弃互动,从而无效地进步用户留存率,晋升用户体验。
①设施建连、注册、绑定用户流程
②音讯推送过程
在十分多的业务场景中,当业务产生时用户未必在线,也未必有网络。因而,在 MPS 中所有音讯均会被长久化。业务产生时,MPS 会尝试做一次推送(第三方渠道推送或自建的 TCP 连贯推送)。
自建渠道中,会通过查问缓存来判断用户的终端是否有 TCP 连贯,如果存在则推送,客户端收到推送音讯后,会给服务端回执,服务端即可更新音讯状态。
如果推送失败,或者回执失落,用户在下一次建设连贯时,会从新承受音讯告诉,同时客户端会进行逻辑去重。
微服务体系
作者:VectorJin
链接:https://juejin.cn/post/684490…