关于运维:从预见到遇见-SAE-引领应用步入-Serverless-全托管新时代

简介: 阿里云 Serverless 利用引擎(简称 SAE)初衷是让客户不改任何代码,不扭转利用部署形式,就能够享受到微服务+K8s+Serverless 的残缺体验,开箱即用免运维。作为业界首款面向利用的 Serverlss PaaS,自 2018 年推出以来,受到了宽广用户的统一好评,各行各业企业客户的生产环境都在 SAE 上稳固运行。作者:黛忻 阿里云 SAE 产品经理 编辑 切换为居中增加图片正文,不超过 140 字(可选) 近年来,企业的数字化随着互联网的遍及倒退越来越快,技术架构也是几经更迭,尤其是在线业务局部。从最后的单体利用到分布式应用再到云原生利用,呈现了进阶式的变动。但带来便当的同时,也给企业带来了肯定的复杂度:新技术上手门槛高,容器和微服务就是两个典型的拦路虎。即使微服务化和容器化后,企业仍然须要关注服务器配置和运维、容量评估,还要面临高性能和稳定性的挑战,无奈享受云带来的最大价值。 编辑 切换为居中增加图片正文,不超过 140 字(可选) Serverless 的呈现,带来了跨越式的改革。为企业数字化转型带来了更多时机。在此模式下,服务器和操作系统的治理部署、运维、资源分配和扩缩容等全副由云厂商提供,计算能力真正像水电煤一样被提供。它可能将原先在传统应用环境中的通用能力转化成云服务,客户能够低成本、高效率地触达。 Serverless 最重要的价值能够演绎为三点: 通过基础设施解耦、极致弹性和故障主动解决等提供永远在线的服务,毋庸放心宕机。 通过高效的研发框架以及 DevOps 新形态,做到秒级市场响应。 抹平了头部互联网公司与传统企业之间技术竞争力的代差,让传统企业面临大量技术升级和重构时,可能慌慌张张,不会呈现人才缺口,甚至可能弯道超车。 编辑 切换为居中增加图片正文,不超过 140 字(可选) 增加图片正文,不超过 140 字(可选) 阿里云 Serverless 利用引擎(简称 SAE)初衷是让客户不改任何代码,不扭转利用部署形式,就能够享受到微服务+K8s+Serverless 的残缺体验,开箱即用免运维。作为业界首款面向利用的 Serverlss PaaS,自 2018 年推出以来,受到了宽广用户的统一好评,各行各业企业客户的生产环境都在 SAE 上稳固运行。 SAE 产品定位:全托管、免运维、高弹性的通用 PaaS 平台。反对开源微服务 / 开源定时工作框架 / Web 利用的全托管,提供开源加强 & 企业级个性。能够说 SAE 笼罩了利用上云的残缺场景,是利用上云的最佳抉择。 ...

June 8, 2022 · 2 min · jiezi

关于运维:融云-IMKit-Web-端上线带你感受开发效率的参差

面向对象编程的流行,把咱们带到了一个封装的魔法世界。将程序的一些办法和执行步骤暗藏起来,咱们通过 API 即可实现拜访和能力调用。关注【融云寰球互联网通信云】理解更多 或者正是因而,咱们也遗记了一些每天应用、司空见惯的利用背地,其实是本来非常复杂的技术。比方,IM 即时通讯。 前阵子,闹得满城风雨的“某公司技术负责人在公司账号开撕老板”事件中有一个细节是,老板要求一周上线即时通讯性能惹的技术团队暴怒。即时通讯如此常见,以至于人们简直忘了这其实是互联网利用中技术难度最高的性能之一,自研需耗时至多两个月能力实现。 相似这样令人哭笑不得的需要背地,除了对技术的不理解之外,也有实现形式带来的体验错落。 借助第三方服务,能够大大缩减这个过程。 单聊中一条音讯如何从发送端到达到服务器,再分发给接收端;群聊中音讯如何实现群成员的全副送达;如何判断用户的在线状态,如何设计离线推送告诉逻辑,如何实现音讯拉取和音讯状态同步。 所有的简约都不须要思考,程序的实现办法和执行步骤全副暗藏,只须要一个融云 IM SDK,开发者就能够通过简略接入取得残缺的能力。这就是封装的力量。而融云对产品和服务的封装,还在有限趋近开发者业务的指标状态,让接入过程更加简略,实现后果更加贴近预期。近期,融云 IMKit Web 端 SDK 上线。Web 用户点击在线体验 至此,IMKit SDK 实现 Android、iOS、Web 重点平台的笼罩,囊括单群聊、零碎告诉能力,内含高品质 UI,提供文本、表情、图片、GIF、语音、视频、援用、文件、地位等多种内置音讯类型,并反对自定义音讯满足客户个性化的音讯发送、展现需要。 对于开发者来说,IMKit SDK 以更强的产品化体现,更贴近市场的性能实现,让开发者体验到生产力的全面晋升。 IM 性能全 & UI 品质佳罕用会话列表性能全笼罩对会话音讯未读数解决、会话置顶、会话免打搅、全局音讯内容搜寻等罕用会话列表性能进行了 UI 封装,性能残缺,产品化水平高。 单群聊会话界面开箱即用提供标准化的一对一、多人群组 UI 聊天界面,封装了简单的音讯输出、内容展现逻辑等,开发者无需进行二次开发,开箱即用。 会话音讯列表 群聊界面 音讯类型残缺封装内置文本、表情、图片、语音、地位、GIF、小视频、文件等各种音讯类型及 UI 展现解决逻辑,也可通过自定义音讯性能实现非凡的音讯发送、展现需要。 反对 UI 自定义提供高品质 UI 及交互应用体验,并在标准化 UI 外反对高度自定义,可依据利用 UI 格调,灵便设置 UI 显示款式。 反对多种语言切换反对多语言切换性能,目前提供中文、英文、阿拉伯语,为有出海需要的客户提供更好的应用体验。 反对一键接入音视频完满承接融云一对一、多对多音视频通话能力,极简的音视频性能接入流程,提供单聊、群聊会话的音视频通话能力。 利用场景社交私信 趣味群聊 办公群组 零碎告诉 学习成本低,集成上线快产品化水平高,性能残缺,开箱即用;仅需几行代码,疾速实现集成。 代码实现清晰且提供规范的 IMKit 层接口文档,以 Web 端接口文档为例展现如下。 ① 依赖装置 通过 NPM 形式将 IMKit SDK 集成到您的 Web 我的项目中。 ...

June 8, 2022 · 1 min · jiezi

关于运维:一文看懂蚂蚁BizStack-云原生开发和治理平台

2022年5月26日,蚂蚁BizStack云原生开发和治理平台在“阿里云-云栖号”线上进行新品发布会。在数字化转型大背景下,企业如何解决业务麻利交付、科技继续治理难题?本次新品发布会由蚂蚁团体产品专家耿柳带来基于蚂蚁科技的实际和思考,分享蚂蚁BizStack产品能力和解决方案。速记汇合了BizStack云原生开发和治理平台新品发布会核心内容,干货满满。业界的痛点与挑战中国人民银行印发《金融科技倒退布局(2022-2025年)》 文件中指出金融机构应放慢数字化转型,强化金融科技审慎监管为主线的战略方针。该文件同时在重点工作中强调了健全金融科技治理体系,打造新型数字基础设施,激活数字化经营新动能,夯实可继续化发展根底等监管趋势和行业要求。 在落地过程中,企业(金融机构)如何晋升业技协同效力,减速业务翻新和继续架构优化这类问题是业内面临的通用难题,具体表现在两个层面: 第一层:科技不足继续治理和经营优化能力架构标准靠文档,设计和最终实现不匹配资产剖析靠人工,头痛医头脚痛医脚依赖关系盘根错节,排查全靠研发翻代码第二层:业务、架构、技术难以造成合力一句话需要,业务和技术沟通有鸿沟零碎烟囱竖井林立,反复造轮子协同难人员程度档次不齐,我的项目质效无保障针对以上业内痛点挑战问题,第二章将会开展聊聊蚂蚁架构治理和云原生利用开发的实际和思考。 蚂蚁的实际和思考以资产为外围的架构治理BASE方法论BASE(Baseline、Advice、Spread、Empower),即蚂蚁架构治理体系,用于保护组织架构规范、流传架构文化的机制和方法论。也具备蚂蚁架构底盘的含意。 什么是Baseline? 架构基线即软件工程实践、设计准则以及超域架构教训所积淀的一套架构标准、架构规范、架构元数据。 如何保护架构基线? 次要有软硬两层面的做法: 在硬性(Advice)层面通过技术手段建设架构度量机制,辨认架构坏滋味。在软性(Spread)层面通过文化宣导和经营机制,建设架构优化专项,造就架构师文化。如何实现对场景的赋能? 对一线研发人员,赋予重构倡议和重构辅助;对架构师,提供架构决策和架构演进倡议;对组织层面,撑持零碎关停并转和提效降本。 以畛域为外围的需要剖析和架构设计方法论 1.需要分析阶段,业务引领的领域建模,以业务需要和指标为导向,进行流程建模和业务规定细化。2.架构设计阶段,畛域驱动的微服务架构,通过事件、命令、聚合等形式,梳理限界上下文,定义微服务边界。3.代码实现阶段,契约导向的技术实现,通过构建技术模型,主动生成高质量代码框架,造成可复用的架构资产,辅助自动化测试。 BizStack 解决方案什么是 BizStack ? 横向来看,面向云原生利用的全生命周期,提供需要、设计、研发三个阶段的产品能力,提供一站式开发和治理解决方案。集成蚂蚁业务与技术最佳实际。纵向来看,向下连接分布式架构基础设施,向上撑持中台及业务利用,集成蚂蚁业务和技术最佳实际。产品能力蕴含业务建模、架构资产结构化、架构巡检治理、低代码开发、中台可扩大等。解决客户云原生转型过程中的业务建模剖析、架构布局治理、研发提效扩大等问题。接下来具体介绍一下BizStack 的4大产品模块和5大外围能力 4大产品模块包含: 1.需要时,面向业务分析师的业务剖析平台2.设计时,面向架构师的架构治理平台3.研发时,面向研发人员的利用开发平台4.提供组件继续积淀和治理剖析能力的资产市场。 5大外围能力包含: 外围能力1:利用全流程买通和笼罩,建设云原生一体化施行工艺实现从需要、设计、研发、运行的全流程笼罩,从业务模型、畛域模型、技术模型到代码实现的全链路买通 外围能力2:一体化架构治理和治理平台,使架构可视可管可控架构资产可视化,结构化主动保鲜;架构巡检平台化,反对场景自定义拓展;架构洞察智能化,辅助架构优化继续演进。 外围能力3:组件化开发,流程化编排,实现资产复用,晋升研发效率通过研发体系组件化、标准化、规范化,可缩小30%代码量,无效晋升研发效率。通过服务流程的可复用可扩大,能解决80%的共性流程问题,撑持业务疾速迭代。 外围能力4:基于扩大点框架的中台开发和继续经营能力平台化架构下,随着业务的扩大和复杂度晋升,面临业务和平台耦合、业务和业务抵触的问题。为了解决这两类问题,在业务中台方法论领导下,BizStack 提供了一套基于扩大点框架的中台开发和继续经营的能力。 在技术层面,中台利用通过扩大点框架凋谢定制化能力,业务利用基于凋谢的扩大点实现差异化需要,同时针对不同的业务利用,提供业务身份的机制进行业务隔离。在经营层面,实现商业能力和扩大点的可视化,反对需要的结构化分析和业务接入流程。 外围能力5:基于可视化服务编排的后端低代码能力在盘活架构资产的根底上,通过低代码托拉拽的形式,疾速组合不同服务节点类型,同时反对图灵齐备的逻辑表白和节点间的参数主动映射能力,提供齐备的事务一致性和稳定性保障,以及测试能力验证撑持,通过传统开发和低代码交融的形式,晋升后端研发效力。 BizStack 外围价值大图 BizStack 面向业务和科技的不同角色,通过业务剖析平台、架构治理平台、利用开发平台和资产市场等外围产品能力,构建一体化、可视化、标准化、可复用的企业级云原生架构体系,助力金融机构继续晋升业务交付效力和科技治理能力。 视频回顾观看:https://yqh.aliyun.com/live/d... 更多动向疾速理解蚂蚁BizStack,欢送扫码提交问卷!

June 8, 2022 · 1 min · jiezi

关于运维:RCGI-专栏-海外社交市场调研之地区篇上内含抽奖

拉至文末加入抽奖RCGI(RongCloud Global Insight)是融云行业研究院特地推出的剖析洞察专栏,聚焦社交、泛娱乐行业,立足寰球视线,解析用户需要,洞悉市场走势。关注【融云寰球互联网通信云】理解更多 依据 Frost & Sullivan 的统计和预测,2019 年寰球在线社交和娱乐利用用户达 38 亿,对应寰球人口渗透率为 49.5%,预计到 2024 年,寰球社交网络市场规模将达到 2644 亿美元,2021 年-2024 年寰球社交网络市场规模年复合增长率无望达到 12.2%。融云行业研究院制图 数据起源:Frost & Sullivan,光大证券研究所 社交市场规模微小,各类社交利用也成为了出海市场增长的重要力量。 当越来越多开发者把眼光聚焦到海内社交市场,如何意识海内市场的区域差别?如何了解不同利用的胜利因素?如何应答细分行业的机会和危险?如何欠缺本人的内容审核体系?都是咱们和出海开发者们须要重点思考的问题。 为此,融云行业研究院发展了一系列对于海内社交市场的钻研,从不同角度帮助开发者摸索出海时机,寻求增长可能。 本文是海内社交市场系列内容的开篇,总览寰球各大区,从区域差别的角度来对海内社交市场做一个深度梳理。 亚洲亚洲领有全世界 60% 的人口——47 亿,次要集中在中国、印度、东南亚和中东地区,人口天然增长率约为 1.3%。 亚洲的种族、民族形成非常复杂,尤以南亚为甚。 亚洲人口以黄种人为主,共有约 1000 个大小民族、种族,约占世界民族、种族总数的 80%。亚洲是道教、佛教、伊斯兰教、基督教和犹太教的发源地,不同地区的宗教信仰差别较大,在社交上体现为不同的风俗和禁忌等隐形规定。 亚洲在经济倒退上存在较大的地区差别,既存在人均GDP 达到 7 万美元的新加坡,又存在人均 GDP 有余 600 美元的阿富汗,因而亚洲的均匀数据难以代表具体国家和地区的倒退程度。 社交市场的开发者及相干从业者,应以更细化的分类来对待亚洲各个地区的人口、经济和文化。亚洲是应用智能手机人数最多的大洲,许多地区的手机市场几近饱和。 各大电商瞄准这点,掀起了一场社交软件市场之争,中国的微信、日本的 Line、美国的 WhatsApp 都在抢夺亚洲几十亿消费者市场,也曾经将手机服务扩大至集娱乐、游戏、转账领取为一体的综合服务。 欧洲欧洲人口约 7.5 亿,绝大部分是白种人,99% 属欧罗巴人种,种族形成十分繁多,多崇奉天主教和基督教,印欧语系的居民占全洲总人口的 95%。 欧洲城市化程度较高,城市人口约占总人口的 64%,人口散布绝对平均,均匀人口密度 70 人/平方千米,但人口呈负增长,欧洲东南发达国家人口老龄化问题比较严重。从经济总量来看,欧洲的 GDP 总量约为 20 万亿美元,其中德国、英国、法国分列前三,别离为 4.2 万亿、3.2 万亿、2.9 万亿美元。 欧洲各国的人均 GDP 差别较大,最高的卢森堡为 13.7 万美元,而最低的乌克兰仅为 4828 美元,这还是 2021 年的数据,经验战火的洗礼,乌克兰的人均 GDP 在 2022 年预计会持续缩小。2021 年欧洲各国 GDP 总量 数据起源:国际货币基金组织 ...

June 7, 2022 · 2 min · jiezi

关于运维:仅有-01M-可训参数AIOps-日志异常检测新范式

一、前言AIOps(Artificial Intelligence for IT Operations)即智能运维,基于已有的运维数据(日志、监控信息、利用信息等),将 AI 利用于运维畛域,来解决自动化运维无奈解决的问题。日志异样检测作为 AIOps 中的一个重要钻研方向,旨在通过日志理解零碎运行中的异样。因为日志数据的数据量微小,因而一旦产生日志异样,运维人员须要在大量的日志数据中查找异样,这是一个工作量微小并十分耗费老本的工作。因而通过将人工智能引入到日志异样检测中能够无效缩小运维人员的工作量。无关日志异样检测更为具体的内容,能够参照云智慧学术论坛第一期的内容。 二、Translog 模型只管当初曾经有很多利用日志序列(log sequence)中的语义信息,进行日志异样检测的深度学习模型,如 HDFS、BGL 或 Thunderbird,但这些模型都只能在繁多日志源上进行,语义信息仅实用于以后日志,无奈泛化到其余日志源。而以后大型零碎通常由多个不同组件形成,且不同组件打印的日志不尽相同,因而异样检测时须要针对每个日志源别离训练一个新模型,即保留多个模型的拷贝,参数量微小。同时,当零碎更新或降级引入新日志模式的组件时,现有的模型将无奈适配新组件打印的日志。 为解决上述问题,论文首先指出,尽管日志的起源不同但实际上却有着雷同的异样类型。只管它们在词法和句法上有所不同,但在语义上却是类似的。如上图中三个起源的日志(BGL,Thunderbird,Red Storm)都有着”unusual end of program“类型的异样。因而,该论文认为如果模型可能学习到不同日志源间可共享的异样语义常识,就可能在所有日志源中辨认出这一类型的异样。 基于此,该论文基于迁徙学习的思维提出了一种名为 Translog 的日志异样检测框架。与现有针对新日志源须要从零开始训练一个新的模型的异样检测办法不同,该框架通过 adapter 构造中的大量参数(<1M),将语义上的异样常识迁徙到指标日志源,或通过持续学习适配新的日志源,使得模型在多个日志源上都能有很好的体现。 三、办法 整体框架如上图所示。日志异样检测分为 pretraining 与 adapter-based tuning 两个阶段。对于新引入的日志源,模型首先在以后日志源上学习日志序列中可共享异样语义信息,再通过 adapter-based tuning 形式在新日志源上进行微调,学习新的常识。须要阐明的是,在这里默认日志曾经过解析解决,即模型的输出为每条日志所对应的模板。 在 Feature Extractor 局部,论文应用 sentence-bert 提取每个日志所对应模板的语义信息,将模板序列转换为具备雷同维度的向量序列。目前已有的办法中有的间接通过 BERT 对日志进行编码,以达到缩小日志模式解析过程中的信息损失的目标,然而思考到海量的日志数据,用 BERT 对每一条日志进行词嵌入是不事实的。 Translog 模型的次要构造是多层 transformer encoder。之所以选用多层 transformer encoder 构造,一是因为该构造曾经被 BERT 证实能够学习到通用的语言特色,并且能够被不同的上游工作所应用;二是因为在 transformer 构造中插入 adapter 进行扩大更加易操作。 在 pretraining 阶段,因为曾经对模板进行了语义信息提取,模型会从语义层面学习异样。这一阶段训练时的指标函数是二分类的 BCE loss,所有 transformer 中的参数都会更新,这些参数将会共享至下一阶段中,提供异样的语义常识,并不再更新。 在 adapter-based tuning 阶段,为了适应指标日志源,将会在 transformer 中插入 adapter,并且在训练过程中仅有 adapter 中的参数进行更新。因为 transformer 的参数蕴含了原日志源中异样的语义信息,同时 adapter 中具备残差连接结构,adapter 中的参数将重点学习 target domain 中独有的异样信息。其构造的灵活性还能够一直插入更多的 adapter 以适应一直新引入的日志源。 ...

June 7, 2022 · 1 min · jiezi

关于运维:0基础想学IT运维如何入门

先说it运维的两个特点:1.琐事多。屁大点事都会找你的,而且机器不论你是否在劳动,监控报警了就会有人给你打电话,或者本人写的脚本给你发信息,让你起床定位问题2.要懂得多。你负责的局部懂得要深,其余的局部都要懂一些。因为it运维波及的太广了,底层局部就有主机、存储、网络,两头有数据库、中间件、各种环境,下面还有各种利用,如果是在小公司做运维,你一个人要负责多个零碎,只精通一两项齐全搞不定。所以,如果你明确运维的方向的话,倡议先精通本人所涉猎的方面。而后要懂的个别常识包含:1.相熟Linux 环境,会编shell脚本2.懂网络,计算机网络技术相干的书看一看3.自学Python4.你甚至可能要懂oracle5.不晓得你负责的是不是传统运维,学一下虚拟化吧,这是将来趋势,如果是零根底入门,这一块先不必管这也只是小小倡议,你参考下就好了,知乎上大牛很多,我就不瞎bb了 我这有个运维交换群你能够进来看看,关注“孔明灯+”,回复“进群”,就能够了。次要是为一款叫做猎报的产品设计的群,这个猎报是一个运维工具,有运维告警、主动监控、报告下载等性能,性能比较完善,页面也简洁清晰目前能够绑定一台主机

June 6, 2022 · 1 min · jiezi

关于运维:应用性能前端监控字节跳动这些年经验都在这了

背景 字节跳动倒退至今,线上曾经有数量级宏大的 Web 我的项目,服务着数以亿计的用户。 随着用户数量的一直增长,对于站点体验掂量的的需要也日益紧迫,用户会将产品和他们每天应用的体验最好的 Web 站点进行比拟。想着手优化,则必须先有相干的监控数据,能力隔靴搔痒。 性能是留住用户的要害。 大量的钻研报告曾经表明了性能和商业问题的关系,蹩脚的性能会让您的站点损失用户数、转化率和口碑。谬误监控则可能让开发者第一工夫发现并修复问题,单靠用户遇到问题并反馈是不事实的,当用户遇到白屏或者接口谬误时,更多的人可能会重试几次、失去急躁而后间接关掉您的网站。 字节跳动开发团队依据外部数十款产品的体验监控需要,逐步打磨出了一版性能监控平台。通过一直的锻炼和积淀,正式在火山引擎上对外公布利用性能监控 全链路版。本文将会重点介绍它到底是一个怎么的监控平台,以及能够帮忙企业解决哪些痛点。产品简述 利用性能监控全链路版是字节跳动旗下的企业级技术服务平台,为企业提供针对应用服务的品质、性能以及自定义埋点的 APM 服务。 基于海量数据的聚合剖析,平台可帮忙客户发现多类异样问题,并及时报警,做调配解决,同时平台提供了丰盛的归因能力,包含且不限于异样剖析、多维分析、自定义上报、单点日志查问等,联合灵便的报表能力可理解各类指标的趋势变动。更多功能介绍,详见各子监控服务的功能模块阐明。产品亮点 该局部仅以整个产品的视角阐明了利用性能监控全链路版的亮点,更多技术亮点与劣势,咱们会在各功能模块中为您具体阐明。 更低的接入老本: 非侵入式 SDK 在接入 SDK 时,只须要初始化几行代码即可接入胜利。 npm install @apm-insight-web/rangers-site-sdk // 在我的项目最开始的中央引入上面的代码 import vemars from '@apm-insight-web/rangers-site-sdk/private' vemars('config', { app_id: {{你的appid}}, serverDomain: {{私有化部署服务器地址}}, }) 或者通过一段 JavaScript 脚本,间接通过 CDN 接入: <!-- 脚本 --> <!-- 页面 <head> 标签顶部增加以下代码 --> <script> (function(i,s,o,g,r,a,m){i["RangerSiteSDKObject"]=r;(i[r]=i[r]||function(){(i[r].q=i[r].q||[]).push(arguments)}),(i[r].l=1*new Date());(a=s.createElement(o)),(m=s.getElementsByTagName(o)[0]);a.async=1;a.src=g;a.crossOrigin="anonymous";m.parentNode.insertBefore(a,m);i[r].globalPreCollectError=function(){ir};if(typeof i.addEventListener==="function"){i.addEventListener("error",i[r].globalPreCollectError,true);i.addEventListener('unhandledrejection', i[r].globalPreCollectError)}if('PerformanceLongTaskTiming'in i){var g=i[r].lt={e:[]};g.o=new PerformanceObserver(function(l){g.e=g.e.concat(l.getEntries())});g.o.observe({entryTypes:['longtask']})}})(window,document,"script","{{你的CDN地址}}","RangersSiteSDK"); </script> <script> window.RangersSiteSDK("config",{ app_id: {{你的app_id}},serverDomain: {{私有化部署服务器地址}},}); </script> 更丰盛的异样现场还原能力 利用性能监控全链路版不仅帮忙您无死角地发现各类异样问题,还提供了丰盛的现场还原能力,包含且不限于堆栈回溯、用户交互还原等。 更灵便的采样形式,以节省开支 利用性能监控全链路版为您提供了采样配置,反对按功能模块设置采样、按用户设置采样,以帮忙您节俭事件量。 ...

June 2, 2022 · 3 min · jiezi

关于运维:网络站点可用性监测

简介您是否还在为无奈提前感知用户拜访体验而懊恼?您是否因为低质量的网站可用性而散失用户?随着用户拜访环境场景变得多样化,如何获取利用的实在用户体验,以及用户体验下降时及时预警进行解决至关重要。 为了帮忙您被动发现用户的体验问题,事后感知网络站点的谬误,“观测云” 为您提供了开箱即用的可用性监测解决方案。利用可笼罩寰球的监控网络,基于HTTP、TCP、ICMP、WEBSOCKET等不同协定的拨测工作,可疾速实现网络站点的可用性监测,您能够联合地区、运营商、工夫等维度,周期性的对URL站点品质进行实时监测,统计其可用状况,先于用户开掘站点的潜在问题,并及时定位问题产生起因。 前置条件您须要先创立一个观测云账号。 办法/步骤Step 1: 创立拨测工作在观测云工作空间「可用性监测」,点击「新建」即可创立基于HTTP、TCP、ICMP、WEBSOCKET等不同协定的拨测工作,周期性的监控相干网站、域名、后盾接口等,探测各地区用户选取不同运营商到各个服务接入点的性能情况和用户体验状况。 留神: 仅反对以后空间管理员「新建」拨测工作,其余空间成员仅反对名称、域名、类型、工作状态的信息查看等。免费版工作空间最多可创立 5 个拨测工作,且仅反对“中国区”拨测节点的应用,如需创立更多拨测工作或应用更多的国外拨测节点,请返回空间内「付费打算与账单」或观测云官网的「价格」页面进行降级。 Step 2: 自定义拨测工作基于您周期性的探测需要,您能够自定义拨测工作内容,包含: 抉择拨测类型:目前反对 HTTP、TCP、ICMP、WEBSOCKET的 协定申请;定义申请格局:输出URL,包含四种申请形式 GET、POST、PUT 和 HEAD; ● 高级设置:依据理论状况进行高级设置,包含申请设置、申请体内容、证书、代理、隐衷。 ● 名称:用户自定义的云拨测名称,在以后空间内不反对重名● 可用判断:反对增加判断条件匹配数据,当抉择多个判断条件时,多个判断条件之间是并且关系。● 抉择拨测节点:目前观测云 在寰球已笼罩16个节点,反对抉择中国地区、海内地区(仅反对商业版及以上版本用户)的一个或多个节点,,疾速开启站点的服务质量监测。● 抉择拨测频率:抉择云拨测的数据返回频率,反对1分钟(仅反对商业版及以上版本用户)、5分钟(仅反对商业版及以上版本用户)、15分钟(仅反对商业版及以上版本用户)、30分钟、1小时、6小时、12小时、1天等8种抉择 Step 3: 查看站点的可用性状态基于已选的检测频率,在配置实现后期待实现第一次检测(一个检测周期的工夫),即可通过「概览」和「查看器」查看不同拨测工作对应的站点可用性数据。例如:您抉择监测频率为“1h”, 配置实现后期待1-2个小时,即可查看相干数据 首先,通过「概览」,您能够通过从地区、城市、运营商等多个维度组合分析站点的可用率和响应工夫,联合丰盛的可视化数据分析体系,如地图,折线图,时序图等实时图表,切换上方「工夫组件」,您能够疾速剖析出变化趋势、散布等。其次,通过「查看器」,能够查看当前工作空间内存在的全副利用性能数据。 进阶参考自建节点观测云 反对通过「自建节点治理」疾速建设散布于寰球的公有部署节点,操作详情可参考自建节点治理,具体部署文档可参考网络拨测 。 观测云平台反对在寰球范畴内自建新的拨测节点,即通过「自建节点治理」您能够基于地理位置和运营商自建探测节点,对内/外网的服务站点进行可用性监测。如若您须要对企业内网进行云拨测,您须要在可拜访内网环境的服务器上部署 datakit 并配置您的公有部署节点。如若您须要对公网站点进行云拨测,无需非凡操作。 以减少如下节点为例: ●地理位置:Albania/Elbasan ●运营商:unicom ●节点 code: Albania-Elbasan-unicom ●节点名称:阿尔巴尼亚-爱尔巴桑州-联通 1 通过「可用性监测」-「自建节点治理」,点击「新建节点」,创立一个新的节点,输出以下内容,并点击确定疾速建设散布于寰球的服务质量监测点,减少您的服务质量检测范畴。 2 实现「新建节点」后,在「自建节点治理」的列表中获取该节点的「配置信息」 3 根据以上获取的配置信息,在具备节点能力的服务器中实现拨测节点的装置。 首先,请确保您的服务器已装置有最新版的 datakit。若您未装置 DataKit, 请返回工作台的「集成」-「DataKit」中进行装置。若您已装置有 dataKit,请确认其为最新版本的 datakit。 ●装置 DataKit 后,关上装置目录下的 conf.d/network,复制 dialtesting.conf.sample 并命名为 dialtesting.conf. ●将配置内容依填入 conf.d/network/dialtesting.conf 即可。 ...

June 1, 2022 · 1 min · jiezi

关于运维:运维领域告警智能定级原理探索含详细实验报告

引言很多大规模简单在线服务零碎,比方Google、Amazon、Microsoft和大型商业银行,蕴含数以千计的分布式组件,并同时反对大量用户应用。为了保障高质量服务和良好的用户体验,这些公司引入监控零碎,智能收集服务组件的监控数据,比方指标/KPI、日志和事件等。通常工程师会依据教训设定一些规定用来测验监控数据,确保在服务异样时产生告警。这也带来一个问题,大型服务零碎通常会不间断地被捕捉到大量告警音讯,远远超出预算范畴内装备的工程师人员所能解决的下限。为了解决这一难题,通常运维人员会设定一些规定,将这些告警音讯依照重大水平的轻重进行分级,确保无限的工程师资源优先解决那些重大等级较高的音讯,以此在零碎告警应答效率和工程师资源中获得最佳均衡。本文将对告警智能定级进行相干摸索与试验。 一、现状调研1、告警智能定级相干因子a. 文本特色告警音讯的语义信息可反映它的主题,依据教训常识将该主题的告警级别进行定性,从而可失去该告警音讯的告警级别。比方,如果告警音讯合乎某种非凡的日志异样特色,可依据该异样日志的重要水平对告警音讯进行定级。 b. 时空特色(1)呈现频率:个别频率越低,越有可能属于重大告警; (2)周期性:周期性越强,告警级别越低; (3)数量:短时间内大量暴发的告警应该予以器重;重大水平也应该思考在内。 (4)间隔时间:如果告警警报是在零碎运行一段时间后忽然产生的,告警级别可能很高,应该器重。 c. 其余特色(1)基于规定的告警级别:原始的告警级别 (2)告警工夫:业务忙碌时呈现的告警重大级别更高; (3)告警类型:比方利用、操作系统、网络、内存、中间件等,利用层面的告警级别更高,因为与服务稳定性和用户应用体验相干。 2、告警智能定级办法调研2.1 拓扑熵定级利用收回告警音讯的节点重要性对该告警音讯进行定级,这是一种间接的告警定级办法。目前对于香农熵在节点重要性评估方面有大量相干钻研,总体能够分为以下两个方面: (1)间接法。计算删除一个节点后和删除节点前网络图的熵差,熵差越大,阐明节点对网络的影响越大。将熵差作为该节点的熵值,熵越高,节点重要性越大。(2)间接法。包含degree、neighbor degree、strength、the weight of edges、betweenness、closeness centrality等计算指标来计算节点熵,熵值越高,节点重要性越大。 2.2 特色定级利用告警音讯的文本特色、时空特色、其余特色中的一种或者几种,根据先验常识或者某种规定,对告警音讯定级。 2.3 基于机器学习的特色定级机器学习办法进行告警智能定级是一种综合性的定级伎俩,该办法通过从告警音讯中提取相应的特色,包含文本特色、时空特色以及其余特色,造成特征向量,将该特征向量与自定义的定级级别组成数据与标签,在机器学习框架里进行训练,从而失去定级模型,不便对当前的告警音讯进行智能定级。这种办法综合思考了多种特色,毛病在于实现比较复杂,评估规范不对立,须要大量的试验与验证。 二、实际1、基于拓扑熵的告警定级试验1.1 试验原理香农熵的信息方程为 p示意事件产生可能性的概率,b是对数底数,信息实践里通常取值2。 熵:事件信息量的平均值。 对于图G(V,E),V示意顶点,E示意边; 节点度:与节点相连的边的数目,ki示意顶点vi的度; E :图中存在的连贯边总数。节点熵掂量的是——local ‘information’ that a given vertex carries about the global structure of the graph——对于整个网络节点携带的部分构造信息含量,节点熵越高,表明节点信息含量越大,阐明节点重要性越高。当节点熵计算所基于的概率(p,掂量节点在网络结构中携带信息的概率)定义不同时,计算熵的办法也不同。 表1 节点熵计算方法表 序号相干定义节点熵计算方法12345$$$$C_i^1log_2(\frac{1}{C_i^1}) $$$$61.2 试验数据指标网络拓扑如下图所示: 1.3 试验后果利用表1中的计算方法,对上述试验数据进行节点熵计算,后果如下: 序号拓扑熵计算结果序号拓扑熵计算结果1234561.4 试验论断依据拓扑熵的计算方法得出的节点重要性排序如下表所示,依据教训,4、5、8、9在该网络中应重要性靠前,6、7相比于1、2、3、10、11、12应重要性较大,在这个网络结构下,NVE和NVE'的排序后果更符合实际状况。在其余网络结构下,可能须要进一步具体问题具体分析。 对象论断2、基于告警文本特色的告警定级试验2.1 试验办法次要分为以下三个步骤: (1)告警数据预处理 分词(Tokenization):首先过滤掉符号,将残余文本分成词语;而后去除停用词,因为停用词在辨认重大告警时没有用途。 (2)提取文本熵 IDF(Inverse Document Frequency):词语呈现的频率越高,IDF越小 对每一个词: N是警报的总数量,Nw是蕴含词语w的告警数量 每个告警警报的熵计算方法如下: ...

June 1, 2022 · 1 min · jiezi

关于运维:蛟分承影雁落忘归-袋鼠云一站式全自动化运维管家-ChengYing承影正式开源

技术交换:30537511(钉钉群) 咱们兴奋的向大家发表一个好消息 DTstackCon新成员 袋鼠云一站式全自动化全生命周期运维管家 ChengYing(承影) 正式开源 我的项目地址 Github开源地址: https://github.com/DTStack/ch... Gitee开源地址: https://gitee.com/dtstack_dev... 官网文档: https://dtstack.github.io/che... 这是继ChunJun(纯钧)、Taier(太阿)后,袋鼠云数栈大数据名剑家族开源的第三支名剑,是袋鼠云开源我的项目史上又一里程碑事件,代表着数栈开源技术团队对于开源的信心与致力。 一、蛟 分 承 影ChengYing(承影)——承继于袋鼠云开源我的项目名剑家族的概念,取自十大名剑之承影剑。 ChengYing logo 承影铸于商朝,其出炉时两道剑光飞出,犹如蛟龙,有“蛟分承影,雁落忘归”之言,故名承影。承影为商天子佩剑,后由春秋时卫国藏剑名家孔周珍藏,相传其有影有形,为气随机而动,代表着如影随形时刻守护的意义,正如ChengYing作为袋鼠云数栈的运维管家,提供大数据产品的一站式部署、运维、监控服务,为客户提供平安稳固的产品部署与监控。 二、缘 启 承 影 ChengYing脱胎于袋鼠云数栈自主研发的一站式运维管家EasyManager,在ChengYing正式开源之前,开源技术团队于去年先开源了一款为近程对立治理主机端Agent生命周期而设计的零碎——EasyAgent,作为EasyManager的要害组件,能够实现数栈服务的装置、降级、卸载、启停和配置管理。 在EasyAgent开源后,受到了社区同学的广泛支持,与此同时社区对于EasyManager开源的呼声越发昂扬,秉持着袋鼠技术人“源于开源,回馈开源”的一贯初心,数栈开源技术团队通过决定将EasyManager也就是ChengYing开源,而EasyAgent作为ChengYing Agent 从新与大家见面。 通过不懈的致力,已经的构想终于在明天实现。ChengYing(承影)作为一站式全自动化全生命周期运维管家,提供大数据产品的一站式部署、运维、监控服务,其可实现产品部署、产品升级、版本回滚、扩缩节点、日志诊断、集群监控、实时告警等性能,致力于最大化节俭运维老本,升高线上故障率与运维难度,为客户提供平安稳固的产品部署与监控。 三、形 自 承 影 ChengYing的logo设计因循十大名剑的概念,联合我的项目自身个性,以字母“Y”为设计主元素,交融进剑的尖锐与尖利进行设计,利用坚硬的三角形去体现产品“稳固”的个性,而倒三角又体现着产品“撑持”的个性,而抉择比拟暗的蓝色也体现着咱们“幕后”的特点。 LOGO主体以字母“Y”与六边形的几何图形组成,有残缺、有组合、有散布、传播出本我的项目外围观点是一个全自动化生命周期的运维管家,其性能具备多样性与稳定性。 四、锋 出 承 影 ChengYing作为一站式全自动化全生命周期的运维管家,具备以下六大个性: 1►自动化部署 ChengYing通过规范化的步骤和参数约定制作出产品安装包,公布包中的Schema文件中配置了安装包中所有的服务,蕴含各服务的配置参数、健康检查参数,服务之间的依赖关系等。产品部署时可依据Schema中的相干配置实现一键全自动化部署。 2►界面化集群运维 Hadoop集群、大数据平台在日常运维中波及到的节点扩容缩容、组件进行启动、服务滚动重启、服务参数批改、版本升级与回滚等多种运维操作,通过逻辑化、流程化的产品界面展示,不便运维人员操作和监控,进步运维效率。 3►仪表盘集群监控 通过集成开源的prometheus和grafana,实现对集群、服务、节点的外围参数监控,并通过灵便形象的仪表盘进行数据展示。蕴含CPU占用率,RAM使用率、磁盘空间、I/O读写速率等外围参数进行监控,实时把握集群、服务、节点的运行状态,升高运维故障率。同时,反对用户自建仪表盘及监控项,实现自定义监控项。 4►实时告警 反对实时监控集群中各组件服务的运行指标,如CPU、内存、磁盘、读写IO等,并反对短信、钉钉、邮件告警通道配置,集成多种第三方音讯插件。当集群服务出现异常时,可触发告警条件,零碎将及时告诉接管人。 5►强拓展性 通过自研的ChengYing Agent Server形象出七大REST接口,装置、启动、进行、更新、配置批改、卸载、执行等与下层利用进行交互,可使agent类别和性能可轻松有限扩大。 6►平安稳固 数据安全、产品安全是大数据产品须要重点思考的问题。ChengYing在产品设计中过滤掉rm、drop等命令行,避免对数据库的误操作,通过更加平安的形式执行相干命令。同时提供服务的滚动重启、产品的断电重启,解决运维时服务不进行运行的场景并节俭运维工夫。 ►ChengYing操作页面 四、承 影 迭 代 ChengYing是一个用于大数据产品的一站式部署、运维、监控的规范产品,能够用于企业疾速搭建企业外部的大数据平台,基于现有版本曾经实现的性能,将来ChengYing将会打算: 1)服务编排:反对基于主机角色与服务类型主动编排,缩小人工操作老本; 2)部署形式:反对自定义部署产品包流水线程序; 3)平安认证:反对集群开启Kerberos认证,票据生成与下载; 4)监控告警:反对基于PromQL的自定义告警设置,丰盛告警类型; 5)对接内部:反对对接内部LDAP连贯; 6)操作系统:反对ubuntu零碎主机接入。 六、雁 落 忘 归 明天咱们开源了ChengYing,咱们晓得开源不是完结,而恰好是开始。从2018年咱们开源了第一个我的项目开始,4年间咱们先后开源了ChunJun(原FlinkX)、FlinkStreamSQL、jlogstash、EasyAgent、Doraemon、Molecule、Taier等我的项目,这段时间里咱们一直摸索技术上的冲破,将最新的技术成绩与大家共享,也从许多社区同学中取得颇多助益,在互助共享的气氛中与大家一起成长。 ...

June 1, 2022 · 1 min · jiezi

关于运维:运维人员为公司配置何种运维工具

每家企业都离不开网络,网络安全都与企业的失常运行非亲非故,只有网络安全了企业能力失常运作。每次网络受到内部病毒木马攻打,呈现网络故障时,咱们网络安全运维人员都要花费大把力量去排查日志,找到攻击方式和门路,堪称耗时耗力。 一般来讲,有的企业会装置一些平安检测或是运维监控的利用来辅助网安人员的日常工作,这样能够简化日志排查工夫,进步企业的运作效率,升高因网络中断而产生的损失。 目前来说,市面上的运维工具虽说还没到遍地开花,但也算目不暇接。 那么咱们应该如何抉择一个得心应手的平安运维工具呢? 以我来看,有两个硬性指标:一是运维监控和诊断优化; 二是运维流程自动化;据我所知能满足这两个指标的运维工具将来市场大到无奈掂量。 猎报平安就是这个畛域的一颗璀璨的新星之一,具备运维监控、威逼检测、自定义告警、订阅推送至微信、主动生成运维平安报告等性能(所有数据清晰简洁,和盘托出) 并且值得一提的是这款软件所占内存小到能够忽略不计,装置之后主机设施零累赘。由主机共享的平安日志,每天还能拿到几块钱情报收益。简略来说,就是咱们负责共享威逼情报,它负责统计数据、生成报告,并通过关联公众号处分GTI扫码即可进入微信小程序,点击注册获取新人加速卡,情报收益翻倍哦!!!这个是我的码,扫了我俩都能拿到加速卡,兄弟们快来一起下载、挂机贝兼钱。

June 1, 2022 · 1 min · jiezi

关于运维:百万IT毕业生的心声IT专业大学生毕业前必做的十件事

0001、搞定linux操作系统 Linux是一个开源的操作系统,但总是拿开源说事的话,对于没有深刻理解的同学来说可能不是能很分明的意识这个概念。这里我换个角度用大白话聊一聊linux,linux其实是属于喜爱“折腾”的人的,而恰好咱们计算机相关业余的同学是最须要符合这个属性的,通过一直地折腾,在折腾中成长的速度是飞快的。而且当初国内绝大多数公司产品部署都是应用的某个linux发行版本,而且随着linux内核反对namespace内核以及docker的诞生,云原生技术近些年来的迅猛发展,linux毫无疑问是咱们绕不开的一个门槛。 对于学习linux,咱们能够尝试着本人装置一次linux零碎,具体的发行版本我举荐的是ubuntu任意LTS版本即可,这个发行版本对于老手来说还是很敌对的,如果同学们有本人相熟的版本也是没问题的,具体的装置教程网络上有很多,这里就不列举了。 在装置实现之后咱们能够学习学习应用一些根本的命令,比方切换目录、查看文件、创立/删除文件、编辑文件,试试vim、更改明码等等,当你相熟命令行操作之后,你会发现用起来是真的爽,节省下来鼠标点来点去那个工夫的高兴是真的高兴。 (有mac的同学应用本人的mac就能够了,mac是UNIX内核,在mac上学习也能够达到一样的成果,至于我为什么在这里举荐的是linux,答:mac太贵了) 0010、注册一个本人的域名 咱们都晓得ip地址相当于网络的门牌号,然而点分十进制的IPV4地址真的很难记,更不用说是IPV6地址了,那么咱们就须要有一个助记符——域名,来帮忙记忆ip地址。 而且咱们在毕业前想要包装本人的话,咱们可能须要给本人打造一个品牌,比方一个有很多优质内容分享的博客网站,就像阮一峰、廖雪峰这些大佬一样,那么一个域名是必须要有的。 咱们在注册域名的时候能够留神一下域名的后缀,不同的后缀示意的含意都不一样的,比方.com就示意是一个商业组织或者公司,还有国家或者地区后缀,比方.cn是中国,.hk是香港特别行政区,又或者.gov .edu 政府部门、教育机构,所以在注册域名时最好搞清楚注册域名要做什么,注册的域名后缀是什么含意,这是一件十分有意义的事件。 (csdn开发云还没有域名注册) 0011、领有一台云主机 因为IPV4地址的寰球数量紧缺,咱们家用宽带当初简直都是在局域网内的,如果没有一个公网IP的话,咱们想做的很多事件都会受到限制,比方过搭建一个集体网站,开发一些应用程序等,都须要用到公网IP,而且咱们的服务器是须要24小时开机的,应用家用电脑的话首先是对咱们设施使用寿命会有很大的伤害,其次产生的电费也是一笔不小的开销,这时候咱们就能够抉择更不便实惠的云服务器来搭建咱们的应用程序,同时咱们购买服务器的时候个别应用的都是linux零碎,在应用服务器的同时也可能锤炼咱们对linux零碎的把握水平。 0100、搭建一个集体博客网站 在自我成长的过程中可能做出产出的程序员是很受大厂欢送的,而且将本人学到的货色清晰地形容进去是测验学习成绩的一个很无效的办法,所以咱们有必要搭建一个本人的集体博客,在产出的同时将其积攒起来,将来也是咱们简历上的一个很大的加分项。 然而搭建一个集体博客对于学生阶段的大家来说可能还是会有一些难度的,就比方在服务器下面搭建一个wordpress博客,咱们要装置nginx,mysql,php环境,也就是咱们常说的LNMP环境,而且还要写很多配置,无疑是减少了很多门槛。 然而当初很多云服务厂商都提供了集体博客wordpress的间接解决方案,咱们能够通过一些无代码工具进行搭建: (开发云如果有镜像仓库,可能一键拉起容器跑起来才是真的无代码,0配置的无门槛建站) 0101、公布优质内容,交换促成成长 在咱们搭建实现本人的集体博客之后,咱们就能够开始写一些博客来记录本人的学习经验了,或者分享一些咱们的开发教训、踩过的坑,分享一些本人写的工具类等等。同时也能够结交一些气味相投的敌人多多的进行交换探讨,这对咱们技术晋升的帮忙无疑是微小的。所以在咱们在公布博客的时候能够将本人的博客也在国内流量比拟大的平台比方CSDN,也公布一份,,在取得流量的同时也能够助力结交气味相投的敌人。 0110、关注/珍藏开源我的项目,纯熟应用git git是咱们开发人员必须!必须!必须!把握的一个技能,它是一个简略疾速,容许成千上万分支并行开发的齐全分布式的版本控制工具,是目前最支流的代码管理工具,当然咱们也能够应用git去管制咱们的一些文档之类的,也不仅仅局限于代码治理。 学习git:Git - Book Github是寰球最大的开源社区,是基于git的代码托管服务,然而他是在墙里面的,咱们如果须要应用一些代码托管服务的话,能够抉择咱们国内的gitcode,在领有很多优良我的项目的同时,也为咱们开发者提供了收费的集体仓库(github只有共有仓库是收费的),同时也能够创立组织(同样对于私密组织是收费的),进行多人合作开发,还不带上小伙伴们搞起来? 0111、加入IT类大赛,获得名次更佳 咱们在求职的时候,简历下面的一些含金量比拟高的奖项或者荣誉也是比拟大的加分项,而且加入较量的同时也能理解到一些前沿的技术,这里呢给大家举荐一个比赛平台:CSDN 比赛平台,这里会不定期地举办一些国内知名企业组织的较量,目前次要有四个赛道,人工智能算法、程序设计开发、公益学习、翻新创意,同时还有各种丰富的奖项,这里我感觉一些公益学习的较量能够重点关注一下,多理解把握一些比拟新的技术还是很有必要的。 1000、考一个含金量高的证书 咱们在校期间除了全国英语等级考试(四六级)证书之外,还能够考一些本业余相干的认证,有动向进事业单位单位的话就能够考一下软考/国家等级考试,玩linux的话能够试试red hat认证,还有甲骨文认证等等。 这里呢我自己考过一个C认证,在报名认证之后有收费配套的考生服务,有工程师业余领导,系统性的训练工程化能力以及交付能力,对我的晋升是除了实习工作之外最大的一部分。而且目前C认证的定位和目标都是比拟别具匠心的,对标大厂职级,解决企业招聘最初一公里的问题,目前市场认可度很高,单干企业也有很多出名大厂。大家能够释怀试一试。 1001、基于交付规范,开发一个可商业化的我的项目 咱们简历下面的我的项目经验一栏是十分重要的,这能反映出咱们在相干畛域残缺实战的经验和把握技术的利用能力,如果想要把简历写满的话,我的项目经验这里无非就是在校期间本人的一些实训课内容,这一点是很薄弱的,再好一点的话可能就是本人写过的小demo、小玩具,然而这些都不够加分,咱们最好的抉择是可能有一个达到可交付规范的,能够商业化的我的项目,这是一件十分棒的事件,简历上的我的项目经验这一栏就能够去自信满满的介绍本人的我的项目了,从而让面试官对你另眼相看。如果达不到这个程度的话,去考一次C认证,可能学到的货色足够了。 1010、四次寒假至多有一次名企访学/实习经验 学十年不如工作一年,我对这句话了解最粗浅的时候是我第一次实习的时候。自信满满的我面对工作抓耳挠腮天天加班,写的货色在代码review的时候永远都有很大的晋升空间。然而这也是晋升最大的时候。 大厂须要的人才,哪怕是对校招生来说,也是心愿可能进去就能上手干活,给公司产生效益,或者说是具备肯定的岗位技能,缩小造就老本。那么实习经验就是就能代表咱们通过了其余企业的筛选,是咱们领有这方能力的无效证实。所以咱们在校期间,在整个大学期间一共4次寒假,3次暑假,咱们应该至多有过一次实习经验,有两到三次最佳。 既然你曾经看到了这里,想给行将毕业,要从事运维职业的IT们举荐一款性价比很高的运维工具----猎报以后网络安全行业人才短缺已是不争事实,然而在数量差距难以补救的前提下,泛滥甲方平安运维人员日常仍要依附人工进行破绽巡检以及解决海量告警信息,同时争取在较短时间内进行响应。这种形式效率低下,对人员要求较高,在理论工作中的成果也常不现实,所以一个适合的、简洁高效的运维工具非常有必要。运维工具软件为应答来自内外部的网络与数据安全威逼,挺杂的,各种不同零碎利用的数据安全防护、补丁、桌面平安管控行为、准入管制、基线资产,这些扩散的、一直增多的平安零碎减轻了管理负担。很多理论环境不足对立的架构,数据难以集中,零碎间不足协同,使得平安成果十分无限。平安运维管理软件就是集网络准入管制、终端平安、设施、杀毒、服务器平安治理、数据防泄密、反APT攻打等零碎于一体,通过一个平台,对立框架,数据集中,实现更强更智能的平安爱护,加重平安管理负担,升高洽购和保护老本。基于此,通过打造自动化、智能化产品晋升平安运维人员的工作效率,成为不少新兴网络安全厂商的守业指标。(如果你也有举荐,欢送在评论区留言)目前接触到的比拟好的软件是[猎报平安],既能代替一部分传统人工浸透的工作,又能帮忙运维人员实现更高阶的判断解决。整个页面简洁明了,所有性能和盘托出 能够做到主机服务器近程运维和安全监控实时告警,有运维监控、威逼检测、自定义告警、订阅推送的性能。 对主机资源占用也很低,每天还有收yi。私信我获取沟通群二维码

June 1, 2022 · 1 min · jiezi

关于运维:观测云新数科技共同赋能企业数字化系统

近日,观测云(Guance.com)与新数科技(ShinData)达成生态单干框架协定,将充沛交融各自的当先技术与服务能力,造成优势互补,为企业客户提供更有深度的一体化解决方案,独特赋能企业数字化零碎,极大晋升数据管理能力和系统可靠性。 在寰球产业数字化与数字经济大背景下,数据无疑是企业的外围资产,且容量翻番的周期越来越短。如何治理好宏大的数据资源,以及平安和高效地应用数据服务,成为企业面临的新难题。 各种数据库、数据湖、数仓及前端业务零碎烟囱林立,泛滥零碎间的链路数也呈指数级增长,一套优良的端到端全链路可观测和数据库治理解决方案,是企业数字平台实现降本增效和平安经营的根底。   1、优势互补,高效治理企业数据平台对于新数科技 ShinData新数科技是业内数据库管理软件翻新引领企业,产品涵盖数据库dbPaaS云治理平台、数据迁徙传输平台、数据库安全管控平台和ShinDB数据库解决方案等。产品广泛应用于金融、制作、能源、批发和通信等行业企业,为宽广企业在新期间云计算、大数据、人工智能等环境下的数据库根底软件转型改革提供长久源能源。 随着企业数字化转型和IT体系的变动,更疾速的数据采集与存储剖析,更畅通的业务零碎数据共享,更平安的用户数据与隐衷保障等刚性需要日益凸显;同时数据库品种和数量成井喷式倒退,企业数据库利用的场景日益简单,带来了老本、平安、效率等各方面的事实问题。 作为深耕数据库畛域多年的翻新企业,新数科技始终保持自主翻新,独创了一体化、智能化、自助化的数据库云治理平台体系,冲破跨数据库品种、架构等技术限度,推出具备业内先进程度,满足市场需求的四大产品系列:ShinData DMP、ShinData DTS、ShinData DSC和ShinDB。   新数科技通过继续建构蕴含产业上下游企业的残缺生态体系,研发布局行业全产业链,丰盛产品线,实现在数据库生态布局的全面当先,助力企业将数据库的治理、运维、审核、平安管控等工作从传统的手工扩散模式,转变为对数据库资源对立和精细化管理模式。 新数科技CEO王伟斌示意:“新数科技与观测云本次单干,将促成单方在云原生观测、数据库治理经营等畛域的继续翻新单干。单方将从技术产品研发、客户服务反对及市场推广等方面互信共促,更好助力各行业用户数智化建设。”   2、全方位可观测,观测云让数据赋能企业对于观测云 观测云是国内当先的全链路可观测性产品,2022年4月取得中国信通院“先进级”(最高级别)评定。整套计划集成并自动化了基础设施监控、应用程序性能监控和日志治理,为整个技术栈提供实时可观测性。通过对指标、日志与链路的全面采集和聚合存储,向用户提供对立标签、对立界面、对立语言的可观测平台。 随着云计算技术的一直降级,承载业务的IT基础设施规模越来越大,各个利用间的链路关系也变得越来越简单,每时每刻都在产生海量级的日志。应用多个单功能监控工具或开源计划,会面临性能割裂,互相兼容适配性不稳固,和界面难以对立的问题。 观测云能让每一个团队,能够十分轻松地疾速构建全面的零碎可观测性;提供每两周一次性能迭代,与行业最新技术和最佳实际同步降级;通过弱小的可编程能力,用一套标准化产品,可发明实用于各种业务场景的千人千面可观测计划。   观测云CEO蒋烁淼示意:“数据库是企业客户最外围的数字零碎,也是能够暴露出最多指标参数的技术栈,传统的遥测技术能够看到这些参数,但很难去了解在不同业务场景下,这些参数的所含意义。与新数科技的单干,晋升了观测云在数据库监测方面的更深度能力,使观测的指标更清晰,更精确地联合业务需要,从而能更快地发现潜在问题和更全面地控制系统。心愿咱们的单干,能够持续深刻和扩充上来,继续为客户发明更多业务价值。”  将来,观测云和新数科技将一起继续秉持凋谢与共赢的单干理念,联合本身技术与实际劣势,携手产业上下游合作伙伴,为广大客户带来优质产品和高价值服务能力,独特为客户数字化转型与倒退保驾护航。

May 31, 2022 · 1 min · jiezi

关于运维:无需安装注册一行命令搞定内网穿透关键是完全免费

内网穿透,即NAT穿透,网络连接时术语。外网与内网的计算机节点须要连贯通信,映射端口能让外网的电脑找到处于内网的电脑,进步下载速度。 内网穿透的利用场景web 利用开发向外网公布开发的一些web demo,或者近程调试 API 接口 (如:微信公众号,企业号的开发) 内网利用的拜访公司内网部署的利用、数据库等,人员出差、或者长期外出,须要近程拜访、连贯调试等状况。 近程操控硬件设施物联网设施开发、调试 明天就给大家介绍一款更牛逼的神器:serveo 牛逼之处就在于它无需下载安装任何的软件,一条命令搞定!,更重要的是它完全免费! Serveo概述Serveo 是一个收费的内网穿透服务,Serveo 能够将本地计算机裸露在互联网上,官网称其为 Ngrok 的绝佳替代品。 serveo 最大长处是:无需装置、无需注册、利用SSH隧道即可间接应用。 Serveo工作原理Serveo SSH 服务器只是近程端口转发,当用户连贯到 Serveo 时,他们失去一个公共URL,任何人都能够应用连贯到 localhost 服务器。 我的项目地址: https://serveo.net 装置阐明无需装置,开箱即用。 服务器前提须要具备SSH性能,并且能失常链接互联网。 Serveo 应用实际将本地利用(HTTP服务)的 3000 端口映射到公网中将本地利用的3000端口映射到公网中 # 如果要转发其它端口,只需替换端口为其它就能够了$ ssh -R 80:localhost:3000 serveo.netHi thereForwarding HTTP traffic from https://heryum.serveo.netPress g to start a GUI session and ctrl-c to quit.第一次应用会提醒建设SSH会话,请输出yes确定。 建设会话胜利后,它会随机生成一个 xx.serveo.net 二级域名。你就能够应用浏览器拜访这个随机生成的二级域名 heryum.serveo.net 去拜访到本地计算机 3000 端口上的服务了。 也能够不应用这个随机生成的域名,你能够自定义一个本人习惯的二级域名,也是能够的,具体操作步骤如下: $ ssh -R mingongge:80:localhost:3000 serveo.netHi thereForwarding HTTP traffic from https://mingongge.serveo.netPress g to start a GUI session and ctrl-c to quit....# 这个自定义二级域名能够简写,也能够写残缺的,如:$ ssh -R mingongge.serveo.net:80:localhost:8080 serveo.net2、将本地 22 端口穿透到公网中近程拜访本地的ssh服务其实很简略,只须要应用上面的命令即可。 ...

May 31, 2022 · 1 min · jiezi

关于运维:对入行运维还有犹豫的朋友一篇文章带你全方面了解运维体系

运维,这里指互联网运维,通常属于技术部门,与研发、测试、系统管理同为互联网产品技术撑持的4大部门,这个划分在国内和国外以及大小公司间都会多少有一些不同。一个互联网产品的生成个别经验的过程是:我的项目立项、需要剖析、研发部门开发、测试部门测试、运维部门部署公布以及长期的运行保护。运维,实质上是对网络、服务器、服务的生命周期各个阶段的经营与保护,在老本、稳定性、效率上达成统一可承受的状态。运维的职责对于初创公司,运维部和系统部个别是合二为一的,相干工作由同一批人负责,界线可能不是很显著。大型公司对运维工作的要求更高,须要有更精密的分工,因而机房/网络/操作系统相干的底层工作分离出来由专人负责,成为零碎管理部,而下层和利用产品相干的工作则由运维负责,成为运维部。以下从互联网产品生命周期和运维波及的技术别离来看分工较细的大型互联网公司中运维工作的职责。产品生命周期运维的职责笼罩了产品从设计到公布、运行保护、变更降级及至下线的生命周期,各个阶段的职责包含:产品公布前这个阶段运维工程师的职责是参加设计并把无关运维准入,次要包含:(1) 产品的业务相熟;(2) 产品架构设计的合理性评估,包含是否存在单点,是否可容错,是否有强耦合等,同时须要提供产品设计的合理性倡议以使产品可能满足上线公布并稳固运行的根本要求;(3) 资源评估,包含所需的服务器资源、网络资源以及资源的散布等,同时把相干产品对资源估算申请的合理性,管制服务老本;(4) 资源就位,将申请的服务器及根底环境/域名筹备就位。产品公布这个阶段运维工程师负责公布的具体工作,将具体的软件和零碎/硬件资源整合造成产品并对外提供服务。对于已在线服务的更新也属于公布领域,这个时候的产品公布个别要保障在线公布,在不中断对外服务的状况下实现产品的降级。对于大型简单的变更也存在停止服务部署实现后再从新提供服务的状况,但这种状况须要运维工程师通过尽可能的技术手段来防止。产品运行保护这个阶段的次要工作包含:(1) 监控:对服务运行的状态进行实时的监控,随时发现服务的运行异样和资源耗费状况;输入重要的日常服务运行报表以评估服务/业务整体运行状况,发现服务隐患;(2) 故障解决:对服务呈现的任何异样进行及时处理,尽可能防止问题的扩大化甚至停止服务。这之前运维工程师须要针对各类服务异样,如机房/网络故障、程序bug等问题制订解决的预案,问题呈现时能够主动或手动执行预案达到止损的目标。除了日常小故障外,运维工程师还须要思考产品不同水平受损状况下的劫难复原,包含诸如地震等不可抗力导致大规模机房故障、在线产品被删除等对产品造成致命挫伤的状况。容量治理:包含服务规模扩张后的资源评估、扩容、机房迁徙、流量调度等布局和具体实施。产品性能/老本优化产品对外提供服务最重要的一点是用户体验,用户体验中十分重要的是产品的可用性和响应速度。而如何用最正当的资源(如机器、带宽等)反对产品提供高可用和高速度的用户体验,这也是运维工程师的重要职责。产品下线倒退良好的互联网产品将始终在线对外提供服务,但互联网产品疾速迭代,也存在相当多孵化的产品最初被淘汰的状况,这些产品都须要做下线解决,这个过程运维工程师次要做好资源回收的工作,将机器/网络等资源回收后纳入资源池中供其它服务应用。运维技术方向产品的整个生命周期里运维的职责重要而宽泛,但运维工程师们的职责不仅限于这部分工作,还须要总结工作中遇到的问题,抽取出相干的技术方向、研发相干的工具和平台以反对/优化业务的倒退并进步运维的效率,相干技术工作次要包含: 服务监控技术:包含监控平台的研发、利用,服务监控准确性、实时性、全面性的保障服务故障治理:包含服务的故障预案设计,预案的自动化执行,故障的总结并反馈到产品/零碎的设计层面进行优化以进步产品的稳定性服务容量治理:测量服务的容量,布局服务的机房建设,扩容、迁徙等工作服务性能优化:从各个方向,包含网络优化、操作系统优化、利用优化、客户端优化等,进步服务的性能和响应速度,改善用户体验服务全局流量调度:接入服务的流量,依据容量和服务状态在各个机房间调配流量服务任务调度:服务的各种定时/非定时工作的调度触发及状态监控服务平安保障:包含服务的拜访平安、防攻打、权限管制等数据传输技术:包含p2p等各类传输技术的研发利用,也远距离大数据传输等问题的解决服务主动公布部署:部署平台/工具的研发,及平台/工具的应用,做到平安、高效的公布服务服务集群治理:包含服务的服务器治理、大规模集群治理等服务老本优化:尽可能升高服务运行应用的资源,升高服务运行老本数据库治理(DBA):通过设计、开发和治理高性能数据库集群,使数据库服务更稳固、更高效、更易于治理。平台化的开发:类docker和google borg平台的开发治理,及服务接入技术分布式存储平台的开发优化:类google gfs等分布式存储平台的研发及服务接入等等,但凡关系到服务质量、效率、老本、平安等方面的工作,及波及到的技术、组件、工具、平台都在运维的技术领域里。做好每一个技术方向、实现相应的组件、工具、平台研发都能对履行运维职责起到踊跃的作用,对业务的倒退施展要害影响。 看到这里,置信你对运维有了一个全面的理解了,对于运维人员来说,最重要的就是一个好用的运维工具。这里有一个刚开发的运维软件,真的很良心,可就是没人用,是能够两赢的产品,不仅功能齐全,满足运维人员常态化须要,而且还能够获取收益,是一个用的多赚的也就越多的产品。只有你绑定设施,设施在线就会有收益,收益能够兑换成京东E卡等其余礼品。

May 31, 2022 · 1 min · jiezi

关于运维:GPS子母钟系统卫星授时服务器应用于基建项目

GPS子母钟零碎(卫星授时服务器)利用于基建我的项目GPS子母钟零碎(卫星授时服务器)利用于基建我的项目安徽京准电子科技官微——ahjzsz随着5G等新型基础设施继续建设和倒退,在将来万物互联的宏大信息网络中,跨路由节点之间的彼此协同、大数据处理及节点数据交融的精度等环节,对精准工夫同步要求越来越高。如果工夫程序呈现凌乱或者误差,将影响决策和执行成果,造成昂扬的老本和重大的平安问题。因而,精准的工夫同步在新型基础设施建设中至关重要。1、为什么要构建精准的工夫同步体系? 以 5G、工业互联网、卫星互联网等为代表的新型信息基础设施,通信信号载波频率的稳固、上下行时隙校准、牢靠传送等方面都须要准确的工夫同步控制。 行业利用有严格的低时延、低抖动、低丢包率承载要求,对精准工夫同步的品质要求也将越来越高。工业互联网中的网络跳频、资源分配、路由转发和数据交融等都依赖工夫同步的利用,否则不能失常运行。特地是工夫敏感型的工业互联网,对在设施上维持端到端的工夫精度要求更高,甚至达到纳秒级。 而对于卫星互联网、低轨卫星,只有实现相互间的精准工夫同步,能力为笼罩区域提供高速卫星通信。另外,在智慧电网、智能矿山、智能路线等交融基础设施,以及重大科技基础设施中,系统控制、设施执行、运行统计、异样解决等都须要对立工夫规范,否则将无奈失常运行。2、网络工夫同步技术(NTP/PTP) NTP是利用于互联网中工夫同步的规范网络工夫协定,其作用是把网络内的计算机工夫同步到协调世界时(UTC)。NTP通常采纳客户端/服务器主从工作模式,通过数据包交互来实现工夫同步。NTP具备欠缺的算法体系,综合采纳工夫滤波、工夫抉择、聚类、时钟调节等算法调整本地零碎工夫和频率,工夫同步稳定性能够保障,是目前利用最宽泛的网络工夫同步技术之一。 传统NTP技术采纳软件工夫戳,工夫戳精度和准确度较低,因而同步精度个别为毫秒级,次要用于对同步精度要求不高的网络设备、应用服务器及计算机终端等提供工夫同步服务。 PTP是用于网络测量和控制系统的精细工夫同步协定(简称PTP),目前广泛应用的版本IEEE1588-2008(1588v2)。PTP采纳主从时钟同步形式,主从时钟之间通过交互同步、状态和时延测量等报文来实现工夫或者频率同步。PTP反对端到端(E2E)和点到点(P2P)时延测量机制、组播和单播通信形式、一步和二步工作模式以及UDP/IP和IEEE 802.3等多种报文封装形式,同时反对一般时钟(OC)、边界时钟(BC)和通明时钟(TC)等时钟模型,具备欠缺的时钟层级和端口状态决策算法(BMC,最佳主时钟算法),基于各种工作模式的灵便组合能够满足不同网络环境下的组网利用需要。 PTP采纳硬件工夫戳,工夫戳的精度和准确度更高,个别能够实现纳秒级甚至更高的同步精度,广泛应用于通信传输网络、挪动回传网络、智能电网、高速铁路等零碎的高精度工夫同步解决方案中。 1588 ATR(1588 Adaptive Time Recovery)是基于PTP的自适应工夫复原算法,它是通过在路由器之间以三层单播报文模式建设时钟链路。而后通过PTP报文的交互,实现设施间穿梭第三方网络的工夫同步。1588 ATR是在1588v2的根底上,实现穿梭不反对1588v2协定设施的第三方网络的工夫同步。解决了原有采纳1588v2形式同步工夫时,要求全网设施逐跳反对1588v2协定的问题,采纳1588 ATR以跨过不反对1588v2协定的设施,进行工夫同步。1588ATR是逐跳反对的一种补充,但标准化水平不高。3、卫星基准授时安全性 新基建的准确授时次要依赖GPS和北斗等星基授时零碎,一旦星基授时信号受到外界烦扰或因不可抗力因素受到毁坏,将使得新基建各个领域的工夫同步零碎利用生效。另外,室内、矿山、高电磁环境等场景无奈通过星基授时获取工夫,这也极大限度了新基建的利用和倒退。二是存量 GPS 授时设施的危险。 以后,我国大量时钟同步设施是以 GPS 授时为主,存量 GPS 授时设施危险须要高度关注。三是网络传输协定的危险。以后,IEEE1588V2 协定及其衍生无线网络协定次要应用的高精度工夫同步传输协定,可能让肯定数量的工夫同步设施实现亚微秒级精度。4、先进的技术 京准HR系列 NTP/PTP工夫服务器开发了一种智能天线,将GNSS接收器内置到智能天线,而不是传统的工夫服务器的办法。将GNSS信号接收器组件移至智能天线的长处包含:• 在损坏的信号达到NTP/PTP工夫服务器之前,在智能天线的GNSS接管中内置了烦扰/ 坑骗检测性能。• 因为智能天线中的模块化设计,能够轻松更换故障的GNSS接收器或不同的GNSS接管 器,而NTP/PTP工夫服务器无需停机。• NTP/PTP工夫服务器反对双GNSS天线端口,容许GNSS天线物理隔离,以接管 来自不同或雷同卫星零碎的不同GNSS信号。总结:要害基础设施须要弱小的同步和网络安全性,帮忙保障工业4.0,新基建,工夫敏感网络TSN,云/EDGE/FOG技术,电信5G,智能电网,智慧城市的长期IT/IoT/IIoT的可靠性。

May 30, 2022 · 1 min · jiezi

关于运维:运维学习常用运维工具

近程连贯工具Xhell 罕用于在Windows环境下连贯Linux零碎的运维工具。 连贯形式 在命令行中间接应用ssh命令连贯服务器,须要提供用户名,明码;还能够建设会话,会话会主动保留,在你开启xshell时弹出抉择可间接连贯指定的服务器ip新建会话在页面的左上方点击文件,弹出选项里抉择新建就能够,自定义会话名称,连贯协定等。如果是ssh或sftp等协定连贯还能够在用户身份验证处抉择明码认证或密钥认证。 连贯信息迁徙在XShell中,每个保留的Session连贯信息都是保留到.xsh(就是ini文件,能够用文本编辑器关上)文件中的。它的默认门路能够在菜单工具 --> 选项 --> 惯例中查看和更改,当咱们须要更换电脑时或者XShell须要重新安装,如果心愿现有的连贯信息能够保留,可间接拷贝这些xsh文件到新的XShell的雷同目录即可应用。 罕用快捷键 复制和粘贴因为在linux的Shell下,Ctrl+c是中断以后指令,这个快捷键和win零碎下的复制快捷键抵触,在Xshell中,提供了其它的快捷键来执行这些操作:复制:Ctrl+Insert粘贴:Shift+Insert 其余罕用快捷键关上会话窗口:Alt + o切换关上的多个tab:Alt+1~9 或者 Ctrl + Tab 或者 Shift + Tab断开连接:ctrl + d 退出登录,再按 ctrl + d 敞开以后窗口 文件传输 在xshell中应用到的传输工具是它的另一个工具xftp,配套应用,所以须要提前装置这个工具才能够调用。集体发现(版本为Xshell 6)在应用过程中点击文件传输图标或应用快捷键Ctrl + Alt + F呼出弹窗xftp,而后敞开这个窗口,会主动创立一个sftp 的传输连贯会话,这个sftp能够应用put或get命令间接将本机或连贯主机的文件上传下载,下载到本机的门路是你的会话贮存门路里。 WinSCP WinSCP 是一个开源的收费 SFTP 客户端, FTP 客户端, WebDAV客户端,它的次要性能是本地计算机和近程计算机之间的文件传输,还能够间接进行编辑。连贯胜利后,间接应用鼠标拖拽就能够传输文件等内容。可随时新建文件目录,或间接删除。 性能 近程控制台关上一个控制台窗口能够间接执行命令 属性批改右键对应文件,抉择属性,能够间接批改文件的领有组拥有者,还能够批改权限 猎报平安 猎报平安是一款反对全面感知、精准告警、处理闭环、云端赋能、灵便部署程序,以情报驱动的威逼感知平台,聚焦企业实在威逼,精准定位,自动化处理,帮忙企业实现安全事件处闭环。[下载地址](https://www.liebaoanquan.com/login) PuTTY 同样是一近程连贯工具,通过IP端口和指定协定去进行连贯,更为玲珑,整个程序只有1Mb多。 FTP客户端工具FileZilla FileZilla 客户端是一个疾速牢靠的、跨平台的FTP,FTPS和SFTP客户端。具备图形用户界面(GUI)和很多有用的个性。上面为客户端展现: 反对FTP, FTP并反对SSL/TLS (FTPS)协定,反对SSH文件传输协定(SFTP)近程查找文件能够自行创立新的连贯反对多窗口多链接同时拜访。FileZilla的服务端只能在Windows零碎上搭建,客户端能够反对Linux、Windows、Mac零碎。 FlashFXP FlashFXP是一款功能强大的FXP/FTP软件,反对黑白文字显示,反对目录(和子目录)的文件传输,删除下载连贯==》反对简体中文,装置实现后可抉择语言。全功能的用户界面,反对鼠标拖拽。FlashFXP领有直观和全功能的用户界面,容许你能通过简略的点击实现所有指令工作。它反对鼠标托拽,因而能够通过简略的点击和托拽实现文件传输,文件夹同步,查找文件和预约工作。能够同时连贯远端服务器,这里我只用了一台远端所以都连贯的一样,但不能开启更多个连贯窗口。下面能够管制连贯、中断、终止、、暂停、刷新等操作。 端口检测工具 tcping能够帮忙检测服务器某端口是否关上运行,windows版本下载连贯==》Linux下应用tcping能够在Linux服务器上yum装置,方便使用 Windows 下应用tcping 首先下载程序tcping64.exe;挪动程序至C:\Windows\System32门路下;关上命令提示符面板;执行如下操作 失常开启后,能够应用tcping命令参数阐明 参 数阐明-t不停的发送数据包直到 按ctrl+c 进行,能够用此命令做小毁坏。-n 5一次发送 5 个数据包,默认一次发送4个 : tecping -n 5 www.baidu.com 会tcping 百度5次,也能够跟其余数字。-i 55秒发送一个数据包 : tcping -i 5 www.baidu.com 每距离5秒tcping一次百度,也能够跟其余数字,也能够跟小数 :tcping -i 0.5 www.baidu.com 每隔 0.5秒tcping 一次百度。-w 0.5tcping不通的等待时间 tcping通则疏忽次参数 : tcping -w 0.5 www.baidu.com 如果ping不同会期待0.5秒,默认tcping不通等2s,tcping 通则疏忽此参数。-d在每行后面显示具体日期工夫。-b 1-4ping的时候会响铃,1-4别离是:1=指标端口是敞开的响铃;2=指标端口开启的;3=检测中状态扭转响铃;4=始终响铃。示例: tcping -b 4 www.baidu.com 80-r 5每发送5个数据包从新查找主机一次(通过DNS或路由查找)-sping通就立刻退出-v显示版本信息-j应用默认的办法求ping的均值减小稳定,网络有肯定的不稳定性用此参数能够减小稳定。-js 5用5个实例求平均值减小稳定,应用这个参数零碎会tcping 5次而后求出平均值作为一次结果显示,减小稳定。-g 5失败5次就放弃(留神默认是80端口,端口没开也算失败)-h以http 的模式工作,能够测试主机是否提供http服务。近程帮助工具TeamViewer ...

May 30, 2022 · 1 min · jiezi

关于运维:高效实践|运维指标体系在银行业务的应用实践

背景银行 IT 零碎在云化、容器化、中心化、微服务等架构迭代演变过程中,零碎架构和业务调用关系简单,运维治理难度日益凸显。银行业务零碎多采取烟囱式建设办法,数据互通艰难,运维团队无奈做到及时响应、及时发现并解决问题。目前,银行业整体上已具备联合业务场景收集比拟残缺的 IT 指标数据的能力,亟待一套指标数据分析体系为 IT 治理与业务剖析提供可量化、可视化、集约化的决策撑持。然而,中国银行业在实际指标管理体系的过程中会遇到以下几方面的挑战: 兼顾全局运维数据源的挑战中国银行业正处于传统向互联网转型期,云计算、大数据等新兴技术也在逐渐发展,而且银行业须要海量的 IT 计算力和实时的响应速度才能够满足继续推出翻新业务的诉求。简言之,银行业运维数据源的数据量级在减少,而业务部门对实时处理响应工夫的期望值在减短。 此外,对于单个业务部门的指标数据,能够依赖集体对业务场景的教训疾速作出判断并利用于 IT 运维管理工作。但银行零碎时时刻刻都会产生海量的指标数据,IT 管理人员无奈判断指标数据对于业务的重要性、优先级,更无从下手梳理指标数据与业务的关联性,从而无奈聚焦某个业务场景内的指标数据,导致指标数据无奈施展出其潜在价值。 继续翻新智能算法库的挑战中国银行业数字化转型正在挑战 IT 的组织和治理形式,技术正在越来越多地集成于业务,IT 不再局限于反对技术,更是翻新的推动力。银行业因为本身的个性,对于减速翻新业务的诉求火烧眉毛,而针对业务场景翻新的智能算法模型正是解决此类诉求的不二法宝。 跟跑智能运维新实践的挑战智能运维尽管曾经倒退多年,但仍处于摸索阶段。指标管理体系实际过程中须要继续学习、排汇智能运维畛域中像 ITIL 4 和 IT4IT 等规范的新理论体系,能力让指标管理体系施展出对业务智能运维的微小推动作用。 银行指标管理体系落地实战一套欠缺的指标管理体系应基于企业业务和 IT 运维治理的顶层布局,将各个业务零碎的孤立数据进行分类、分层治理,从而通过更零碎、更有档次的形式来展现业务场景的指标数据,使之成为以数据为驱动、面向业务运维监控与治理的落地抓手,让 IT 管理员可能将繁冗的 IT 管理工作升维从简,在改善 IT 治理形式的同时晋升企业整体的 IT 经营效率。 01 落地实施方案某银行指标管理体系的施行落地我的项目基于顶层指标治理驱动,从业务视角切入,以业务场景为主题、以业务连续性为主旨,通过直面业务场景、正向梳理 IT 调用链、逆向接入数据源等施行步骤,最终构建了一套具备概览所有业务场景衰弱度、鸟瞰多维立体化 IT 指标等能力的指标管理体系。 首先,从银行的外围业务场景开始,通过业余运维数据库平台对利用零碎的 IT 数据源及业务数据源进行对立数据采集、指标提取和数据存储;之后,针对银行业务的特点及业务部门的需要,进行指标管理体系征询、调研,对IT 数据和业务数据进行指标梳理和计划建设,造成指标标准与施行制度;而后,联合指标标准与施行制度进行指标体系治理,最终以功能模块及平台模式的形式实现该银行指标管理体系的建设。同时,依据银行业日常运维场景,在指标管理体系平台的下层利用中实现工作台、可视化管控和AIOps等功能模块的落地。 02 指标体系建设业务调研:聚焦业务场景、梳理业务指标通过业务调研,梳理该银行的外围业务,包含线下领取(比方:柜面贷款)、线上领取(比方:手机银行)、财产治理等,依据业务关注度和用户体验影响度,同时联合业务部门的汇报报表和领导决策时参考的业务指标,梳理出外围业务场景的要害指标,示例如下: 数据接入:拓扑 IT 调用链、度量技术指标通过调研银行 IT 零碎及自动化配置平台的数据,梳理出撑持银行外围业务的利用零碎,比方全渠道领取零碎、领取前置零碎、领取清理零碎等;每个业务零碎都有齐备的 IT 零碎,依据外围业务零碎的监控现状和指标关注度,依照自上而下调用链的依赖关系分为五层的技术指标监控体系:应用层、服务层、中间件层、过程层(虚构层)、主机层,联合多个银行案例的指标管理体系建设教训对监控源进行指标管理体系建设,搭建各层指标之间依赖拓扑的关系矩阵,示例如下: 上述各层的技术指标都是一条独立的实时序列数据流,通过银行自动化配置平台的配置项数据建设各层技术指标之间的调用链拓扑关系网,示例如下: 模型配置:量化业务关注度、建模指标衰弱度搭建实现指标管理体系的架构分层后,联合外围业务指标,以后果导向的逆向思维对各层指标的权重进行评定:业务指标的稳固依赖业务子系统的稳固、业务子系统的稳固依赖 IT 利用零碎的稳固、IT 利用零碎的稳固依赖 IT 零碎各层级的稳固、IT 零碎各层级的稳固依赖于各项技术指标的稳固,那么当原子级的技术指标不稳固时如何危险降级向上浸透呢?通过对技术指标进行级别评定、权重调配的形式加权计算量化各项技术指标的影响力。 例如,柜面贷款是最外围的根底业务零碎,须要从生死线指标、要害指标和规范指标三个维度对柜面贷款业务的衰弱度进行模型配置: ...

May 30, 2022 · 1 min · jiezi

关于运维:用户体验至上时代银行的主动出击

2022年1月17日,中国银保监会公布了《中国银保监会办公厅对于银行业保险业数字化转型的领导意见》(上面简称《意见》)。《意见》的外延精悍而又粗浅,对症下药,直击以后银行数字化转型过程中的痛点和要害。 一方面,随同着2021年各个国有大行开始实现下沉到三四线的策略,其逐步面临的外围问题是如何基于现有的数字化工具实现总部和网点的数字化联动,以防止产生总部和网点之间的连贯间隙;另一方面,随同着国有大行的下沉,中央或者民营银行面临的问题是如何通过精细化治理实现对区域客户的服务和赋能。 银行作为金融行业的最外围单元,不管从底层的云建设,亦或是中间层的数据库、IT运维模式,再或者是前端的数字员工,近程RPA,银行都在成为金融数字化的最佳实验田。 银行服务门路的变更如果说疫情对于银行最显著的冲击来自哪里,手机银行App的应用人数或者更能阐明这一问题。 数据显示,自2020年Q1开始,手机银行App应用服务应用人数稳步回升,到2021年Q1同比增长23.8%,由此可知,银行的服务门路曾经开始扭转,手机银行服务体验将影响银行绝大数客户群体。 随着金融科技大潮的衰亡,客户对金融服务体验的要求一直进步,银行服务门路也在悄悄变动,金融服务曾经从实体网点转向无感植入式的智能银行,并间接深刻到各种生存场景中。 在此状况下,传统银行也在减速推动金融与科技交融,线上化、数据化、场景化的服务翻新日益迫切,在数据中心建设上紧跟技术倒退的脚步,承载起本身数百套重要信息系统稳固运行的重要责任。 与此同时,银行的IT运维也面临着多重挑战。 一方面,随同着业务的多元化倒退,银行对交易系统的依赖性越来越大,保障业务连续性曾经晋升到一个簇新的高度。交易系统架构日趋复杂化,波及的交易系统的服务器数量呈几何级增长,运维工作日趋沉重。 而各运维工具之间的数据短少数据共享,无奈横向买通,在运维工作中造成无奈站在全局角度统一规划,难以实现平面协同运维办公。 另一方面,对于银行运维零碎而言,往往无奈全面监控,不足对整体业务运行状态的监控;加之原有运维监控零碎采纳固定阈值告警,误报漏报率高;原有运维零碎发现问题较为被动,不足趋势预测能力,无奈在用户受影响之前及时辨认问题,重大依赖运维人员的教训,导致运维老本高、运维效率低。 如此导致的结果便是运维对于根因定位难以精确把握,银行原有运维零碎和工具根本为预先统计分析,不足实时剖析能力,不足以业务指标驱动的根因剖析能力、场景化的相关性剖析能力和告警、指标、日志等多维数据的穿插剖析能力,对运维排障能力的晋升作用很无限,导致运维故障解决能力较低。 银行传统IT运维架构不仅面临着工具竖井化、资源不通、数据不通、场景割裂等问题,而且资源变更耗时长、故障定界耗时长,报表统计效率低,因而,银行在运维治理上亟需晋升平安、可控、可追溯的自动化能力,以及丰盛全面的性能监控剖析、报表统计、告警集中管理。基于智能引领翻新,实现面向场景的智能运维的落地,已成为银行业数据中心高效治理与经营的翻新标杆。 从用户体验登程,主动出击博睿数据在与某银行单干时,也遇到的相似的问题。 基于该银行的问题,博睿数据通过Bonree App 针对该银行本身利用与竞品利用,别离录制交互脚本,选取全国不同城市运营商的监测点,设定周期性监测工作,依照实在用户应用App时的交互过程,在App正式全面降级前事后获取实在网络性能、视频性能与用户体验数据,从地区、运营商、工夫趋势等多个维度组合比照剖析本身利用和竞品,时刻把握竞品性能与体验差别,帮忙该银行晋升用户体验,进一步加深用户粘性。 在App交互流程故障诊断方面,用户在收到报警后由报警关联至Bonree App平台,定位到关键步骤,进一步定位到要害动作,配合交互快照验证。例如在一次告警服务中,从告警到定位问题再到解决问题,仅用了十五分钟,用户甚至都未察觉到问题。 在版本迭代降级方面,通过对版本迭代前后进行性能比照,优化成果不好的性能,在上线前进行更改或勾销上线,从而保障每次降级品质都有保障。 在竞品剖析方面,通过对竞争厂商的App的事务交互流程进行监控,被动发现该银行与竞品在性能方面的差距,进行针对性优化,晋升市场竞争力。 与此同时,博睿数据也在重要流动期间助力其App整体平安稳固运行,助力其保障线上用户服务体验。

May 30, 2022 · 1 min · jiezi

关于运维:开利网络项目动态-五月上线项目集锦

立正素质成长夏令营 利用场景综合军事培训服务平台 次要性能 ◆利用分成零碎,零碎内每新增一个军事课程报名订单,参加分成模式的军校业务员都可取得平台分成,联合分销返佣机制,让业务团队推广更被动、收益更多元 ◆利用报名缴费零碎,用户可间接在线上参加军事课程报名与费用缴纳,让报名更便捷、更省时 ◆利用信息公布零碎,用户可直观地在零碎内查看军校介绍、我的项目介绍、精彩流动等信息,从更多方面理解课程发展状况,进一步减少用户信赖 ◆利用派券零碎,能够为报名用户提供定向报名优惠,如满减优惠、分享优惠等 经营成绩 以线上线下相结合的模式进行引流转化,上线当月吸引成交用户1000+名。点击图片进入小程序 胞喜衰弱驿站 所属行业大衰弱养生服务 次要性能 ◆引流:测评零碎、派券零碎等 ◆留存:分销零碎、常识付费零碎等 ◆转化:分成零碎、直播零碎等 经营成绩 联合“检测+教育+产品”三大业务板块,线下提供检测服务吸引用户参加线上测评,联合教育课程、大衰弱产品进行用户转化,月均流水5万+。点击图片进入小程序 华文升学部 利用场景 院校招生 次要性能 ◆利用招生CRM零碎,有助于帮忙院校建设标准化招生流程,积淀学生招生数据,对生源、跟进频次、回访状况等进行汇总与剖析 ◆利用报名缴费零碎,用户可间接在线上参加报名与费用缴纳,让报名更便捷、更省时 ◆利用预约零碎,用户可在线进行院校参观预约,抉择适宜的工夫返回学校参观 ◆利用信息公布零碎,用户可直观地在零碎内查看院校介绍、老师介绍、业余介绍、常见招生问题等信息,更多方面地理解学校招生状况,还可在线进行录取状况查问 经营成绩 上线当日吸引1000+用户进入零碎。 点击图片进入小程序 言传文化 利用场景 常识付费 次要性能 ◆引流:报名预约零碎、派券零碎等 ◆留存:分销零碎、常识付费零碎等 ◆转化:赛事报名零碎、直播零碎等 经营成绩 上线当周课程报名人数500+人。 点击图片进入小程序

May 28, 2022 · 1 min · jiezi

关于运维:从Service-Mesh谈如何做好监控

【 转载起源 】https://cloud.tencent.com/dev... 前言谈到 Service Mesh,人们总是想起微服务和服务治理,从 Dubbo 到 Spring Cloud (2016开始进入国内研发的视线,2017年凋敝)再到 Service Mesh (2018年开始被大家所相熟),正所谓长江后浪推前浪,作为后浪,Service Mesh 别无选择,而 Spring Cloud 对 Service Mesh 满怀艳羡,微服务架构的呈现与凋敝,是互联网时代架构模式的微小冲破。Service Mesh 具备肯定的学习老本,实际上在国内的落地案例不多,大多是云商与头部企业,随着性能与生态的欠缺以及各大社区推动容器化场景的落地,Service Mesh 也开始在大小公司生根发芽,补救容器层与 Kubernetes 在服务治理方面的短缺之处。本次将以一个选型调研者的视角,来看看 Service Mesh 中的可观测性支流实际计划。 可观测性的哲学可观测性( Observability )不是一个新名词,它在很久之前就曾经诞生了,然而它在 IT 畛域却是一个新兴事物。可察看性在维基百科中原文是这样定义的:“In control theory, observability is a measure of how well internal states of a system can be inferred from knowledge of its external outputs. ”。云原生畛域第一次呈现这个词,是在云原生理念方兴未艾的2017年,在云原生的思潮之下,使用传统的形容形式曾经不足以概括这个时代的监控诉求,而 Observability 就显得贴切许多。 回忆一下传统的监控形式,除去运维层面的主机监控、JVM 监控、音讯队列监控之外,有多少监控是当时就想好怎么做的?很少!其实很多时候,咱们做的事件就是在故障产生之后,对故障复盘的过程中,除了 bug 重现与修复,也会去定制加一些监控,以冀望下次产生同样的状况时有一个实时的告警。研发人员收到告警之后得以疾速地解决问题,尽可能地缩小损失。所以,传统的监控模式大多都是在做亡羊补牢的事件,短少一个主动性。 在云原生时代的容器化体系当中就不一样了,容器和服务的生命周期是紧密联系在一起的,加上容器完满的隔离个性,再加上 Kubernetes 的容器管理层,应用服务跑在容器当中就显得更加地黑盒化,相较在传统物理主机或者虚拟机当中,排查问题的时候显得十分不便。所以在云原生时代强调的是可观测性,这样的监控永远都是兵马未动而粮草先行的,须要提前想好咱们要如何观测容器内的服务以及服务之间的拓扑信息、各式指标的收集等,这些监测能力相当重要。 ...

May 27, 2022 · 3 min · jiezi

关于运维:为什么企业做不好私域流量如何建立以转化为目标的流量营销系统

在互联网倒退过程下,流量成为企业线上经营重要根底之一,从“公域流量”到“私域流量”的抉择转变,也阐明企业曾经意识到公域流量存在老本高、粘度差、稳定性差等问题,开始寻求领有更低成本、更容易造就忠实度、更容易触达的私域流量。但因为企业短少整体、系统化的私域经营思维,短少系统性的赋能体系,导致企业往往存在只关注引流、短少服务思维、激励制度不全面、短少赋能工具等问题。 流量经营的重点是“服务营销”,须要以用户为本,理解客户画像、明确客户理论需要、建设客户激励体系,能力让用户称心、从而减少后续转化的可能性。同样地,想要做好流量经营,一套可能笼罩用户激励、业务门路的流量转化工具也是必不可少的。开利网络基于多年技术研发教训,将帮助企业建设数字化营销体系,帮忙企业建设标准化激励机制,对用户复购、用户裂变进行多维度的调控,让企业以最小老本实现业务的快速增长。

May 27, 2022 · 1 min · jiezi

关于运维:成本节省-5010-人团队使用函数计算开发-wolai-在线文档应用

简介:人们关注 wolai 独特的性能和舒服的用户的用户体验,更关注实现这些背地的技术架构。在一个晴朗下午,咱们邀请了 wolai.com 的创始人马锐拉,跟咱们聊聊 wolai 背地的 Serverless 架构。作者:马锐拉 | wolai.com 创始人 咱们的日常工作场景简直离不开“云文档”。目前,人们对于文档的需要再不仅仅是简略的记录,而扩大到办公协同、信息组织、常识分享等。在国内泛滥在线文档中,wolai 因为性能新、迭代快、晦涩的异地协同体验、高效的信息组织形式以及“信息块”信息整合等特点,作为一个独特的存在进入了人们的眼帘。人们关注 wolai 独特的性能和舒服的用户的用户体验,更关注实现这些背地的技术架构。在一个晴朗下午,咱们邀请了 wolai.com 的创始人马锐拉,跟咱们聊聊 wolai 背地的 Serverless 架构。 我为什么抉择 Serverless 架构?在做 「 wolai 」这款产品之初,咱们就心愿把架构彻底放到 Serverless 上。因而在技术选型阶段,对国内外几款 Serverless 产品进行了粗疏的调研,咱们发现阿里云函数计算(FC)无论在反对上和整体解决方案上,劣势都十分突出,并且跟咱们的需要十分匹配,因而,咱们决定抉择 Serverless 架构,全面应用阿里云函数计算(FC)。 作为一个办公协同利用,wolai 具备多人同时在线编辑文档性能。要实现这个性能,一个十分稳固的 Web 服务接口和一个具备伸缩能力、反对高并发写入、读取拆散的分布式数据库是十分重要的。因而当咱们发现 Serverless 产品可能与分布式数据库进行很好的搭配,就初步确认了 wolai 的主体架构。 接下来咱们开始在阿里云上验证应用阿里云函数计算(FC)的可行性。通过验证发现阿里云函数计算(FC)不光能帮忙咱们解决上述问题,还能够帮忙咱们大幅度节俭人力老本和云资源应用老本的投入。 以一家初创公司为例,聊聊函数计算接下来我想聊聊,为什么在创建公司之初,我会保持抉择 Serverless 架构。我曾在一家领取公司工作,所以我以一家比拟典型的领取公司来举例说明。 不可避免的流量伸缩问题假如你创建了一家领取公司,它的背地差不多须要 200 多个零碎撑持,如果这些零碎大部分都基于 Java ,这就意味着领取业务背地的机器是一台一台的集群,每一次公布研发都须要对这些集群进行分组,而后一一高低线,这须要消耗微小人力老本。 除了集群分组,研发们还须要关注缓存、日志零碎等两头的各个系统是否有瓶颈。一旦产生问题,就须要在整个运维零碎上破费微小的精力去解决。随着公司的倒退,你的这家公司的服务量级终于回升了,这时候你又会发现老本也随之大幅度回升了,比方须要部署新的机器,须要破费很多工夫去做计算的伸缩工作(确切的说只是“伸”,基本就没有方法去“缩”,对不对?)所以流量伸缩问题会是你遇到的第一个问题,同时也是不可避免的问题。 流量的波峰波谷问题接下来,你还会遇到流量的波峰波谷问题。因为领取申请在早晨比拟少,而在白天或大促、秒杀期间,领取申请的并发数可能会特地高。如果少量流量在同一时间涌进来,你就须要迅速拨计算资源过来,这须要做十分多的运维工作。 对一家刚创立不久的公司来说,你很难把大量的精力放在运维服务器上。而这时候你能够抉择 Serverless ,它可能帮忙你解决上述这些问题。你能够把运维服务器的工作释怀的“丢”给 Serverless,而你真正须要关注的只有本人的业务逻辑。 我能够只关注代码和客户的须要过来咱们做 Web 服务,开发的工作重点在于在 web 服务器上做各种优化,其实这些工作都是在解决一个问题:当量级下来之后,服务器性能能不能抗住?如果不能要怎么做优化?开发者们做 Nginx 性能调优、负载平衡、反向代理等繁冗的优化工作,消耗了大量的工夫,而当咱们应用了函数计算之后,相当于把一大部分调优web 服务器的工作去掉了,这极大的节俭了人力老本,进步了效率。应用函数计算之后,整个服务从开发到上线过程中,研发能够把绝大部分精力都放在业务代码上,无需关怀服务自身是怎么稳固运行的。 自 2020 年 6 月 15 号业务上线以来,咱们素来没有遇到服务 down 掉或者是须要下线保护的问题,而这些问题是应用函数计算前的常见问题。以往一旦遇到这样的问题,咱们须要消耗很长时间寻找产生问题的起因,可能须要降级 Web 服务,加几台机器,甚至做反向代理和负载平衡……即便这些工作全副做完,再上线的服务还是会有保护时段,咱们仍然很难做到服务继续在线上。因而函数计算对我来说很重要的一个性能点就是继续服务的能力,通过应用函数计算,我的业务能够稳固地、继续地增量公布。 ...

May 27, 2022 · 1 min · jiezi

关于运维:从预见到遇见-SAE-引领应用步入-Serverless-全托管新时代

简介:SAE 是云原生先进技术的完满交融:容器化 + 微服务 + Serverless 最佳实际。主张 0 门槛+0 容器根底+0 代码革新即享 k8s+Serverless+微服务开箱即用的体验,能托管微服务利用/web 利用/开源定时工作,帮忙企业疾速进入云原生实际的快车道,欢送大家理解!作者:黛忻  阿里云 SAE 产品经理 近年来,企业的数字化随着互联网的遍及倒退越来越快,技术架构也是几经更迭,尤其是在线业务局部。从最后的单体利用到分布式应用再到云原生利用,呈现了进阶式的变动。但带来便当的同时,也给企业带来了肯定的复杂度:新技术上手门槛高,容器和微服务就是两个典型的拦路虎。即使微服务化和容器化后,企业仍然须要关注服务器配置和运维、容量评估,还要面临高性能和稳定性的挑战,无奈享受云带来的最大价值。 Serverless 的呈现,带来了跨越式的改革。为企业数字化转型带来了更多时机。在此模式下,服务器和操作系统的治理部署、运维、资源分配和扩缩容等全副由云厂商提供,计算能力真正像水电煤一样被提供。它可能将原先在传统应用环境中的通用能力转化成云服务,客户能够低成本、高效率地触达。 Serverless 最重要的价值能够演绎为三点: 通过基础设施解耦、极致弹性和故障主动解决等提供永远在线的服务,毋庸放心宕机。通过高效的研发框架以及 DevOps 新形态,做到秒级市场响应。抹平了头部互联网公司与传统企业之间技术竞争力的代差,让传统企业面临大量技术升级和重构时,可能慌慌张张,不会呈现人才缺口,甚至可能弯道超车。 阿里云 Serverless 利用引擎(简称 SAE)初衷是让客户不改任何代码,不扭转利用部署形式,就能够享受到微服务+K8s+Serverless 的残缺体验,开箱即用免运维。作为业界首款面向利用的 Serverlss PaaS,自 2018 年推出以来,受到了宽广用户的统一好评,各行各业企业客户的生产环境都在 SAE 上稳固运行。  SAE 产品定位:全托管、免运维、高弹性的通用 PaaS 平台。反对开源微服务 / 开源定时工作框架 / Web 利用的全托管,提供开源加强 & 企业级个性。能够说 SAE 笼罩了利用上云的残缺场景,是利用上云的最佳抉择。 Serverless 微服务作为当今业界十分炽热的名词,较为宽泛的定义为:CI/CD 流水线,加上内置的高效能研发框架,再加上屏蔽根底 IaaS 层或 K8s 底座,并且提供了端到端的可观测能力,以及一些主动弹性和流量治理服务。 而阿里云的 SAE+MSE 能够称作 Serverless 服务的最佳实际。基于 SAE ,以利用为核心,在 SAE 的利用启动过程中内置 MSE 的 agent ,即提供了一整套微服务的能力。加之其底层人造屏蔽了 K8s 底座,提供了一套无服务器的架构,因而能够将 SAE+MSE 看作 Serverless 的最佳实际。同时可能做到 100%拥抱开源并回馈开源,因为 MSE 团队做了大量开源布道以及在开源根底上做了十分多加强。基于这套 Serverless 微服务的最佳实际,可能使开发效率晋升 70%,老本升高 60%。  ...

May 27, 2022 · 2 min · jiezi

关于运维:从有用到好用再到爱用它能跨越式释放IT生产力吗

数字经济背景下,数字化转型是企业倒退的重要课题。作为数字化的要害工具,软件开发工具对于企业的重要性显而易见。若以“有用”、“好用”、“爱用”倒退视角评估软件开发工具,传统的软件开发工具尽管“有用”,但其门槛绝对较高且易造成反复编码,少数不能达到“好用”层级。 一、“有用”难以满足企业数字化转型需要,传统软件开发存在诸多问题 随着企业业务需要的减少和业务复杂度的晋升,软件开发的复杂度呈指数级增长,仅依附 “有用”的传统开发模式和开发工具,企业业务需要逐步难以被满足,技术人员和管理人员均面临泛滥挑战。 对于技术人员来说,传统的软件全生命周期包含需要剖析、利用设计、利用开发、利用测试、利用部署以及运维多个环节。随着企业数字化的逐渐深刻,技术人员在各个环节中均面临不同水平的问题。 图1:传统开发模式下技术人员遇到的问题 需要剖析和利用设计阶段,企业须要进行技术选型、架构设计以及根本性能布局,这决定着企业技术栈的走向。在互联网企业开发中,技术栈选型工作往往不是从全局角度登程、综合思考业务状况和企业老本等因素而进行的,而是更多依附负责人集体偏好,整体随机性强,这便造成了企业技术栈的凌乱,且给前期开发、运维等带来诸多不便。利用开发阶段,一方面,无论是前端还是后端,代码经常难以标准化,开发品质参差不齐,在开发人员泛滥的我的项目中状况尤甚,导致bug频现;另一方面,需要变更快,整体开发过程难以保障,版本延期的状况不足为奇。利用测试阶段,传统开发模式下,文档详实度不高、测试工具不好用、测试人员程度有余、开发测试沟通难等起因都会导致测试效率低、产品迭代慢。此外,手工测试往往难以保障品质,易呈现产品通过测试环境而到生产环境就暴发问题的状况。利用部署和运维阶段,线上业务规模扩充,运维人员难以适应。第一,运维对象越来越多,虚拟机、容器、微服务等的爆炸式增长,以致运维治理难度呈指数级减少,运维人员面对各种工单应接不暇;第二,运维要求越来越高,企业运维已不仅是几台服务器的搭建和简略的日常保护,如何实现几百上千台服务器规模化的部署、实现自动化的扩缩容,才是运维人员真正面临的挑战;第三,运维环境和服务对象越来越简单,如何满足多种服务对象的多种需要,且保障运维工作的一致性与高质量,是企业运维人员不得不思考的问题。整体上,除了上述各阶段的问题,更为显著的问题是各阶段技术人员之间的疾速沟通与麻利响应能力欠缺。当下企业需要迭代快,当有新的需要或变动时,若企业严格遵循传统的软件开发模式,顺次执行需要剖析、利用设计、开发、测试、运维等步骤,零碎灵活性低,且开发周期长,这是技术人员和客户单方都不违心遇到的状况。若将视角放大,站在企业治理角度对待传统软件开发模式,那么软件开发模式的变革则是更加必要的。对于管理人员来说,需治理的因素包含人员、我的项目、常识/教训等。当数字化转型范畴扩充、过程放慢时,在传统软件开发模式下,人员、我的项目、常识的管控难度将会大幅晋升。 图2:传统开发模式下管理人员面临的挑战 人员治理难。一方面,因为互联网技术突飞猛进,企业要想适应这种高速的技术更迭,须要一直大量招聘懂新技术的人才,导致企业招聘老本高;另一方面,开发软件波及的部门及人员泛滥,且技术人员程度参差不齐,如何正当优化资源配置,也是软件开发管理人员的必修课。项目管理难。第一,管理人员治理多个我的项目时,难以笼罩到每个我的项目的每个细节,进度和品质常会呈现问题。第二,传统瀑布式开发模式下,往往会呈现权限不清、互相推诿的状况,这时建设明确的权限划分体系,帮忙管理人员进行项目管理变得尤为重要。第三,传统开发模式下,当软件呈现问题时,因为不足全流程的监控与治理,企业常难以追根溯源、疾速定位问题。教训积淀难。传统的开发模式下,技术人员风格各异,其开发的内容标准化水平绝对较低,难以造成一些标准化、可复用的常识、模块及教训,对集体的依赖性强,企业易遭技术绑架。加之软件开发岗位流动性较大,若企业不具备标准化常识积淀能力,一旦开发人员到职,常识与教训将会被带走,无奈积淀在企业外部,这样既造成了资源的节约和重复劳动,不利于开发效率的晋升,也不利于企业打造高效协同的数据、利用体系,易造成信息孤岛和利用孤岛。二、走出软件开发窘境,构建“好用”的软件开发平台是要害 那么,针对上述问题,处于数字化洪流中的企业到底应该如何应答?最新的SoFlu软件机器人产品发布会上,飞算云智总裁陈定玮为咱们提供了答案——要想走出开发及治理难的软件开发窘境,构建一个“好用”的软件开发平台是要害。怎么的平台能够称得上一个“好用”的平台?从软件开发人员和管理人员的需要登程,咱们能够从治理形式、应用门槛、教训积淀、实战验证四个方面定义“好用”的软件开发平台。 图3:什么是“好用”的软件开发平台 第一,该平台需集成多种先进治理办法,助力企业实现从“人治”到“法治”的跃升。对于软件开发人员治理难、项目管理难的问题,利用CMMI、麻利开发、DevOps等治理办法进行项目管理是很好的解决方案。但这些办法只是形象的理念,管理人员多依附文档来执行这些治理办法,实际效果并不佳,因而,如何将其落地才是企业应该思考的外围问题。利用数智化工具平台集成CMMI、DevOps等治理办法,并将其用于企业的软件开发全流程中,能力真正突破了解屏障、克服执行妨碍,实现先进的实践的落地,实现从“人治”到“法治”的飞跃。 第二,该平台需能具备标准化工具,帮忙企业升高开发、测试、运维的准入门槛,实现“一人一我的项目,十人抵百人”。通过工具化的平台,企业可能标准化、自动化软件工程全流程,对于某些复杂度不高的我的项目,可能实现软件工程从开发、测试到运维均由一人实现。使用自动化、标准化工具,一方面能在肯定水平上解决软件开发、测试、运维等各环节的问题及各环节之间的合作问题;另一方面能够大大降低软件工程门槛,让难以累赘昂扬人力老本、技术老本的中小企业可能升高试错老本、疾速满足需要,从而真正实现科技为企业赋能。 第三,该平台需可能帮忙企业实现教训积淀与复用,实现正向循环。只有将所有经验值都积淀到企业外部,能力在开发、测试、运维等环节中进行复用,从而防止员工流动带来的资源节约和反复 “造轮子”,造成良性循环,大幅晋升软件工程全周期的效率与品质,同时晋升企业数据及利用体系的协同与互通性。 第四,“好用”的平台与互联网架构并非依附设计就能产生的,而是须要通过实战一直锻炼与打磨才可能造成的。因而,该平台必须具备多年实际的积淀与验证,并在设计中融入大量过往教训,能力真正满足安全性要求,实现贴合理论、拿来即用的指标。 三、SoFlu软件机器人劣势显著,变革企业软件开发全流程 SoFlu软件机器人,深度践行了上述“好用”的软件开发平台的价值理念,变革了企业软件开发的全流程。SoFlu软件机器人依靠多年实战经验,集成了CMMI、麻利开发、DevOps等先进管理模式,搭载了标准化工具,将传统软件工程的151个问题点提炼为10大自动化流水线,助力企业实现教训积淀。除此, SoFlu软件机器人在产品、技术和服务方面,均构筑了本人的护城河。 产品方面,第一,产品体系欠缺。不同于仅反对前端开发的低代码平台以及反对前端+后端的传统代码开发平台, SoFlu软件机器人笼罩了后端开发、前端开发、测试、运维等软件工程全流程,为企业提供全栈软件开发平台。除了为企业提供开发平台外,还为管理人员提供项目管理平台,可能助力企业软件开发管理人员高效实现人员、我的项目、教训等的治理。第二,产品效果显著。产品优劣最为直观的衡量标准是其成果,而SoFlu软件机器人的产品设计从客户的理论状况登程,将后端、前端、测试、运维等环节的工具无效汇合和无缝连接,可能最大水平地施展各阶段工具的效力,真正帮忙企业在各个阶段实现降本增效。以某小型软件开发我的项目为例,传统开发模式下,企业须要6人、耗时66小时能力实现需要剖析、顶层设计、开发、测试、联调上线等全流程,而在SoFlu软件机器人的帮助下,企业只须要3人、耗时9小时便能实现软件开发全流程,节约人力老本50%、工夫老本85%以上。第三,产品安全性高。仅通过服务接口为企业提供服务,基于SoFlu软件机器人开发出的产品可能反对独立部署,不与平台绑定,具备很高的安全性。 图4: SoFlu软件机器人与不同类型平台的比照 技术方面,一方面, SoFlu软件机器人通过长期积攒与验证,具备很高的技术门槛和丰盛的多行业knowhow,例如其后端全自动开发平台,作为一套面向Java的开发工具,在市场上是举世无双的。另一方面,保持每两周进行一次产品迭代,始终走在技术的最前沿,一年多以来,仅后端全自动开发平台版本升级就达37次。 服务方面,SoFlu软件机器人施行团队会联合客户规模、业务、投入状况,为客户提供技术选型、架构设计、平台培训等多种服务。例如,针对小型企业,我的项目团队会依据其环境和模式,为其提供自建服务器或上云的倡议,帮忙其进行软件的技术栈抉择,或者帮助其实现架构设计。再比方,针对编程小白,我的项目团队可能为其提供平台操作培训服务,帮忙其疾速上手应用。 “SoFlu软件机器人的价值在于通过标准化、自动化的流程,升高了从开发、测试到运维的门槛,将麻利管理制度落地,帮忙企业做到降本增效,达到晋升软件业翻新速度的指标。”中国工程院院士倪光南对SoFlu软件机器人的“好用”也给予了充沛的必定,“我亲眼见证了SoFlu软件机器人的诞生和成长,很兴奋看到SoFlu软件机器人曾经在金融、医疗、批发等多个行业失去利用和必定。” 四、基于SoFlu软件机器人,中石油电商平台疾速、低成本实现零碎重构 依靠上述显著劣势, SoFlu软件机器人推向市场一年以来,已为医疗、教育、金融、制作、批发等在内的八大行业、上百家机构提供了技术服务,助力其解决软件开发难题。以中石油电商平台的零碎重构为例,在SoFlu软件机器人的帮忙下,中石油低成本、高效地实现了后端接口419个、 前端页面172个、复杂程度远超一般电商的商城零碎重构及上线。中石油电商平台包含客服、供应商治理、报表治理、订单治理、评论模块、音讯核心、用户核心、商品治理、零碎后盾等各类性能。随着用户量级的减少和需要的扩大,该平台承载力有余的弊病逐步裸露,中石油决定对该电商平台进行零碎重构。然而,在进行零碎重构的过程中,我的项目方面临着诸多问题与挑战:第一,我的项目工夫紧迫,该平台是团体年度重点项目,上线需要迫切;第二,平台修复工程量盛大,该平台涵盖商品举荐、下单、客服、秒杀等泛滥简单单元,系统优化波及的开发量微小;第三,IT团队开发程度参差不齐,因为手工编码标准不对立,代码品质参差不齐,造成了开发成绩的频繁返工和开发进度的重复延期。 针对中石油面临的问题与挑战,SoFlu软件机器人为其提供了残缺的全流程解决方案。 图5:中石油电商平台零碎重构施行过程 需要分析阶段,SoFlu软件机器人我的项目团队帮助中石油开发及业务人员实现了我的项目需要剖析、平台组件、资源、插件、函数反对等剖析。顶层设计阶段,SoFlu软件机器人我的项目团队帮助中石油实现了接口具体设计,包含数据库表设计和对每个模块每个接口的具体设计,此外还产出了我的项目UI交互成果设计图。开发阶段,利用SoFlu软件机器人的后端全自动开发平台,中石油的开发人员对照接口具体文档进行了可视化/配置化开发;基于前端全自动开发平台,中石油实现了可视化开发界面和接口数据的对接联调。测试阶段,借助全自动测试平台,中石油实现了我的项目测试案例及场景的编写,并实现了疾速、高效的我的项目测试。部署运维阶段,依靠全自动运维平台,中石油通过可视化配置、插件化运行的形式,在不须要业余技术人员反对的状况下,整合了运维最佳案例,为后续运维提供了丰盛的底层数据。借助SoFlu软件机器人全流程解决方案,中石油实现了电商平台整个零碎的重构工作,升高了老本,实现了开发效率及品质的独特晋升。首先,团队在SoFlu软件机器人的帮忙下进行可视化接口开发,代替原有的手工编码方式,可能清晰地依照业务逻辑,设计开发贴合业务的功能模块,极大晋升了开发效力。其次,中石油开发团队利用平台提供的标准化组件进行开发,杜绝了因人工编码造成的代码品质问题,节俭团队大量审代码、改BUG的工夫老本。再者,SoFlu软件机器人开发的利用可能满足国家信息安全等级爱护三级认证要求的平安标准和管理模式,从本源上晋升电商平台的安全性和稳定性。 在SoFlu软件机器人的参加下,中石油仅用9人+5个软件机器人、耗时45天便实现了传统开发模式下需27人、耗时300多天能力实现的需要剖析、顶层设计、开发、测试、联调上线等全流程工作,并在源头上升高了零碎的运维难度。 只管上述成果很显著,但陈定玮通知咱们,我的项目推动的过程中最大的艰难并非施行过程中遇到的问题,而是来自认知层面的妨碍——后期,决策层未建设起对SoFlu软件机器人的认知,难以自上而下地推动产品的应用;技术人员则对这一产品抱有肯定的排挤心理,难以实现从“好用”到“爱用”的转变。 五、从“好用”到“爱用”,认知转型是要害 企业必须意识到,数字化转型不仅是技术反动,更是一场认知革命,须要企业管理人员、业务人员、技术人员全方位参加。作为决策者与推动者,企业管理人员需建设对软件机器人的认知,构筑一把手工程,自上而下推动软件机器人落地;作为参与者和使用者,业务人员需深度参加软件机器人的推广与应用,将业务与平台能力深度联合,从而搭建出更切合业务场景的技术工具;作为终端使用者,技术人员需踊跃拥抱改革,以凋谢的态度去接收新的技术,让“好用”的产品变成本人“爱用”的产品,可能促使企业优化资源配置、以更少的老本发明更多的价值。 在企业数字化转型过程中,SoFlu软件机器人开发团队一方面会不断完善产品体系,依靠产品硬实力、基于实在的降本增效案例,进行市场教育,加强企业对软件机器人的认知;另一方面,会为企业提供更加欠缺的全流程计划与全周期服务,针对不同规模体量、不同能力的企业,提出不同阶段的老本投入布局、解决方案和施行门路,帮忙企业实现软件开发零碎的平缓过渡,实现无痛数字化转型。

May 26, 2022 · 1 min · jiezi

关于运维:怎么做流量运营数字化流量链系统助力商家培养流量经营新模式

从线下到线上,用户从“客流”转变为“流量”,只是出现模式有所不同。随着挪动互联网的疾速倒退,流量的入口正一直减少,如何抓住企业所需的流量并针对流量的不同特质进行精准营销,成为越来越多企业所关注的问题。 开利网络认为,流量经营就是用户经营,通过各类线上营销工具的应用和营销机制的实际承接引流入口,再利用数字化伎俩转变企业与用户之间的关系、造就用户忠实度,最初向用户继续输入企业的品牌价值、一直推动用户复购,能力正确搭建以用户经营为主体的流量经营思路。开利网络研发数字化流量链利用,截至目前已积攒超过1500万流量,领有1000+用户精准标签体系,可通过短信、微信及站内信等多种形式触达企业所需的精准用户,让企业营销自带流量。 深耕数字化营销技术畛域多年,开利网络在为企业提供技术开发服务的同时,也将联合企业理论经营场景,为企业提供营销策略新思路。

May 26, 2022 · 1 min · jiezi

关于运维:开启端到端的用户访问追踪RUM

简介在全民互联网时代,用户拜访Web、小程序、Android、iOS等媒介的工夫越来越长,致力赚取用户注意力的利用越来越多,产品与服务的更新也越来越频繁。在这样的大环境下,具体理解用户从哪里来,看了哪些页面,停留多长时间,访问速度快慢……不仅有利于开掘每一个用户行为背地的实在需要,稳固并晋升现存流量的转化率,还能反哺产品与服务的双重优化,真正实现用户增长和业绩晋升。 “观测云” 提供了Web、Android、iOS和小程序的用户拜访数据监测。实现利用接入后,即可在工作台的「用户拜访监测」疾速查看和剖析各类利用的用户浏览行为及利用相干的性能指标,用于掂量网站及利用的程序的最终用户体验成果。 前置条件● 装置 DataKit(DataKit 装置文档)● 将 DataKit 部署成公网可拜访(RUM 配置文档)● 操作系统反对:全平台 办法/步骤DataKit 默认反对用户拜访监测数据的接入,您仅须要实现利用接入,即可通过“观测云” 工作平台实时观测各类利用的用户浏览行为及利用相干的性能指标。 Step1: 新建工作登录 “观测云” 控制台,进入「用户拜访监测」页面,点击右上角「新建利用」,在新窗口输出「利用名称」,点击「创立」即可创立新的用户拜访监测工作。创立工作后,您须要根据抉择的「利用类型」实现下方对应的配置,即可开启相干利用的用户拜访监测。 Step2: 配置利用接入以配置Web利用的”同步载入“为例,配置步骤如下: a. 复制以后页面的代码,并根据要求批改以后代码所需的配置信息。如:批改脚本 datakitOrigin 地址为 DataKit 地址(装置DataKit的主机地址)b. 进入监测的指标利用,在对应页面HTML中的第一行增加所复制的代码 c. 批改实现后保留退出 更多详情可参考: 配置 Web 利用接入 配置 Android 利用接入 配置 iOS 利用接入 配置 小程序利用接入 Step3: 查看用户拜访数据在 “观测云” 工作空间「用户拜访监测」,点击任意一个利用,即可通过「查看器」对该利用相干的用户拜访行为、会话、页面性能、资源勤秋、异样谬误等数据进行查看。 Web监测:蕴含页面性能、资源加载、JS谬误等多个场景;查看器反对页面、资源、JS谬误等数据的疾速检索和筛选查看。 Android监测:蕴含页面性能、资源加载等多个场景;查看器反对页面、资源、解体、卡顿等数据的疾速检索和筛选查看。 iOS监测:蕴含页面性能、资源加载等多个场景;查看器反对页面、资源、解体、卡顿等数据的疾速检索和筛选查看。 小程序监测:蕴含页面性能、资源加载、申请加载、JS谬误等多个场景;查看器反对页面、资源、申请、JS谬误等数据的疾速检索和筛选查看。 进阶参考数据采样观测云”反对自定义数据采样率,控制数据上报体量,优化数据存储和采集效率。您能够在配置利用接入时,通过 resourceSampleRate(资源类数据采样率)和 sampleRate(指标类数据采样率)自定义数据收集百分比。 上面将以Web 利用为例,介绍如何收集90%的Web利用用户拜访数据。 在 “观测云” 控制台进入「用户拜访监测」,通过「新建利用」获取 Web利用的三种形式:NPM 接入、同步载入和异步载入。以“同步载入”为例,在代码中退出sampleRate: 90,而后复制粘贴到须要接入的页面HTML的第一行,即可按90%的比例采集Web利用的用户拜访数据。<script src="https://static.guance.com/browser-sdk/v2/dataflux-rum.js" type="text/javascript"></script><script> window.DATAFLUX_RUM && window.DATAFLUX_RUM.init({ applicationId: 'appid_6666666666666666666', datakitOrigin: '<DATAKIT ORIGIN>', // 协定(包含://),域名(或IP地址)[和端口号] sampleRate: 90, env: 'production', version: '1.0.0', trackInteractions: true })</script>其余利用采样可参考: ...

May 25, 2022 · 2 min · jiezi

关于运维:Sangfor-AIOps-in-VDI快看深信服IOM如何快速解决70以上的桌面云运维管理问题

后疫情时代,因为PC机在批量运维、平安治理等多方面存在治理弊病,大规模近程挪动办公逐渐成为一种外围诉求,而传统IT架构却无奈很好满足。 桌面云凭借较好的数据安全保障能力、治理便捷性和运维效率,为数字化办公提供了无力撑持。 国内外桌面云智能运维现状 国内桌面云运维计划多以平台和业务管理为主,支流的服务商个别都具备资源管理、系统监控、权限治理、硬件治理等能力。但在大规模数据智能剖析、全栈数据监控畛域、数据与桌面治理联动等层面,各个服务商发力点不同,这也是以后云桌面全栈智能运维的外围痛点,即:如何联动桌面云产生的大规模数据,实现桌面云零碎全栈的自动化监控、剖析与治理。 国外桌面云服务商,总体向智能化剖析诊断迈进得更早。除了具备平台治理能力外,个别还具备智能化监控和解决能力,如收集CPU使用量、内存、数据存储、磁盘、虚构磁盘、网络、电源、磁盘空间、存储以及摘要掂量指标,利用AI技术进行容量预测、异样检测、智能告警甚至根因剖析等。 在整体的智能化运维计划和性能方面,国外桌面云服务商整体较国内的服务商更加欠缺。 从下表中能够看出,深服气桌面云IOM智能运维引擎以监控、剖析、处理三者联动为根底设计思路,交融AI智能算法与专家规定,实现了VDI场景下全栈资源采集与剖析。其智能探针在资源耗费极低的状况下,实现了虚机、主机、集群、硬件等多层级数据采集与调度散发;在剖析能力方面,IOM内置了自更新的AI衰弱评分模型,卡慢诊断准确率高达90% ,并基于历史卡慢教训库生成处理倡议,造成监控、剖析、处理闭环,达到降本增效的成果。 ↑ 局部桌面云服务商智能运维能力比照 IOM:解决70%以上的桌面云运维治理问题 IOM(Intelligent Operations Management) 是深服气桌面云智能运维引擎,能够提供业界当先的桌面云性能诊断计划,即侦测、发现和解决70%以上的桌面云资源瓶颈问题。   零碎联合机器学习算法和人工智能技术,囊括了利用、网络、存储、虚拟机、物理机等体系的运维解决方案,实现桌面云性能问题的疾速排查,包含但不限于虚拟机卡顿、物理资源瓶颈、利用异样、网络中断、木马入侵等,7*24小时不间断智能剖析桌面云性能问题,提供全方位的优化解决方案。 ↑ IOM智能运维整体概览图 IOM外围AI能力详解 为实现桌面云零碎全栈的自动化监控、剖析与治理,深服气翻新研究院凤凰团队联结桌面云团队从0开始,自研了AI自驱的桌面云运维治理引擎 IOM,其外围能力如下:   1.老本治理 (1) 闲置虚拟机辨认。 通过随机森林分类模型,联合专家教训剖析历史虚拟机运行数据,自动识别出闲置的虚拟机。回收闲置虚拟机,可大幅升高集群资源耗费,降低成本。 (2) 可减配虚拟机举荐。 通过AI智能算法联合专家教训规定剖析统计过来7天的历史数据,举荐出能够减配的虚拟机列表。合理配置虚拟机资源能够让集群运行更晦涩,缩小不必要的治理开销,资源利用更正当。 2.效力晋升 (1) 全局体验衰弱评分。 基于Bagging策略的分段线性回归算法对虚拟机、主机、集群运行状态进行实时监控并智能评分。依据智能评分可直观理解到机器运行衰弱状态,并依据衰弱评分施行优化和处理计划。 (2) 非法过程与恶意软件辨认。 通过AI算法联合专家教训规定剖析计算历史软件资源耗费数据,辨认出待优化软件的资源耗费并估算出优化后的成果。当系统资源不够或呈现卡慢时,及时处理非法与恶意软件能带来较大的体验晋升。 3.品质改良 (1) 待扩容虚拟机举荐。 智能举荐出待扩容的虚拟机列表。依据集群最佳体验容量和主机负载状况,举荐待扩容虚拟机配置,解决虚机卡慢问题,晋升用户体验。 (2) 虚拟机迁徙计划举荐。 通过AI智能算法剖析计算历史虚拟机潮汐数据,主动地举荐迁徙路线。依据举荐倡议迁徙相干虚拟机,能够更安稳地应用集群资源,晋升整体用户体验。 总体来说,IOM智能运维引擎,基于自研插件化采集探针、AI智能剖析引擎等核心技术计划,实现了VDI场景下的老本治理、效力与品质改良,为深服气桌面云全栈资源监控、剖析与诊断保驾护航。 以上就是本期《服气云黑板报》的分享,关注我,继续关注更多技术干货内容哦!

May 25, 2022 · 1 min · jiezi

关于运维:腾讯产品快速尝鲜蓝鲸智云社区版V61灰度测试开启

这周小鲸轻轻推送了社区版V6.1(二进制部署版本,蕴含根底套餐、监控日志套餐),没过一天就有用户来问6.1的应用问题了。小鲸大吃一鲸,原来你还是爱我的。 这次又有什么亮点性能了?产品亮点性能PaaS 平台1.新增中、英文切换入口,社区版6.1全面反对国际化<br/>CMDB(配置平台)1.反对了模型批改所属模型分组<br/>2.新增平台治理功能模块 <br/>3.反对定制业务闲暇机池 <br/>4.反对模板实例跨页全选 <br/>5.反对模板克隆 <br/>6.反对实例关联关系变更事件监听<br/> 7.反对主机“追加”模块能力<br/> 8.反对通用模型实例对立高级筛选能力<br/> 9.全文检索重构优化 <br/> 10.新增业务集性能JOB(作业平台)1.反对高危语句拦挡能力,并反对查看“扫描”和“拦挡”记录<br/> 2.新增“脚本模板”和“标签治理“”性能 底层执行引擎对全局变量的援用形式由'source'改为'.'<br/> 3.作业模板和执行计划反对批量编辑全局变量权限核心1.关联多个资源类型的操作反对配置多个实例组合鉴权<br/> 2.权限策略减少“失效条件” <br/>3.反对“权限交接” <br/>4.反对基于某个资源实例查问有权限的人员/用户组列表用户治理1.反对复原已删除用户 <br/>2.减少“查看”权限管制 <br/>3.人员列表反对组合搜寻 <br/>4.优化了LDAP/MAD的对接监控平台1.提供秒级监控 <br/>2.反对多指标计算兼容PromQL日志平台1.日志检索能力提供分词提醒、字段类型等优化 <br/>2.欠缺日志下载能力<br/> 3.反对日志归档和回溯 <br/> 4.治理端减少数据状态、采集状态、应用状态节点治理1.通过「装置通道」性能,进行简单异构网络架构下的节点管控 <br/>2.通过「部署策略」性能,主动实现插件装置部署 <br/>3.防护降级,敏感信息传输链路加密解决 <br/>4.优化后台任务调度机制,周期工作削峰资源应用更正当规范运维1.插件输出参数反对配置全局变量渲染豁免 <br/>2.子流程/公共流程反对作业平台的执行计划<br/>3.流程节点反对设置超时工夫和配置重试次数<br/> 4.优化画布挪动渲染性能管控平台1.新增反对管控arm、aix(仅反对工作执行和文件散发)机器 <br/>2.gse_agent资源爱护中CPU和内存资源维度反对可配置 <br/>3.gse_config路由反对platid <br/>4.gse_task的平台化反对NNG模式下的多实例通信 <br/>5.gse_data数据链路路由优化 <br/>6.外部根底libevent库降级提供更好的兼容性流程服务1.凋谢“我的项目”空间治理能力 <br/>2.重构优化了导航框架 <br/>3.革新服务创立流程交互体验 <br/>4.审批节点性能优化(为空时反对主动跳过,为申请人自己时主动通过)我想加入体验,怎么玩儿?小鲸曾经为大家筹备了两个体验“套餐”: 套餐一:体验社区版6.1全新装置实现6.1全新装置,而后分享公布装置过程套餐二:体验社区版6.1降级实现6.0.5>6.1降级,而后分享降级的过程体验完了,你懂的?“玩”够了就依照模板回个帖盖个楼,没错别字就处分60鲸币:回帖入口 盖楼模板(记得去掉括号外面的内容): 我_____(你的小名)曾经把社区版6.1的_____(全新装置、降级)玩好了,你看:你看这是全新设计的登陆界面:(关上登陆页截图)你看这是监控平台(关上“自监控”页面截图)还有吗?我还要打卡太简略,我很会用蓝鲸的,给我点机会展现下技能吧? 那来一起写6.1的玩家攻略吧! 能够在蓝鲸问答社区或其余技术社区,整顿编写教训文章或视频教程: 社区版6.1全新装置体验、降级计划体验,可蕴含: 公布装置过程分享问题解决步骤前后版本比照优化倡议等社区版6.1性能体验,可蕴含: 能够针对某个场景开展阐明落地实际等处分同样也很丰盛:根底处分:25分享鲸币、20-100业余鲸币 热度处分:50-200分享鲸币(依据公布后一周热度状况计算) 保持处分:30天内继续公布社区版6.1的内容分享4篇以上,第二篇分享公布后,在"根底处分”+“热度处分”的根底上每篇额定处分50分享鲸币 流动工夫即日起到2022年6月30日说了这么久,你的货呢?1、社区版6.1根底套餐、监控日志套餐下载入口:https://bk.tencent.com/download_version_list/ 2、部署文档:https://bk.tencent.com/docs/document/6.1/184/22886 3、降级文档:点击查看 有些问题整不会了,咋搞?1、蓝鲸问答社区发问(专人解答):我要问问题 2、急,我当初就要解决:在线小鲸解答问题 3、(我想不会还有人不晓得怎么用鲸币吧?)鲸币兑换入口:蓝鲸 S-mart 论坛 > 用户核心 > 鲸币商城 危险阐明降级体验仅针对社区版6.0.5用户,降级前请确保数据曾经提前做好备份。若有定制化调整(如接入企业登陆,新增 API 以及接入其余企业外部零碎)、以及对开源产品作二次开发的用户,不倡议间接应用灰度计划降级。此类用户能够依据降级计划,模仿降级、从新测试并调整原有的定制化局部后再施行社区版6.1降级。

May 25, 2022 · 1 min · jiezi

关于运维:全场景式全流程监控博睿数据为券商IT运维难题提供范例

在金融科技浪潮以及证券行业生态竞争加剧的多重因素下,数字化转型已成为券商将来倒退的全新策略洼地。 2020年8月,中国证券业协会公布了《对于推动证券行业数字化转型倒退的钻研报告》,其中提到,我国证券行业在信息技术投入方面经验了以交易无纸化为重点的电子化阶段、以业务线上化为重点的互联网证券阶段,目前正处于向数字化转型阶段。 此外,随着数字技术渐趋成熟,为证券行业摸索“新业态、新模式”发明了条件,尤其是疫情防控催生金融服务线上化需要,为证券行业数字化转型倒退提供了契机。如何推动证券行业数字化转型,以科技赋能业务倒退,从而实现证券公司高质量倒退,成为摆在资本市场重要参加主体背后的重大课题。 证券行业属于高度信息化行业,早已“赢在起跑线上”。但即便如此,数字化技术的利用还是在肯定水平上扭转了证券行业的传统商业模式,以及运维、经营、风控等传统工作形式,给证券行业带来了前所未有的时机与挑战。 同时,券商队伍日益强壮,金融业务一直缩短,摩根大通等外资券商的入局也对行业带来“鲶鱼效应”,市场对券商的服务质量与服务效率提出了更高的要求。 这倒逼券商纷纷发展以IT技术为外围的数字化转型,晋升市场竞争力,越来越多的科技型券商纷纷出圈,引领数字化转型潮流。 监控被动成券商用户体验“硬伤”随同近些年人工智能技术的蓬勃发展与推广应用,IT运维畛域也逐步展示新的演进趋势,智能运维逐步成为各金融企业应答新业态、倒退金融科技的强有力抓手之一。随着证券业务的迅速倒退,IT的规模也越来越大;原来竖井式的IT系统管理和运维平台工具建设的模式越来越不适应理论需要规模的扩充同样带来资源无奈无效利用,原有工具扩散建设未能统一规划数据共享,给成本核算带来影响;资源精密治理不足数据反对,存在肯定水平的节约,不利于资源的无效利用。反对业务创新能力有余,利用越来越简单,须要记录零碎逻辑架构、评审记录、利用相干配置;利用规模越来越大,更新速度放慢,要求自动化、弹性交付等都无奈满足。 对于运维外部来讲,人员精力陷于人工沟通、手工数据收集等工作,技能晋升慢成就感低,繁多资源申请须要重复提交多个申请单能力实现,紧急需要无奈满足,不足流程进度跟进,用户无奈获知申请解决状况,用户体验较差。 为了应答策略转型下的IT零碎运维治理难题,须要构建对立运维治理平台,对立纳管资源,IT根底资源的调配、回收、日常操作和监控通过平台自动化实现;IT系统监控指标主动采集,依据事后设定的规定解决性能状态数据,实时告警;运维流程纳入线上治理,联合监控和自动化工具,严格控制变更和操作危险;同时就IT整体运行状况定期出具经营报告,依据容量治理指引对容量趋势做剖析,为经营治理提供数据撑持。 须要留神的是,证券零碎关系到用户的资产信息,人造敏感度极高。交易系统的响应时延和稳定性间接影响用户的利益。 监管机构对开市期间的外围交易系统的故障有一个5分钟的红线。零碎不可用超过5分钟可能面临重大的处罚。 其次,随机稳定的行情给业务零碎的稳固运行带来了极大挑战。毫不夸大的说,当行情来长期,天天都是双十一。然而,就跟拆盲盒一样,你永远也不晓得双十一会在哪天到来。 第三,因为不足无效的性能测试后果作为参考基准,利用零碎的部署次要依附人工教训来推算。当故障来长期,只能被动应答。 第四,简单的架构导致线上故障定位艰难。证券行业外围交易系统长期依赖外购,然而近些年业务翻新对咱们的软件交付速度提出了更高的要求。 因而,对于证券行业而言只有深刻运维一线,能力取得最实在的数据,只有摸清客户最根本的需要,能力拿出有针对性的解决方案,能力兼顾‘用得容易’和‘解决问题’两个方面的问题。 此外,艾媒征询公布《2020年中国互联网证券行业倒退情况钻研报告》显示,中国证券类APP用户规模稳定增长,2019年达到1.11亿人,2020年预计增至1.29亿人。券商App用户在迅速增长。这促使用户对于券商挪动端利用的兼容性、功能性、性能效率等泛滥维度产生更高要求。 全景式监控全流程,化被动为被动基于此,博睿数据的睿视数据可视化剖析平台帮忙客户实现运维从工具化向自动化、智能化方向的演进。从用户的理论状况登程,以数据作为切入点进行面向业务的数据可视化剖析,解决目前运维治理中面临的一些理论问题。达到晋升业务连续性管理水平,晋升运维管理水平,从而最终晋升IT服务质量及用户满意度。 通过网络旁路镜像的形式,7*24 小时实时采集数据中心要害 网络节点的网络流量。对现有网络、利用不产生任何影响;并且采纳集中管理的形式,管控拆散的形式进行稳固多级的 治理,并且能够针对不同的角色进行权限管制。 在网络性能监控层面,通过Reesii提供的数据进行优化,通过优化后显著晋升数据中心外部的网络品质,目前各网络区域的网络评分大部分靠近满分,个别区域未优化完的也放弃在95分以上。 在端到端场景监控层面实现了从客户端到交易主机各个利用节点的拜访关系门路和具体网络指标端到端的可视化。并且可针对各拜访节点网络参数的整体工夫趋势的可视化,可能分钟级疾速定位故障到某一繁多节点并且提供对该节点故障的下钻智能剖析,疾速解决利用端到端故障。 在专线链路场景监控层面,冲破传统运维只能通过单 一维度关注线路的状况以及排障盲点。以地图的模式更活泼直观地对所有专线实现可视化。联合智能告警和多维度指标多视角对线路当前情况有更全面的理解。 在根因剖析及告警方面,冲破传统运维告警通过一刀切的阈值设置形式,减少更加灵便的告警设置策略,升高运维人员对业务告警策略的设置难度,也缩小了对变化莫测的数据业务量配置的工作量;提供更加精确的无效告警信息,从而进行下钻剖析直至定位到具体对象。 并且,针对告警重要水平进行告警层级辨别,对不同机房和告警利用策略类型占比也做了差异化解决,并且能够统计机房外部业务网络分区告警散布状况,可更细粒度定位告警起源区域和类型。 综上,博睿数据不仅能够为客户清晰直观监控每个场景的网络状况,问题呈现时直观展现在监控界面上; 而且能够帮忙券商进步客户的排障能力,并对历史问题提供了回溯性能,责任界定更清晰。

May 25, 2022 · 1 min · jiezi

关于运维:站在全新的业务视角重新认识-Bonree-Zeus

毋庸置疑,当今IT 运维的重要性正在被更多企业熟知。 依据艾瑞预测数据显示,2021年中国IT服务将冲破万亿大关,其中IT运维市场规模将达到2941.2亿元。 市场规模的另一面是增长速度。IT桔子数据显示,截止2021年8月,IT运维赛道融资金额达21.786亿元人民币,较去年同期的10.66亿元人民币,增长了一倍多。 从IT运维软件的市场规模来看,Gartner认为寰球的ITOM(IT Operation Management)的市场规模到20年底达到了339亿美元,同期艾瑞征询预计国内的市场规模大概在114亿人民币左右。数据看上去仿佛并不大,但如果从整个IT运维治理服务市场的角度切入,中国市场空间仅2020年就预计超过2500亿。 显然,IT 运维这个赛道正在被重塑。 IT 运维企业的业务繁杂难题 但从 IT 运维的业务场景而言,枝叶繁冗泛滥,对于IT 运维人员而言,压力也是倍增的。如何兼顾晋升业务性能,加重运维压力是当下IT运维企业们的广泛难题。 以博睿数据为例。 博睿数据作为IT 运维畛域的老兵,自成立以来,依靠多年的技术积攒,不断更新迭代出了多款智能运维产品。 家喻户晓,监控零碎是整个运维环节,乃至整个产品生命周期中最重要的一环。通过监控零碎,企业事先能够及时预警发现故障,预先也可利用零碎提供翔实的数据用于追究定位问题。而保障上线的各项零碎依照预期稳固运行,监控甚至预测什么时候可能会呈现故障或危险,疾速明确导致故障呈现的起因,并提出卓有成效的解决方案,是运维的次要工作。 在这个过程中,运维人员要想高效疾速的解决企业的运维问题,就必须要收集海量的数据,比方博睿数据 Bonree SDK 和博睿数据Bonree Server 每天要写入上T 的原始数据。当然,除了海量的数据外,数据个别都是具备工夫戳的,决定数据价值的也往往是最新的数据,这也决定了其对实时性的要求,当运维数据产生告警时,第一工夫告知客户。 此外,为了及时无效的帮忙客户提出无效的解决办法,运维人员还须要对数据进行剖析,分析方法包含: 即席查问剖析,即当监控发现问题时马上对实时数据进行剖析; 长周期剖析,及查看3个月时间跨度的数据; 多维分析,即从各种维度进行剖析; 关联剖析,即对各类数据进行联结关联剖析等等。 不过,随着数字化转型的深刻,更加简单的IT基础设施和大量的业务零碎也让运维人员们开始思考如何在兼顾性能及运维压力上作出均衡。而这也是博睿数据 Bonree Zeus产品公布的一个重要契机。 博睿数据 Bonree Zeus是什么? 由前文可知,对于运维工作而言,数据分析对业务的晋升功不可没。而数据处理大抵能够分为两类:联机事务处理 OLTP、联机剖析解决 OLAP。 说到联机剖析解决则与Bonree Zeus的产品研发有着很大的关系。 OLAP(OnLine Analysis Processing ,联机剖析解决 ) 是数据仓库零碎的次要利用,反对简单的剖析操作,偏重决策反对,并且提供直观易懂的查问后果。在理论的商业剖析中,OLAP联机剖析更多的是指对数据分析的一种解决方案。 依据博睿数据多年来对于市场的敏锐察看发现企业在产品实际中都会面临联机剖析解决OLAP(Online Analytical Processing)的利用场景,而OLAP的数据写多更新少,其中存在大量时序数据,须要更低的查问响应工夫和更高的并发多维度查问过程。 因而,博睿数据认为,在数字化转型的大潮下,咱们须要一款符合业务、高性能、低成本、自主可控、易运维的产品。于是,通过长期技术调研和深厚企业级数据教训积淀,自主研发了Bonree Zeus零碎。 Bonree Zeus是基于Apache Druid二次开发的分布式实时剖析数据库,反对PB级数据存储,亚秒级高并发查问,并反对结构化数据和日志数据存储,领有预聚合、高压缩比等个性。Bonree Zeus零碎为博睿数据泛滥产品提供了稳固牢靠的数据仓库撑持。 Bonree Zeus由ZeusManager、Query Server、Master Server及Data Server组成,均反对程度扩大。 ZeusManager次要负责提供用户API拜访,用户能够通过ZeusManager建库,建表,写入数据,查问数据及Job治理。 Query Server次要负责查问,当数据存储在Data Server后,Query Server能够查问多个Data Server上数据,并进行汇总再返回给用户。 Data Server分成2个局部,一个是Middle Manager,次要负责实时数据写入,一个是Historical,次要负责历史数据查问。 ...

May 18, 2022 · 1 min · jiezi

关于运维:国内首批|观测云获得信通院-可观测性平台技术能力最高级认证

 4月26日,由中国信息通信研究院主办的“稳保打算”——首届云零碎稳定性大会在京召开。大会颁布了“可观测性”首批评估成绩,观测云取得“可观测性平台技术能力”最高级别“先进级”认证,并成为稳保打算首批“稳定性守护者”成员。   4月26日,由中国信息通信研究院主办的“稳保打算”——首届云零碎稳定性大会在京召开,现场颁布了“稳保打算”最新评估后果,公开了首批“稳定性守护者”成员,并全方位解读了云稳定性保障规范体系。   本次大会上,观测云取得由中国信通院和云计算开源产业联盟联结颁发的“可观测性平台技术能力”最高级别“先进级”证书,成为国内可观测性畛域首批通过可信云认证的平台,“稳保打算”首批“稳定性守护者”成员。       作为国云计算畛域信赖体系惟一的权威评估,可信云推出《可观测性平台技术要求》规范,实在主观地反映出服务商的可观测性技术水平与产品质量,为宽广企业零碎的稳定性保障提供权威领导。   此次观测云在可信云的数据采集、数据处理、数据利用、平台运维共4个模块的全流程测评中,各项均满足可观测性平台先进级能力要求,一举取得最高级别“先进级”证书,升级成为国内可观测性SaaS服务赛道内领军品牌。      随着云计算承载的业务规模扩充,数字零碎变得越来越简单,零碎稳定性的重要性日益凸显。可观测性作为系统故障剖析和稳定性保障伎俩的重要依据,已成为宽广企业建设数字零碎时的一个重要规范。   观测云,国内当先的全链路可观测性的产品,提供从每一个业务零碎登程,由基础设施、中间件、数据库、利用服务端代码到客户端都具备完整性、一致性的可观测性解决方案与技术服务,保障业务零碎的继续稳固运行。       观测云外围劣势:   1、超过300个经测验的技术栈接入模板,并在社区力量的帮忙下一直扩容中。无论零碎和利用是单云、多云还是混合云,观测云都有可用的数据集成形式。   2、弱小的繁多数据采集引擎,反对基于Python 编写自定义。能从各种基础设施,技术栈中收集全量指标、日志、和链路等数据,并在采集端对源数据均进行结构化解决,对立了相干 Tag 命名,使得在后续应用时可全副关联。这种数据能力收集也包含了 APM 和 RUM 的数据收集和集成能力。采集器已凋谢源代码,反对规范的行协定输入,也能够间接对接凋谢的数据平台。   3、在一个平台中监控基础设施、日志、利用性能和用户体验,会集整个企业软件系统的所有性能数据,主动进行关联,并提供可视化的拓扑和链路剖析。工程师在一个界面中进行钻取,疾速找到问题的本源。   4、针对不同类型的数据(指标、链路、日志等),用户能够应用对立的查询语言DQL(Debug Query Language),语法简略、功能强大,极大升高了应用老本。   5、可能主动发现散布于各处的应用程序和工作简单,主动生成服务拓扑。可提供从客户端到数据库的端到端全门路追踪,反映每笔业务在各利用组件中的理论通过门路、响应耗时和处理结果。主动统计服务要害性能指标,构建服务调用关系图,深层解析解决流程,问题本源。   6、弱小的搜寻、筛选和分组性能,可对数据进行分层存储,以降低成本,并由您来掌控数据的生命周期治理。同时也提供灵便的自定义视图和仪表板展现,让您可能依据业务的需要,量化和可视化要害指标数据和系统可靠性程度。   7、反对针对主机、容器、网络、安全设备等各类资产信息进行定期的安全检查,一键发现恶意程序、系统漏洞、缺点等安全隐患,主动匹配关联巡检事件,对平安巡检的过程和后果进行详细描述,并提出平安保障工作倡议,为您的上云过程保驾护航。   8、提供企业微信、钉钉、飞书等多种IM 工具、以及邮件、短信、Webhook形式告警。反对工作空间快照性能,可截取某段数据视图,以实时动静形式对外共享,取代动态截屏,轻松协同解决,疾速找到隐患,同时无效地升高告警风暴。   观测云是一款齐全自主研发的可观测性产品,此次取得中国信通院“可观测性平台技术能力”的“先进级”认证,既是业内对观测云的可观测性技术、产品与服务等综合能力的高度认可,也是对观测云多年来保持技术创新的极大贬责与必定。   将来,观测云将持续强化技术研发,一直夯实产品能力,晋升服务质量,并通过开源我的项目、商业化等多种形式对外输入,全方位推动可观测性理念与技术在国内的遍及、实际与翻新,帮忙全国企业的零碎可观测性建设,赋能业务实现增长!    

May 17, 2022 · 1 min · jiezi

关于运维:邀您填写调研问卷-2022中国-AIOps-现状调查全面启动

中国 AIOps 现状考察国务院对于印发《“十四五”数字经济倒退布局的告诉》中指出,数据的暴发增长为智能化倒退带来了新的时机。放慢推动智能化利用建设,促成各环节智能化降级,晋升基础设施网络化、智能化、服务化、协同化程度,放慢优化智能化产品和服务经营。产业数字化的经营理念在各行业继续浸透,激励着越来越多的企业晋升信息化建设的战略地位、减少数字化投入,这也将进一步突出IT运维对于企业治理和业务翻新的重要意义。 随着互联网与信息技术的疾速倒退、企业数字化转型、以及在大数据、云计算、人工智能等新技术的加持下,近年来,智能运维正成为企业高效管控品种繁多数量宏大的物理设施、精准定位故障信息 、实时防护网络攻击、疾速迭代需要变更等新时代运维场景下不可或缺的科技力量和解决方案。 为进一步理解中国AIOps产业倒退现状,梳理中国AIOps产业倒退脉络,中国信通院联结云计算开源产业联盟发动国内首份《中国AIOps现状调查报告(2022)》的钻研工作,旨在帮忙企业理解智能运维倒退现状,促成智能运维畛域技术与利用的无效落地,继续推动中国AIOps相干产业的衰弱倒退。 调查报告编制工作受到行业宽泛关注,目前已联结近60家企业/单位独特发动,包含高效运维社区、社群、中国农业银行、招商银行、建信金科、浦发银行、安全银行、交通银行太平洋信用卡核心、华泰证券、安信证券、深圳证券通信有限公司、中国联通软件研究院、中国移动集团、中国铁塔、腾讯、阿里巴巴团体、阿里云、蚂蚁团体、京东科技、华为云、苏宁生产金融、亚信科技、浪潮云、博睿数据、宇信科技、必示科技、IBM、BMC中国公司、爱数、润建股份、东软团体、金蝶天燕、云杉网络、华青融天、紫羚云、思特奇、宝兰德、绿盟科技、基调听云、西骏数据、鼎茂科技、嘉为科技、浩鲸科技、普元信息、星散智造、星汉将来、战火通信、金山云、翻新奇智、同创永益、上海叠念、金古代、日志易、广通优云、云新信息等(*以上排序不分先后),现诚挚地邀请各位业界同仁参加本次考察。 AIOps 现状考察问卷智能运维倒退现状:智能运维的概念最早由Gartner在2016年提出,通过近年来一直倒退,在各行业涌现出不同的实际形式。本章节旨在通过对各企业/单位对智能运维的概念了解、建设思路、投入状况、发展形式等多方面现状钻研,展示以后智能运维畛域倒退情况。智能运维场景利用状况:智能运维利用场景泛滥,实现形式与复杂程度也各不相同,本章节旨在理解各行业企业/单位以后智能运维场景利用状况及利用成果,辨认各企业/单位智能运维能力建设与相干零碎/工具的能力成熟度,帮忙企业/单位梳理后续智能运维建设思路,欠缺利用场景能力。智能运维将来倒退与挑战:与传统运维形式不同,智能运维能力体系建设可能面临着更多的挑战,本章节旨在发现各企业/单位在建设智能运维能力的过程中所面临的难点与挑战,理解企业/单位将来布局与建设方向,以总结经验为企业/单位构建智能运维能力提供更多帮忙和指引。不管您是行将开始对AIOps摸索实际,还是业界顶尖专家,咱们都期待您的发声,您的贵重倡议对AIOps的行业倒退具备重要价值。咱们将对您提供的信息严格窃密,并向您承诺仅用于调查报告的编写。无论您想理解目前AIOps行业倒退现状,还是想同时理解国内其余组织AIOps方面的当先实际,都请您如实填写问卷,以便本问卷能够收集到每位受访者的真实情况和想法,期待您的参加! 欢迎您将问卷举荐给您认为适宜加入本次考察的专业人士。为感激大家对问卷流动的积极参与,咱们将为本次的侥幸受访者送出由高效运维社区、dbaplus社群、博睿数据、华青融天、云杉网络、西骏数据、基调听云、浩鲸科技等企业提供的精美纪念品一份,请填写精确联系方式和地址,以便纪念品发放,局部纪念品如下图所示。在此,也感激各发动单位对本次调研流动的大力支持! 本考察问卷将在线凋谢一个月的工夫,截止日期为2022年6月8日,咱们将依据调研成绩编制《中国AIOps现状调查报告(2022)》,并打算于第三季度正式公布,每一位残缺答复问卷的敌人都将第一工夫收费收到最新的完整版调查报告。诚邀您参加本次问卷调查,感谢您对咱们钻研工作的反对! 参加2022年中国AIOps现状考察问卷请长按辨认下图二维码!期待您的声音! 请扫描二维码或点击下方链接填写问卷 问卷填写链接:https://www.wjx.cn/vj/wF0w16F... 1、咱们承诺对您提交的信息窃密且仅用于《中国AIOps现状调查报告(2022)》的编制2、实现问卷填写,即可有机会取得一份精美纪念品,请正确填写联系方式

May 16, 2022 · 1 min · jiezi

关于运维:JAVA-OOM异常可观测最佳实践

咱们常见 OOM 异样场景堆溢出 - java.lang.OutOfMemoryError: Java heap space。 栈溢出 - java.lang.OutOfMemorryError。 栈溢出 - java.lang.StackOverFlowError。 元信息溢出 - java.lang.OutOfMemoryError: Metaspace。 间接内存溢出 - java.lang.OutOfMemoryError: Direct buffer memory。 GC 超限 - java.lang.OutOfMemoryError: GC overhead limit exceeded。 垃圾回收器垃圾回收器就是内存回收的实践者,不同的产商、不同版本的虚拟机所蕴含的垃圾收集器都可能会有很大的差异,不同的虚拟机个别也都会提供各种参数供用户依据本人的利用特点和要求组合出各个内存分代所应用的收集器 ——《深刻了解 JAVA 虚拟机》 对于垃圾采集器(也叫垃圾回收器),在《深刻了解 JAVA 虚拟机》第三版目录中,曾经为咱们列举了大部分垃圾采集器。如下图所示: 查看本地 JVM 垃圾回收器通过命令 java -XX:+PrintFlagsFinal -version |FINDSTR /i ":" 查看本地垃圾回收器为 Parallel。 C:\Users\lenovo>java -XX:+PrintFlagsFinal -version |FINDSTR /i ":" intx CICompilerCount := 4 {product}uintx InitialHeapSize := 266338304 {product}uintx MaxHeapSize := 4257218560 {product}uintx MaxNewSize := 1418723328 {product}uintx MinHeapDeltaBytes := 524288 {product}uintx NewSize := 88604672 {product}uintx OldSize := 177733632 {product} bool PrintFlagsFinal := true {product} bool UseCompressedClassPointers := true {lp64_product} bool UseCompressedOops := true {lp64_product} bool UseLargePagesIndividualAllocation := false {pd product} bool UseParallelGC := true {product}java version "1.8.0_101"Java(TM) SE Runtime Environment (build 1.8.0_101-b13)Java HotSpot(TM) 64-Bit Server VM (build 25.101-b13, mixed mode) ...

May 16, 2022 · 3 min · jiezi

关于运维:一文看懂什么是Bonree-Server

随着传统互联网网络环境的日益完善、挪动互联网技术的日益成熟,各类网络应用的需要逐步被激发。从根底的娱乐沟通、信息查问到商务交易、网络金融及教育医疗等公共服务,互联网塑造了全新的社会生存状态,深刻影响着挪动网民的日常生活。网络应用品种繁多,人们生存越来越依赖于网络应用。 利用零碎的复杂程度持续上升,IT零碎规模不断扩大,IT故障和危险点继续减少状况下,繁多应用传统监控已无奈满足目前运维的需要。零碎拜访压力越来越大,零碎性能越来越多,业务零碎越来越简单,零碎间依赖关系越来越严密。除了日益激增的IT利用复杂性,企业同时面临业务需要更快的变动,用户冀望继续攀升,须要更高的性价比等方面的影响,在这些因素的影响下,IT利用在运行过程中产生诸如性能降落或者服务不可用等故障的可能性大大增加,从而影响业务服务的失常运行。因而无效地治理这些利用,保障业务的连续性和IT零碎的稳定性是业务倒退的迫切需要。 博睿数据的Bonree Server 产品就是在这样的背景下应运而生的。 Bonree Server 是什么? Bonree Server 是博睿数据的一款利用性能监控产品,面向业务、研发、运维、SRE、平安等数字化工作人员,在业务公布、监控、故障复原、紧急反对、治理布局等工作时做到成竹在胸、口头无方、高效从容。 为了做到真正的客户胜利和用户称心,Bonree Server 始终在欠缺基础设施、中间件、应用服务等数字化零碎的全面可观测性。在此基础上,博睿数据始终侧重于自动化、智能化的产品迭代。Bonree Server 的全面降级,在自动化、可观测性方面的两项重要研发成绩:服务主动发现和 Docker 容器监控,可能助力企业从容应对云原生架构演进中的利用性能监控挑战。 Bonree Server采纳被动式监控,通过在服务器上的利用部署或者嵌入探针进行,以Javaagent为例:采纳字节码加强式埋点形式,在启动JVM时,通过不同的埋点插件笼罩不同的通信协议、中间件、开发框架,对Java根底调用代码进行函数级埋点,从而拿到堆栈级的调用信息以及运行态信息。 Bonree Server产品总体设计采纳分层架构的形式,层与层之间实现的性能不同、设计准则与偏重方向也不一样: 数据采集层:通过以探针的形式采集各项性能指标数据,次要偏重数据采集的准确性,在此基础上不能影响客户环境的稳固运行。 数据处理层:对探针采集到的各项性能指标数据进行解决、分类规整和入库,次要偏重稳定性、高性能和高可扩大。 数据存储层:次要集中在数据的存储,通过引入不同的存储构造,分类存储不同的信息,次要偏重数据存储的可靠性,稳定性和高性能。 数据展现层:向客户展现各个维度的性能指标数据,架构上次要偏重可用性、实时性和UI敌对性。 Bonree Server 能帮客户实现什么? 简略来说,Bonree Server 能帮客户实现以下四方面性能:服务状态监控、零碎性能剖析、业务链路追踪、全局异样定位。 咱们首先来看下服务状态监控。 服务状态监控即从多维度监控用户零碎运行状态,包含全局服务是否衰弱、实例运行是否稳固、主机资源是否短缺、容器状态是否失常等。 咱们以服务异样卡顿为例。 在剖析服务器卡登时,咱们首先须要确认根底服务是否失常,定位到服务所关联的主机,查看各项指标是否失常,尤其注意过程模块,若存在指标异样,要判断是否是以后服务所属过程导致的。 其次,若定位到内存占用过高,同时须要留神gc数据,若gc无奈失常回收,且次数与耗时异样,则思考是否有内存泄露问题,应用jstat和jmap做后续剖析,条件容许的状况下,能够间接剖析dump文件。 若定位到CPU占用过高,思考是否有死循环或者线程死锁,应用jstack做后续剖析,如果不方便使用jstack,能够思考应用平台的线程分析做初步判断。 再来看下零碎性能剖析。 零碎性能剖析即从业务登程透视零碎性能瓶颈,包含定位慢调用业务、剖析慢调用SQL、确定慢内部调用、快照数据详细分析等。 比方当呈现要害业务响应慢的问题,可能有两方面的起因。一方面可能因为公司本身的业务逻辑简单,须要对业务耗时占比和吞吐率进行剖析;另一方面,要思考到内部调用响应迟缓的问题,能够剖析单次调用的堆栈信息。 业务链路追踪即还原残缺的业务链路调用关系,包含统计简单业务调用链路、剖析单次业务调用关系等。 全局异样定位即多角度剖析零碎异样信息,包含统计全局异样信息、代码级异样定位等。 Bonree Server有哪些“过人之处”? 那么,相较于市场上其余监控产品,Bonree Server 有哪些可取之处? 其一,反对多平台、多语言。 其二,稳定性&资源开销小,所有的Bonree Java Agent插入的扩大代码都主动有增加try catch进行爱护,保障即使产生异样时也不影响用户业务代码失常执行(一般来说,Bonree Java Agent插入的扩大代码极少,逻辑解决也极为简略,次要是计时操作)。当机器达到肯定负载时(可自行配置),探针主动暂停工作,优先保障用户业务的失常运行。 其三,主动发现全维topo,基于Bonree SmartAgent,无需手动配置,主动发现注册服务,生成全维的服务调用topo图。 其四,探针自动更新。 其五,全维剖析。 其六,代码级问题诊断,针对业务过程的全副代码(包含用户级别代码)主动进行全程追踪剖析,除了显示公共类和办法外,还反对对用户自定义级代码的进行剖析,无需研发人员配合。 随着分布式应用、云计算的不断深入倒退,业务零碎的逻辑构造正变得越来越简单,应用服务存在不同的平台上一直演变。利用的复杂性和灵活性加大了运维的难度,如何保障IT利用零碎可能稳固、高效率的运行,成为IT技术保护人员首当其冲解决的问题。将来,Bonree Server将在业务数据采集剖析、日志剖析、根因剖析、调用链全文检索以及中间件监控等方面继续发力,助力更多企业进步运维效率。

May 16, 2022 · 1 min · jiezi

关于运维:如何将lvm卷移动到另一台服务器中

在某些状况下,将卷组从一个零碎挪动到另一个零碎可能是咱们最须要的。上面看一下如何将一个蕴含多个磁盘的卷组从一台服务器挪动到另一台服务器,而不会失落任何文件。环境两台Centos8 虚拟机第一台名字为:server1 , 第二台名字为:server2 第一台Centos8额定增加4块硬盘。当配置完逻辑卷之后,用来挪动到另一个Centos8零碎中应用的。 第一台Centos8 IP: 192.168.43.131 第二台Centos8 IP: 192.168.43.137 创立pv、vg、lv并挂载,复制数据到卷外面上面4个硬盘创立为物理卷 [root@server1 ~]# fdisk -l|grep sdDisk /dev/sda: 20 GiB, 21474836480 bytes, 41943040 sectorsDisk /dev/sdb: 20 GiB, 21474836480 bytes, 41943040 sectorsDisk /dev/sdc: 20 GiB, 21474836480 bytes, 41943040 sectorsDisk /dev/sdd: 20 GiB, 21474836480 bytes, 41943040 sectors[root@server1 ~]# pvcreate /dev/sd[a-d] Physical volume "/dev/sda" successfully created. Physical volume "/dev/sdb" successfully created. Physical volume "/dev/sdc" successfully created. Physical volume "/dev/sdd" successfully created.创立卷组,卷组名称为vg_data [root@server1 ~]# vgcreate vg_data /dev/sd[a-d] Volume group "vg_data" successfully created[root@server1 ~]# vgs VG #PV #LV #SN Attr VSize VFree cl 1 2 0 wz--n- <19.00g <2.00g vg_data 4 0 0 wz--n- 79.98g 79.98g上面创立逻辑卷,卷的名称为lvdata,空间容量应用所有的 ...

May 16, 2022 · 3 min · jiezi

关于运维:探秘智慧民航融云助力中国第一国门数字化转型记

3年前,《中国机长》电影上映,一段“起飞前筹备工作”的片段给荧幕前的咱们留下深刻印象,一套行云流水的流程,让人直呼“好繁琐!但好有安全感”。关注【融云 RongCloud】,理解协同办公平台更多干货。 一次航行就是一段故事。一架飞机的顺利腾飞和平安落地,从来不是机长一个人的事,而是整个乘务组,乃至气象部门、空管局、航行场地、导航、监督、安全检查、消防救济等多方工作人员无数次沟通、无数次协同的后果。这个故事的背地,就是“通信”的力量。 几年前,这段故事还要依附短信、电话的反对;而现如今,故事曾经能够这样开展: 航班工作开始前,相干人员一经确认,主动建群,与本次航行相干的所有事项均在群内沟通,音讯不乱不散,数据私密平安;每条音讯均可定向揭示,防止冗余信息占用无关人员精力,也确保重要信息精准触达、无一脱漏;航班工作完结,长期群主动遣散,群内所有音讯留档备查,整个航班状况可溯可查;除外部沟通,蕴含正常率监控、值班查问等各个利用模块,均与协同通信平台买通,一个利用即可触达所有业务零碎;……是不是听起来很酷?其实这是可能产生在北京首都国际机场的实在场景。 由慧点科技依靠融云通信云能力为北京国内首都机场搭建的 “wework” 挪动平台,以交融对立挪动办公入口、对立身份权限、对立利用治理为根底,将北京国内首都机场各类罕用 App 汇聚在一个平台,为北京国内首都机场提供业务零碎、外部员工和运维管理人员的对立账号治理,并且通过挪动端流程同步,胜利实现了一站式“掌上办公”。 天地之道,大国之门北京首都国际机场,被誉为“中国第一国门”。是全国最重要、规模最大、设施最先进的大型国内航空港。2018 年、2019 年,北京首都国际机场年旅客吞吐量间断 2 年冲破 1 亿人次,间断 10 年位列寰球第 2 名,已倒退成为亚太地区惟一领有 3 个航站楼、3 条跑道、双塔台同时运行的世界超大型机场。 在刚刚过来不久的北京冬奥会,北京首都国际机场被确定为涉奥人员来华第一入境点。作为北京冬奥会和冬残奥会保障的第一站和最初一站,北京首都国际机场圆满完成了保障工作,为“双奥”的圆满举办奉献了民航力量。 聚焦智慧民航,转型火烧眉毛作为欧洲、亚洲及北美洲的外围节点,北京首都国际机场早早就将眼光投向了数字化降级,世界各地频频曝出的机场安全事故,更给民航数字化建设按下减速键,让北京首都国际机场对方便快捷的直达流程、严密高效的协同需要更加紧迫。 建设成为智慧机场的事不宜迟,就是构建晦涩稳固的外部办公协同平台。 但,原有外部通信零碎服务不稳固、公共即时通信工具又不适用于有着“高平安”规范的外部协同场景 —— 信息安全危险大、通信底层不稳固、信息流买通难、沟通效率低、不足对立入口等,成为摆在北京首都国际机场背后的关键问题。此外,数字化转型波及的开发、运维等一系列工作,高额的老本也是一大挑战。 因而,如何搭建一个数字化智慧办公平台,保障北京首都国际机场各个业务部门与相干零碎之间的高度互联、稳固平安,已成为推动首都机场“智慧降级”的要害因素。 掌上办公提效率,通信底层保平安在此背景之下,慧点科技依靠融云“全”通信 PaaS 能力,为北京首都国际机场搭建了 “wework” 一站式挪动办公平台,赋能打造了对立治理、高度互联的数字化体验,助其实现了文章开篇咱们提到的那一系列智慧场景。 这其中,咱们见证了融云作为牢靠通信底座的卓越“素质”: 第一,开放源码,反对二开。针对慧点科技等 SI、ISV 搭档的软件自定义开发需要,融云反对开放源码,依靠于融云高效丰盛的 SDK 底层能力,IT 人员可通过不同的开发语言和形式,自定义所需性能和成果,同时面向有个性化需要的客户提供全数据迁徙、精简 SDK、可独立配置的 Server API、代开发等定制服务。业务上,可疾速整合接口、疾速公布;架构上,可按组件进行交付,升高客户研发老本的同时,更为前期运维提供便捷。 第二,反对私有化平安部署。部署方面,融云可提供 4 种部署模式 —— 私有云、公有云、混合云、海内云。其中,私有化部署模式反对客户将全副通信服务集群部署在公有基础设施或指定云主机上,数据在传输过程中依照国密等级进行加密不可破解,以确保聊天信息的传输平安。作为“信创”榜单上的举荐厂商,融云通信可完满符合国家政府机关、企事业单位等的国产化要求。 第三,反对集成第三方 IT 零碎。“高集成性”让融云通信底座有很强的适应能力,可能助力北京首都国际机场疾速整合其余业务模块,帮忙其打消信息孤岛、晋升经营效率、升高沟通老本,实现人与人、人与业务零碎之间的实时协同,以及零碎与零碎之间的实时互通。 第四,提供平安可信的高质量通信。融云同时具备 IM 即时通讯和 RTC 实时音视频的双重能力。基于笼罩寰球的通信网络,依靠多个数据中心、数千个节点,融云能够保障用户从寰球 233 个国家和地区跨地区就近接入。通过自有传输协定专利技术,可能做到音讯的低提早,多端同步,保障音讯的不丢、不重、不乱;通过带宽评估、智能路由、网络自适应、丢包弥补等多项策略,可能进步反抗弱网的能力,确保通话质量,音频弱网抗丢包率达 80%,视频弱网抗丢包率达 60% ,保障端到端之间提早无感知的实时互动。 除此之外,融云在产品的部署施行和产品上线后的技术服务反对方面,也给予客户更多反对,无论是 7*24 小时全天候客服服务,还是 1V1 的 VIP 问题解决,都能做到疾速响应。 ...

May 15, 2022 · 1 min · jiezi

关于运维:GAIA数据集V110更新

更新日志此前,咱们提供了 MicroSS 2021 年 7 月的数据。 正如之前所承诺的,咱们当初将 GAIA 更新到 V1.10版本 在此更新中,咱们将 2021 年 8 月的数据从 MicroSS 增加到 GAIA。 数据集构造放弃不变,只是咱们省略了与已公布的模式十分类似的跟踪数据。 另一个好消息是,咱们正在 MicroSS 上部署一个新的业务场景。 新场景将蕴含系统日志,以后场景未提供这些日志。 同时反对对更罕用的中间件和数据库的监控,包含Zookeeper、Redis、MySQL等。咱们还设计了更多的异样注入办法,以尽可能实在地模拟系统故障。 GAIA数据集的下一次重大更新预计是 2022年9月,其中蕴含来自新场景的数据。 咱们心愿每个人都能享受对IT经营的钻研,并从GAIA数据集中获益。 对于GAIA数据集全称Generic AIOps Atlas,是一个用于剖析异样检测、日志剖析、故障定位等运维问题的全量数据集。GAIA中的数据次要来自于云智慧的业务模拟系统MicroSS中的一个典型场景。 MicroSS 尽可能全面地监控每个业务零碎,记录所有相干实体和业务执行的日志,以及反映对象具体特色的指标。 Github仓库地址:GAIA数据集文档:GAIA数据集在线文档 对GAIA数据集有任何疑难和倡议,请增加小助手微信,备注「GAIA数据集」征询

May 13, 2022 · 1 min · jiezi

关于运维:Dubbo3-落地实践及-Mesh-解决方案

作者 | 刘军 4 月 15 日-16 日,由 InfoQ 主办的 DIVE 寰球根底软件翻新大会通过云上展厅的模式胜利召开。在微服务 & 服务治理专场,Apache Dubbo PMC、Dubbo 开源我的项目负责人刘军带来了主题为《Dubbo3 落地实际及其 Mesh 解决方案》的演讲,以下为次要内容。 下一代云原生服务框架 Dubbo3首先带大家理解下 Dubbo3 到底是什么?与 2.7 架构的次要区别是什么?提供了哪些个性、能够解决哪些理论的问题?其中也包含大家都关怀的兼容性、降级老本以及与 HSF2 的关系等问题。 Dubbo3 外围设计准则与个性咱们定义 Dubbo3 是下一代的云原生服务框架,但 3.0 架构到底都蕴含哪些内容? 先来看下 Dubbo 3.0 的一些外围设计准则: • 首先,在架构层面,Dubbo 是面向云原生设计的,反对超大规模的微服务集群实际 - 百万实例级别,冀望通过智能化流量调度零碎晋升零碎稳定性与吞吐量; • 在策略层面,Dubbo3 的内核将是毫无保留开源的,它将成为国内私有云事实标准的服务框架,失去各大公有云厂商的反对,并通过灵便的 SPI 扩大机制反对不同部署场景的定制化需要; • 在业务价值上,Dubbo3 将显著升高单机资源耗费,晋升全链路资源利用率与服务治理效率。 这就是 3.0 设计过程中遵循的外围准则或指标,也让咱们从一个更高的层面意识了 Dubbo3。 具体到选型 Dubbo3 框架,大家除了会关怀 Dubbo3 提供了哪些新性能,Dubbo 老用户还会关怀 Dubbo3 的兼容性,Dubbo3 的迁徙老本以及其能带来的外围价值。 首先,Dubbo3 是从其本身 2.0 架构演进而来,因而它继承了 2.0 简直所有的个性,且放弃了对 Dubbo2 的齐全兼容,因而,老用户简直能够零老本迁徙到 Dubbo3。 ...

May 13, 2022 · 3 min · jiezi

关于运维:观测云社区版发布免费体验全功能私有化实例

4月21日,观测云社区版正式公布,该版本旨在为社区用户、合作伙伴与PoC测试人员,提供能够收费应用和学习的私有化实例版观测云平台。所有用户都能够在观测云官网收费下载和申请激活,参照操作手册,通过一键部署工具,立刻体验残缺的观测云性能。 观测云自问世以来,始终广受业内高度关注和市场好评,沉闷用户数继续飞速增长。2022年4月,观测云首批通过中国信通院《可观测性平台技术能力》“先进级”评估(最高级),升级为国内可观测性SaaS服务赛道内领军品牌。4月28日,“2022观测云产品发布会”上,观测云强调会加大投入到SRE理念在国内的流传与实际,及对新一代可观测性技术的推广遍及。本次社区版的公布,是观测云践行承诺的重要动作之一,继观测云SaaS版之后,部署版也凋谢收费体验。 观测云反对SaaS订阅和私有化部署两套发行形式。用户能够按本身业务特点,筛选实用的版本和计费模式,包含按量计费、购买许可证或订阅服务。本次社区版的公布,极大升高了对私有化部署版的试用门槛,客户可在体验产品后,取得肯定水平的理解,再抉择适合的计费模式。同时不便了社区用户与合作伙伴,更近距离、更深度理解观测云体系架构和性能特点,发明出更多实际场景。社区版提供观测云稳固版本,并会继续公布更新,用户能够自行下载更新包降级。 观测云社区版三大亮点1、领有观测云全副产品性能,反对新版本继续降级;2、兼容各种K8S版本底座,官网提供具体配置手册和技术文档;3、可通过更新许可证降级为部署版(付费版),保留测试期间全副配置和数据。 社区版获取和装置步骤观测云社区版须要在实现本地装置当前,再进行激活配置。 Step1:抉择部署形式用户能够参考部署文档(https://www.yuque.com/dataflu...)抉择 云上部署 或者 线下环境部署 或者 阿里云计算巢部署,进行线上或者线下部署。部署实现后,用户能够取得以下观测云社区版相干平台的登录形式。dataflux 【用户前台(观测云)】df-management 【治理后盾】df-func 【Func 平台】df-openapi 【OpenAPI】 Step2:实现配置并激活社区版1.部署 DataWay观测云社区版部署实现,装置DataWay,能力通过DataWay来上报数据到观测云社区版工作空间。在这期间咱们会有一个DataWay数据网关地址,用于激活社区版。DataWay装置结束后,期待片刻刷新“数据网关”页面,如在数据网关的“版本信息”列中看到了版本号,即示意这个DataWay已胜利与观测云核心连贯,前台用户能够通过它来接入数据。 2.激活社区版关上社区版注册网址(https://boss.guance.com/index...),依据提醒注册社区版账号。 注册实现后,进入观测云社区版费用核心,点击“AK 治理”-“创立 AK”,点击“License 治理”-“创立 License”,最初关上观测云 Launcher,点击右上角齿轮图标的“设置”,抉择“License 激活及 AK/SK 配置”,填入 AK/SK、License 和 数据网关地址,实现社区版激活。 留神:您能够扫码关注观测云服务号,获取更多观测云的官网信息。 Step3:开始应用观测云(社区版)观测云部署版不提供用户注册性能,须要登录“观测云治理后盾”的“用户”菜单,依照如下步骤实现用户增加:点击“增加用户”增加用户,点击“观测云治理后盾”-“工作空间列表”-“新建工作空间”创立工作空间,点击“查看成员”进入对应的工作空间成员页面,点击“增加用户”输出用户信息并设置权限,最初“确定”即实现用户增加。 实现以上设置,关上观测云社区版拜访地址,即可应用以上创立的用户登录到对应的工作空间开始应用观测云的所有性能。 社区版降级步骤如需降级以后社区版版本,您能够通过获取最新"安装包",自行实现版本升级。安装包:https://www.yuque.com/dataflu...如需降级至商业部署版,您能够通过"观测云"服务号或返回“费用核心”(https://boss.guance.com/#/signin) 提交您的需要,咱们将有专人为您服务。

May 12, 2022 · 1 min · jiezi

关于运维:首次全面定义2022企业应用运维管理指标体系白皮书重磅发布

近日,博睿数据联结艾瑞征询独特公布了《2022企业应用运维治理指标体系白皮书》(以下简称《白皮书》)。《白皮书》从企业IT运维的外延以及在以后数字经济倒退的大环境下企业IT运维工作在技术、策略、组织架构等方面面临的变动和问题做了具体阐明,并展现了一种以业务和利用为着眼点的企业应用运维治理指标体系,对该体系的原理、设计和实际进行了具体阐明。 企业应用运维治理指标体系的重要性 《白皮书》指出,随着互联网服务深刻千行百业,数字化利用成为企业和机构为用户提供服务的重要模式,间接对用户体验环节进行监测和优化成为IT运维的新思路和路径,相较于传统的面向企业IT资源的运维,面向用户体验的IT运维形式更加聚焦于前端业务侧,能以更不言而喻的形式晋升各项服务的体现。随着互联网经济的倒退,这一运维思路已在企业中失去了充沛实际。 此外,数字化时代企业的运维体系需向利用端视角转变,对于企业而言则须要一套新的运维体系,就《白皮书》中提到的中国某头部上市城商行的运维现状、问题和倒退布局可见,要适应上述的基础架构和业务模式变动,企业须要系统化的方法论领导、明确的指标体系的疏导。 与此同时,随着数字经济的倒退及其发明的社会经济价值继续晋升,我国的IT人才老本在市场需求的刺激下继续晋升,IT人才老本的进步,给企业带来的间接影响是减少了延聘蕴含运维在内的员工的老本。对于企业而言,缩小对人力和教训的依赖是应答上述问题的无效办法,而为了达成这一指标,企业须要为运维工作建设系统性的指标、流程和组织合作体系。 因而,为了施展企业运维侧的策略价值,企业须要自上而下地买通运维部门和其余部门之间的沟通渠道,造成合力,独特赋能于企业的数字化转型降级。为了更好地赋能业务翻新,运维部门不仅须要运维技术的迭代,也须要通过建设更欠缺的、可能继续赋能和迭代的运维指标体系的形式,来畅通和业务部门、管理层沟通的渠道,使运维部门可能充分发挥技术劣势和创新能力,晋升运维工作给企业都带来的价值,减少运维工作的投入产出比。 综上不难看出,企业IT运维正在经验从“后盾”向“中台”的转变,需进一步施展其在企业中“降本增效”的成果。因而,为了晋升运维的投入产出比并晋升运维侧对业务侧的价值发明属性,企业的运维部门须要构建一套运维治理指标体系,这将帮忙企业运维部门造成高效的工作流体系,晋升日常运维工作的效率,加重运维工作对人工和教训的依赖,并为基于大数据的智能运维利用的部署提供反对和疏导。 首次全面定义企业应用运维指标体系 以博睿数据的企业应用运维指标体系为例,这一体系从业务视角切入,以业务场景为主题,以业务连续性为主旨,通过直面业务场景、正向梳理IT调用链、逆向接入数据源等施行步骤,最终构建起具备概览所有业务场景衰弱度、鸟瞰多维立体化IT指标等能力的资源指标管理体系。 具体来看,分为以下7个方面: 1· 业务端 业务端是企业应用运维指标体系的首要关注点。对于企业来说,业务情况是企业管理者最关怀的局部,也是企业所有决策的根底,而随着大数据和人工智能技术的倒退,大量企业借助信息技术实现转型降级。业务数据指标可能为业务侧员工和管理者提供数据洞察,员工和管理者做决策时不再仅仅是依照教训“拍脑袋”,而是基于数据分析的后果进行策略调整及决策布局。 2· 用户端 用户端(APP、小程序、网站等)是企业与用户的数字触点,同时也是企业获客、留客的重要途径。在互联网/数字化服务的整个链条上,客户需首要关注的是用户端体验及体现,从而使得用户端体验成为数字化经营中企业产品力和市场竞争力的重要组成部分。以晋升体验为外围的用户端运维品质会间接影响用户对企业的印象和评估,是企业发展运维工作良好的着力点。 3· 利用端 用户端指标所反映的拜访状况只是一个表象,用户端真正所拜访到的其实是网站的后盾利用,以后企业面临着日益激增的IT复杂性和业务需要的疾速变动,IT利用在运行过程中产生性能降落或者服务不可用等故障的可能性大大增加,从而影响业务服务的失常运行。利用监测不仅可能帮忙企业疾速定位问题和节约老本,帮助企业继续关注利用性能状态,并获取实时反馈,并且可能助力企业应用容器化部署。 4· 网络监测 各个利用之间的调用通过网络来实现,各个企业IT建设的规模与复杂度一劳永逸,须要通过网络监测对现有运维流程进行优化,一直晋升治理和运维程度。网络设施连接着企业的IT根底资源和用户端的应用体验,也可能反映企业的客户数量、业务流量和业务的工夫、地区等特色,在非凡场景下更关涉数据安全等问题,可能在很大水平上帮忙晋升企业数字化服务的创新力和产品力。 5· 资源层监测 网站所有服务均体现在根底资源层面,因而根底资源监控是所有监控中最底层的局部,也是实现AIOps不可或缺的一环。 6· 中间件监测 随着计算机技术的疾速倒退,更多的应用软件须要在多种不同的网络协议、硬件以及网络平台环境中运行。这导致了软件开发者面临数据离散、操作艰难、零碎匹配水平低等问题,须要开发多种应用程序来实现治理和经营,而中间件技术的倒退在很大水平上加重了开发者的累赘,使得网络的运行更有效率。 7· 数据库 在数据成为企业重要的经营资产的环境下,对外围数据库的高效运维可能帮忙企业从数据底层保护零碎的问题和信息安全,同时,在湖仓一体等新型数据库构建模式一直浸透的条件下,面向数据库的运维也将迎来挑战和翻新,须要企业投入更多的关注。 构建利用运维治理指标体系的四个步骤 此次,博睿数据联结艾瑞征询联结公布的《白皮书》,不仅为《白皮书》的编写提供了参考;同时,该《白皮书》也是博睿数据今后工作的重要指南,只有引入更全面、更高要求的指标标准,才可能指引公司产品向更稳固与更高质量方向进发,从而塑造出行业的利用标杆。 在博睿数据看来,企业应用运维治理指标体系的建设需从业务全面梳理——确定利用要害动作——预约义各要害指标——落地企业应用运维治理平台4个步骤登程。 1· 业务全面梳理 在互联网经营大环境下,用户起源渠道泛滥,包含付费广告、搜寻、内容社交、线下推广等形式,随后用户将进入 APP、公众号、小程序或网站拜访企业的首页并进行注册、商品浏览、加购、付款等行为。用户旅程多种多样,企业须要针对不同业务来进行用户旅程梳理。 2· 确定利用要害动作 企业在透视业务并联合业务进行 IT 架构监测的过程中,务必要确定整个业务流程中的要害动作,比方注册、登录、付款等用户行为及其所波及的具体服务、接口、微服务或数据库等关联性资源。 3· 预约义各要害指标 不同的业务具备不同的个性,业务流程中的关键环节各不相同,企业须要基于不同业务的要害行为动作,从业务、利用、服务、硬件层面进行指标梳理,从而布局出合乎不同业务个性的利用运维治理指标体系。 4· 企业应用运维治理平台 最初,在落地企业应用运维治理平台的过程中,须要企业应用运维治理平台提供强有力反对。 以博睿数据为例,该平台须要具备 APM、Log、业务、根底设施、CMDB 等数据的接入能力,并可能联合以往行业建设成功经验、行业倒退等常识,造成笼罩“业务梳理-要害利用确认-外围指标梳理-指标衰弱度分级-指标更新”全链条的动静更新体系平台,为企业本身的资源利用、业务监控、决策反对、智能运维等场景提供全面的反对。 除此之外,企业在搭建指标体系过程中会应用多种监测类产品,这须要企业对各产品的稳定性、成熟度进行关注,博睿数据认为可关注CMMI5和中国信通院智能运维成熟度度评估认证两个重要指标。 博睿数据资深架构师总监张冲示意:“企业真正实现从‘O视角(Operation)’到‘C视角(Customer)’的转变,须要建设一套全新利用运维指标体系,该体系建设过程须要经验业务梳理、要害动作确定、要害指标定义、平台搭建几个要害过程,同时指标体系须要依据业务一直倒退来进行动静调整,以保障指标体系的稳固、可观测性、可追溯。” 艾瑞征询认为,构建利用运维治理指标体系将帮忙企业运维部门造成高效的工作流体系,晋升日常运维工作的效率,加重运维工作对人工和教训的依赖,并为基于大数据的智能运维利用的部署提供反对和疏导。 白皮书残缺下载链接: https://www.bonree.com/bonree...

May 12, 2022 · 1 min · jiezi

关于运维:快速上手-Pythond-采集器的最佳实践

Pythond 是定时触发用户自定义 Python 采集脚本的一整套计划。本文以 “获取每个小时登录的用户数”作为指标上报给核心为例。 1.1. 业务演示介绍业务流程大抵如下: 从数据库中采集数据 (Python 脚本) -> pythond 采集器定时触发该脚本上报数据(datakit) -> 从核心可看到指标(web)。 数据库当初有一张表叫 customers, 表中有如下字段: ● name: 姓名 (字符串)● last_logined_time : 登录工夫 (工夫戳) 建表语句如下: create table customers( id BIGINT(20) not null AUTO_INCREMENT COMMENT '自增 ID', last_logined_time BIGINT(20) not null DEFAULT 0 COMMENT '登录工夫 (工夫戳)', name VARCHAR(48) not null DEFAULT '' COMMENT '姓名', primary key(id), key idx_last_logined_time(last_logined_time)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4; 往上面的表中插入测试数据: INSERT INTO customers (id, last_logined_time, name) VALUES (1, 1645600127, 'zhangsan');INSERT INTO customers (id, last_logined_time, name) VALUES (2, 1645600127, 'lisi');INSERT INTO customers (id, last_logined_time, name) VALUES (3, 1645600127, 'wangwu'); ...

May 11, 2022 · 3 min · jiezi

关于运维:案例分享|智慧广电的宽带加速之路博睿数据来私人定制

简直所有行业都在向智慧型方向进发,对于广电行业而言,也并不例外。 2020年3月2日,国家广播电视总局召开电视电话会议,贯彻落实中宣部等九部委联结印发的《全国有线电视网络整合倒退实施方案》,放慢推动全国有线电视网络整合和广电5G建设一体化倒退,就“全国一网”整合工作进行动员部署、提出工作要求。这开释的一个显著信号是,“全国一网”要来了。 另一方面,全方位的数字化转型也在推动广电行业一直向前。 “十四五”布局中明确提出推动数字产业化和产业数字化、推动数字经济和实体经济深度交融。接下来如何深刻行业场景,把数字技术与行业常识深度联合,真正融入主业务流程,解决外围业务问题,催生体验晋升、效率晋升以及模式翻新已成为数字化转型的一个重要课题。 因而,对于广电行业而言,时机与挑战是并存的。 智慧广电的“变与不变” 过来几年,数字经济出现规模增长迅速、翻新交融驱动放慢、新业态不断涌现,数字经济不仅成为了推动江苏高质量倒退的新引擎,更成为了引领区域经济将来倒退的新经济状态。致力强富美高新江苏,数字经济领跑只是序章,更需继续翻新思路、放慢破题,锻造数字化转型智胜的那把要害“钥匙”。 在减速数字化转型的过程中,对于广电企业而言,也迎来了诸多“变与不变”。 变的是广电行业的利用场景。 过来,用户黏性升高、规模缩减、份额降落、新用户发展缓慢、老用户散失加剧等问题始终是广电的“顽疾”,但最近几年,广电行业在5G 技术的加持下,冲破了市场份额与新增用户瓶颈。 《中国广电5G试验网的建设实施方案》指出,2019年在全国16个城市开展试点,2020年是规模建网阶段,年中打算启动市场经营,年底开始规模商用,同时推广集体2C业务和垂直行业利用的2B业务。 5G商用将可能为广电行业带来支出大幅度增长,以及市场份额和新增用户的冲破,扭转当下窘境。4G带来了挪动视频,而5G带来了VR/AR、物联网、人工智能等多个利用场景产品升级的设想。 以2020年央视春晚为例,即利用5G高速率、低提早的个性,采纳了5G 8K技术实现多机位拍摄,并制作8K版春晚,独创的虚构网络交互制作模式(VNIS)也将在春晚首次利用,用户能够通过央视频客户端观看2020春晚VR直播和多视角全景式直播,三地实时回传,观众广泛反映“视觉效果比今年好”。相似地,以8K超高清的分辨率展示节目内容,以及VR技术被广泛应用于广电行业,特效观感和观众视觉体验将可能失去大幅晋升。 不变的是广电行业的用户体验。在5G 在商用过程中,有些问题也不可避免的裸露进去。 过来,广电网络整合数年推不动,技术革新始终“革”不了,机构臃肿,观点落后,而对于大多数电视台来说,也都存在着资源扩散、治理粗放、外部腐化、短少主观能动性等问题,在数字化改革过程中,这样的问题仍旧存在。 另一方面,生产技术改革晋升了物质财富和非物质财富的丰富性,以往所强调的物质精神财富不足以撑持用户需要的局面产生了转变,反倒是烟波浩渺的信息空间导致用户获取共性信息需要的老本大大增加,更不足的是有针对性的信息提供。 从广电网络本身而言,随着用户数量的增长、需要的进步,业务规模的扩充、凋谢水平的进步,利用零碎的架构越来越简单,IT零碎经验了从语言到架构、从组织到体系、从Web到挪动、从开源到自主研发、从通用体验到个性化服务等等的全面转型,任何一个业务链出问题,都会影响到最终的用户体验。 SmartBear钻研曾表明,Amazon加载工夫每缩短1秒,一年就会缩小16亿美元的营收。而“1秒”其实是每一个企业都会面临的问题,影响这“1秒”的用户服务体验因素,可能波及地区、终端、网络设施、中间件、数据库等这一简单的全链路。 博睿数据私人定制化监测,一键晋升用户体验 以博睿数据曾单干过的某广电企业为例。 针对广电网络监测用户体验不及时,用户体验无奈及时感知等问题,博睿数据凭借多年的技术教训为其打造了一套私人定制化的监测计划。 即通过博睿数据Bonree Net 对广电企业的利用及网络节点部署博睿数据主动式监测产品,设定周期性监测工作,从地区、运营商、工夫趋势等多个维度组合比照剖析,可实现对服务可用性、流媒体、页面浏览、IPv6、骨干链路的监测。 一方面,博睿数据通过公有Net产品对广电地市级宽带业务进行继续监测 帮忙该广电及时发现地市级分公司业务拜访趋势,并提出数据撑持及优化倡议,大大晋升了问题解决效率,改善了终端用户业务的拜访体验,均匀页面资源关上耗时优化。 另一方面,通过正当的监测和全面的指标数据,将由省公司划拨的运维费与理论业务拜访体验数据进行关联,帮忙其外部构建KPI考核体系。 总结 在疫情防控的新形势下,放慢推动“全国一网”广电5G交融建设被赋予了更深远的意义,即利用于应急数据及公共服务、智慧城市、医疗、教育、电子政务等To G畛域。面对这样的变动,将来,博睿数据也将立足当下,时刻关注企业在数字化转型中的瓶颈,对产品不断更新迭代以适应数字化转型给企业带来的变动,为企业提供更加高效优质的监测服务,助力企业在数字化转型中走的更稳、更远。

May 11, 2022 · 1 min · jiezi

关于运维:阿里云EMAS旗下低代码平台Mobi开放定向内测

简介:【低代码深度共创】EMAS旗下低代码平台Mobi凋谢定向内测名额,限时限量,参加调研先到先得!Mobi是面向全端(Web、Native App、H5、全平台小程序等)场景,模型驱动的低代码开发平台(Low Code Development Platform ),提供一站式的可视化利用建模、页面搭建、数据建模和流程编排能力,基于云原生架构反对利用的弹性扩大和零老本运维,帮忙客户高效地解决利用开发、定制和保护的问题。 目前,Mobi 处于私有云版本内测中,诚邀对低代码有强烈需要的企业或集体开发者进行深度共创,为了理解您的需要,咱们特意设计了这套问卷,请您填写:[点击此处填写问卷](链接地址https://survey.aliyun.com/apps/zhiliao/NWpvRGBHR 1,本次邀约名额限时限量凋谢,高质量实现问卷者先到先得 2,mobi团队原厂产研一对一沟通,利用低代码技术解决您的利用开发问题 Mobi的利用场景: 客户体验翻新(Customer Experience Innovation) 以客户和员工的每个业务触点体验作为抓手,通过低代码平台疾速的撑持利用翻新,通过利用扩大和迭代晋升企业和员工对于企业的满意度。 业务流程自动化(Process Automation) 以企业外部各类定制化的治理流程作为指标,无需重构已有零碎,通过低代码平台对已有系统集成和新的流程编排设计,低成本、轻量级的解决跨业务流程流转问题,进步企业运行效率。 企业SaaS定制(Enterprise Software Customization) 当通用型SaaS(如OA、CRM、ERP)无奈满足企业业务诉求时,可通过低代码平台对已有SaaS的数据和接口集成,通过可视化的形式增加新的业务利用,加强企业SaaS能力,满足企业100%定制化需要。 系统集成与扩大(System Integration & Extension) 在企业数字化革新过程中,要依靠于已有零碎运行同时构建新的数字化业务,应用低代码平台对已有零碎进行集成和对立接口化革新,解决异构零碎的集成与对立凋谢问题。 欢送退出体验交换钉钉群,群号:35248489 版权申明:本文内容由阿里云实名注册用户自发奉献,版权归原作者所有,阿里云开发者社区不领有其著作权,亦不承当相应法律责任。具体规定请查看《阿里云开发者社区用户服务协定》和《阿里云开发者社区知识产权爱护指引》。如果您发现本社区中有涉嫌剽窃的内容,填写侵权投诉表单进行举报,一经查实,本社区将立即删除涉嫌侵权内容。

May 10, 2022 · 1 min · jiezi

关于运维:Nginx-日志采集与分析

概述观测云领有全面的日志采集能力,包含系统日志、利用日志、平安日志等多种日志类型,通过观测云提供的自定义日志采集器可采集任意日志汇总到观测云进行对立存储和剖析;通过观测云提供的文本处理器(Pipeline)可对采集的日志进行自定义切割,并把切割进去的字段作为属性应用。通过属性字段,咱们能够疾速筛选相干日志、进行数据关联剖析,帮忙咱们疾速去定位问题并解决问题。 前置条件您须要先创立一个【 观测云账号 】https://auth.guance.com/regis...微信公众号 装置 DataKit 【DataKit 装置文档 】https://www.yuque.com/dataflu... 办法|步骤开启 Nginx 采集器主机装置 Datakit 当前,在/usr/local/datakit/conf.d/nginx 目录下,复制 nginx.conf.sample 并命名为 nginx.conf,编辑 nginx.conf,开启寄存 Nginx 日志的地址和 Pipeline。如: files = ["/var/log/nginx/access.log","/var/log/nginx/error.log"] Pipeline = "nginx.p"(其中 ""中能够不填写具体的 Pipeline 脚本名称,DataKit 会主动匹配跟 source 同名的脚本文件) 留神:Pipeline 开启后,DataKit 会主动依据日志起源来匹配 Pipeline 脚本文件。若日志起源和 Pipeline 文件名称不统一,则须要在采集器配置,如日志起源 nginx,Pipeline 文件名 nginx1.p,则须要配置 Pipeline = "nginx1.p"。 [[inputs.nginx]] url = "http://localhost/server_status" # ##(optional) collection interval, default is 30s # interval = "30s" use_vts = false ## Optional TLS Config # tls_ca = "/xxx/ca.pem" # tls_cert = "/xxx/cert.cer" # tls_key = "/xxx/key.key" ## Use TLS but skip chain & host verification insecure_skip_verify = false # HTTP response timeout (default: 5s) response_timeout = "20s" [inputs.nginx.log] files = ["/var/log/nginx/access.log","/var/log/nginx/error.log"] # # grok pipeline script path pipeline = "nginx.p" [inputs.nginx.tags] # some_tag = "some_value" # more_tag = "some_other_value" # ...配置实现后,应用命令行 datakit --restart 重启 DataKit 使配置失效。 ...

May 9, 2022 · 2 min · jiezi

关于运维:观测云产品更新|优化观测云商业版升级流程新增进程日志链路详情页关联网络场景模块优化等

观测云更新优化观测云商业版降级流程观测云降级到商业版默认开明观测云费用核心账户结算,反对更改结算形式为云账号结算,包含阿里云账号和 AWS 云账号结算形式。 更多详情介绍可参考【 观测云费用核心账户结算 】https://www.yuque.com/dataflu... 新增过程、日志、链路详情页关联网络观测云过程、日志、链路详情页新增关联网络数据分析,反对基于 IP/端口查看源主机/源过程服务到指标之间的网络流量和数据连贯状况,通过可视化的形式进行实时展现,帮忙企业实时理解业务零碎的网络运行状态,疾速剖析、追踪和定位问题故障,预防或防止因网络性能降落或中断而导致的业务问题。 场景模块优化优化仪表板,去掉编辑模式在场景仪表板顶部导航栏,去掉“编辑”按钮,新增“增加图表”为仪表板增加新的图表,图表增加实现后,点击右上角「实现增加」即可。 在图表中,点击「设置」按钮,抉择「批改」,即可对图表进行编辑。 新增图表链接显示开关观测云反对图表内置链接和自定义链接,能够帮忙您实现从以后图表跳转至指标页面。内置链接是观测云默认为图表提供的关联链接,次要基于以后查问的工夫范畴和分组标签,帮忙您查看对应的日志、过程、容器、链路,内置链接显示开关默认敞开,可在编辑图表时开启;自定义链接创立实现后,显示开关默认开启。 更多详情介绍可参考【 图表链接 】https://www.yuque.com/dataflu... 优化 DQL 查问与简略查问转换点击“DQL 查问”右侧的切换按钮图片,可切换 DQL 查问为简略查问。 留神:「DQL查问」切换成「简略查问」时,若无奈解析或者解析不残缺: 在「简略查问」下未操作,间接切换回「DQL查问」则显示之前的 DQL 查问语句; 在「简略查问」下调整了查问语句,再次切换回「DQL查问」将依照最新的「简略查问」进行解析。 更多详情介绍可参考【 图表查问 】https://www.yuque.com/dataflu... 监控器和事件模块优化新增事件关联信息观测云反对查看触发以后事件的相干信息,如查看触发事件的相干日志。此“关联信息”仅反对 4 种监控器产生的事件:日志检测、平安巡检异样检测、过程异样检测以及可用性数据检测。 新增无数据事件名称和内容配置观测云监控器“阈值检测”、“水位检测”、“区间检测”、“渐变检测”、“过程异样检测”、“利用性能指标检测”、“用户拜访指标检测”新增无数据事件题目和内容配置,默认不可填写,当抉择触发无数据事件时为可填写无数据事件名称,反对应用预置的模板变量。 更多详情介绍可参考【 事件名称/内容模板 】https://www.yuque.com/dataflu... 优化可用性数据检测观测云监控器可用性数据检测,优化反对抉择 HTTP、TCP、ICMP、WEBSOCKET 拨测类型。 优化告警告诉模版,减少关联跳转链接邮件、钉钉、微信、飞书收到的告警告诉蕴含“观测云跳转链接”,点击可间接跳转到对应的观测云事件详情,工夫范畴为以后工夫的往前15分钟,即18:45:00的事件,点击链接后跳转至事件详情页,工夫范畴固定为4.20 18:30:00 ~ 4.20 18:45:00。 更多详情介绍可参考【 告警设置 】https://www.yuque.com/dataflu... 其余性能优化优化服务 servicemap 指标查问性能新增查看器数值型字段反对 > | >= | < | <= | [] 5种写法新增指标查看器标签反对级联筛选优化 DQL 查问返回报错提醒DataKit 更新过程采集器的过滤性能仅作用于指标采集,对象采集不受影响优化 DataKit 发送 DataWay 超时问题优化 Gitlab 采集器修复日志采集截断的问题修复各种 trace 采集器 reload 后局部配置不失效的问题更多 DataKit 更新可参考【DataKit 版本历史】https://www.yuque.com/dataflu... ...

May 7, 2022 · 1 min · jiezi

关于运维:聊一聊运维如何在工作中寻找亮点

这篇文章想跟大家聊一聊运维工程师如何去体现运维工作的价值,或者说运维的绩效能够从哪些方面进行思考。前几天在一个技术探讨群里,一位兄弟发动了一个话题:运维要怎么更好地展现本人的业绩,让绩效更好看? 这个话题引发了一番探讨,在这里,我想依据探讨的内容以及本人的想法进行总结,分享一下运维工作能够从哪些方面寻找亮点。 与泛滥互联网相干岗位相比,运维的工作内容堪称是多又杂,还难以被人关注到,往往只有在零碎呈现问题的时候,运维才有可能被人关注到。但运维的首要任务,不就是保障系统的稳定性,让零碎继续可用嘛,天然不可能为了失去关注而盼着零碎出故障,零碎总是呈现故障也会让别人质疑运维工程师的能力。 那么,运维该如何从日常工作中寻找有价值的工作,以此来体现运维的外围能力呢?我感觉能够从以下几个各方面思考。 一、公司倒退策略每个公司在不同的倒退阶段,都会有不同的倒退策略和指标,而公司里的业务,无论外围与否,都或多或少跟公司的倒退指标相干。 运维是一门技术活,很多干技术的,都会给人一种印象就是埋头苦干,两耳不闻窗外事。但我感觉运维相比之下,具备更强的灵活性,每一个运维人员都应该具备owner意识,而不是只会看需要和工单做事。 作为运维人员,应该多理解公司的倒退策略和指标,并思考本身的运维工作有什么中央能够贴合公司的布局。 举个理论的例子,咱们晓得,以前公司开发了一个利用或者网站之后,就会购买一批服务器来部署网站对外提供服务,但这种形式的毛病在于扩展性差、资源利用率低、老本高。所以起初,规模较大的公司就会自建云资源池,而小公司则会向阿里云、腾讯云这样的云服务提供商购买云主机来部署利用,以此来进步资源利用率,降低成本。 假如公司将来的趋势就是应用云资源池,那么,作为运维人员,就能够及早提出将本人保护的利用往资源池迁徙,这不就是一项运维工作的绩效所在吗? 二、零碎稳定性晋升所谓零碎稳定性,指的是零碎在外界环境变动的状况下是否放弃零碎的稳固和继续可用。晋升零碎的稳定性,不是说谋求零碎不要呈现问题或故障,要晓得,没有一个零碎是不出问题的。 那么,在零碎稳定性晋升方面,咱们能够做什么呢? 制订可用性指标可用性指标应该大家平时听得比拟多,也就是咱们平时常说的4个9、5个9,即服务可用时长占比。运维应该给本人所保护的零碎定一个可用性指标,之后运维所做的大部分工作都是为了去实现这个指标。 制订标准标准文档能够对开发、测试、运维的工作起到束缚作用,通知相干人员什么该做、什么倡议做、什么要防止做,这样能够避免出现一些常见谬误,以此来升高零碎出问题的概率,晋升零碎的稳定性。 运维能够依据以后的工作环境、技术体系、历史教训,去扫视整个软件生命周期中每个阶段,是否有一些能够预知的问题,并将此制订成各类工作标准,包含:上线标准、测试标准、编码标准、数据库应用标准、各类中间件应用标准、我的项目构造标准等等。 高可用性晋升这点是最重要的,后面提到,没有一个零碎是永远不会出问题的,所以作为运维,就要去思考,当零碎呈现问题的时候,零碎要怎么应答,不同的问题,应答措施是不同的,但至多要保障,外围服务的高可用。 高可用要求服务节点不是单点的,并且在繁多节点不可用时,可及时切换到可用节点。 高可用大抵能够分为以下级别: 1、单机房高可用 利用部署在一个机房内,应该保障外围服务是多节点的,能够是主备(冷备、热备)、主从、集群等,目标是为了应答服务单点危险,当服务主节点不可用时,能够迅速切换到备用节点,从而缩小服务不可用的时长。 2、同城双活 尽管在单机房中实现了高可用,但如果整个机房不可用,又该如何保障业务的连续性呢?常见的做法是同城双活,在同一个城市的两个机房里部署同一套应用程序,并通过高速专线实现双核心数据的近实时同步。 3、异地容灾 如果你感觉一个城市两个机房还是不保险,可能会呈现大面积停电的状况,那么就能够在不同城市建设容灾核心。 因为两个城市相隔较远,不可能像同城双活一样做到近实时的数据同步,所以容灾核心平时是用不到的,只有在主核心故障时,才会切换容灾核心,并且在切换容灾核心的时候,可能会呈现局部数据失落。 4、两地三核心 因为异地容灾的数据同步提早会比拟大,所以个别会采纳两地三核心的架构计划。 两地三核心指的是同城双活 + 异地灾备核心,同城双活能够实现底层数据的近实时同步和双活,而异地灾备核心能够在同城双核心同时故障时利用备份数据进行业务复原。 对于高可用架构的建设计划,将来能够通过专门的文章进行分享,这里就不开展细讲了。 架构优化除了以上提到的形式,运维还能够主导零碎架构优化,比方,零碎是否有超时和重试机制?是否有熔断伎俩?是否有备份机制?这些也是晋升零碎稳定性的罕用伎俩。 应急/切换演练当零碎有了高可用伎俩之后,还应该定期通过应急演练和切换演练来验证高可用伎俩的有效性。此外,还能够思考引入混沌演练,对系统进行危险点检测,进而推动系统优化。 三、性能晋升运维能够对系统的各个环节、各个局部进行性能评估,并推动开发、DBA等相干共事进行优化,以此来晋升零碎的整体性能。 构想一下,咱们关上一个网页,如果这个网页要加载1分钟能力加载完,你还会等上来吗? 所以,零碎的解决性能越高,能够给使用者带来更好的用户体验。 四、现网问题危险预警和疾速解决运维还能够思考如何提前预警系统危险以及如何疾速解决现网问题。 预警系统危险,须要运维被动联结研发、产品的共事欠缺监控体系、丰盛监控告警指标,并对历史监控数据进行长久化存储和统计分析。 而要疾速解决现网问题,要求运维对排障工具的纯熟应用。那么,是否能够思考,对历史呈现过的故障进行整顿,输入故障解决手册。还有是不是能够思考,依据零碎理论状况,输入罕用排障工具的使用手册,防止每个人应用工具的形式不一。 五、降本增效我始终感觉,运维工作的翻新和亮点大多数体现在降本增效上。运维应该多去思考,日常工作中有什么中央能够提高效率和降低成本的。 上面列几点这方面的一些做法: 进步资源使用率在软件生命周期中,软件的运行保护是继续最长的一个阶段,而软件一旦上线,产生的最间接的老本就是服务器。在零碎刚上线的时候,须要购买服务器来部署零碎利用,而在零碎继续运行的过程中,服务器也会继续产生电费等各种老本,并且服务器还须要定期替换。 服务器应用的越多,产生的老本越高。然而在大多数理论状况下,服务器本身的CPU、内存等资源的使用率可能并不高。 所以,运维须要思考,如何进步资源的使用率,进而缩小服务器数量,升高服务器所带来的老本。 自动化/智能化运维所要负责的工作是很多的,所以运维要时刻想着通过自动化的伎俩去进步工作效率。如上文提到的疾速解决现网问题,运维除了纯熟排障工具的应用之外,如果能将多个工具的优化性能整合成一个工具,实现一键排障,那么就会大大提高故障排查的效率。 当效率进步之后,运维就有更多的工夫和精力去做更多有价值的工作。但要留神,自动化工具肯定要依据本身理论状况去建设,如果最终实现的自动化工具不实用本身工作环境,并且稳定性还很差,那么就会变成多了一项保护工作,这就是升高工作效率了。 而智能化所要解决的问题是,人力难以去实现的工作,比方故障预警,但智能化的根底是自动化,也就是说,要做好智能化的前提是先做好自动化,因为智能化所实现的是决策方面的事,最终的执行还是依附自动化去实现的。 进步版本公布效率版本的公布上线应该属于开发和运维日常工作中的常事了,而一个新版本在公布上线之前,是要通过一系列的测试、安全检查等环节的,而这些工作是须要占用工程师大量工夫的,那么,进步版本的公布效率,就势在必行了。 一般来说,进步版本公布效率是通过CI/CD来实现的,搭建一套开发平台,研发编写完代码之后,提交到Git仓库,再一键启动代码审计、自动化测试、安全检查等性能,对要公布的程序包进行各项查看,再主动地将利用部署到生产环境,从而进步各环节的效率,不必手工实现这些工作。 降本增效的工作还有很多,须要大家在日常工作中多去思考和落地。 六、建设欠缺的监控体系后面有很多工作内容,都须要依赖欠缺的监控体系,比方:危险预警、性能优化,构想一下,没有监控数据,你怎么做性能优化,总不能每次想起来要做的时候,手动去获取性能指标数据吧?那这样的效率是不是就太低了。还有,没有监控数据,如果对历史的资源应用状况做剖析,来达成危险预警的指标? 所以,我感觉建设欠缺的监控体系,是每一个运维都应该去做的事件,有了丰盛的监控指标和监控数据,你就能反推研发对系统进行优化,能在零碎危险暴发之前提前应答,能在零碎呈现故障时疾速定位。 这里说的欠缺的监控体系,不仅仅只是说监控一下服务器的CPU和内存使用率是多少就完事了,而是最好能做到,服务器上每个利用过程所占用的CPU和内存是多少,这样,运维能力晓得,应该优化哪些服务,让谁去优化。 再比方,是否能够减少一些业务监控指标,比方用户数、日活数、页面关上速度等等,这样能够分明晓得,零碎用户是在减少还是缩小,有没有可能因为用户体验差导致用户散失?这样才能够针对性地去进行优化和晋升。 总结这篇文章分享了运维如何从日常工作中寻找亮点,次要从以下几个方面进行思考: 公司倒退策略零碎稳定性晋升性能晋升现网问题危险预警和疾速解决降本增效建设欠缺的监控体系其实能够做的工作还有很多,要求运维要多反思本人的工作,去寻找能够优化的中央。 并且,还须要留神一点就是,在做这些工作的时候,要多思考可推广性。比方,在造成标准文档和开发自动化工具的时候,多思考其余零碎是否能够借鉴应用,这样不仅仅只是实现繁多零碎的降本增效,能够在公司层面实现更大的优化。 大家如果有什么好的想法,欢送在评论里独特探讨。

May 7, 2022 · 1 min · jiezi

关于运维:闲置计费-Serverless-冷启动与成本间的最优解

简介:函数计算闲置计费性能的公布,帮忙用户进一步升高应用预留实例的老本,能够让用户只为实在应用的预留资源付费。作者 | 阿里云 Serverless 高级开发工程师 萧起 据说你也做过这样的技术选型小王是一名程序员,公司的利用是跑在自建机房的服务器上,所有的底层服务和运维都须要本人亲自下手来做,每次降级、机器扩容都带来比拟大的运维压力,同时为了能及时扩容堆了不少闲置的机器,机器老本始终比拟高。最近公司新开发了两个利用零碎,小王在做技术选型,打算拥抱云计算,把新利用部署在云上,设计一套高弹性、低成本、运维简略,能轻松应答业务突发流量上涨的架构计划,让本人能够把更多精力投入到业务开发中,加重本人的运维累赘。 这两个利用有几个独特的特点: 两个利用都属于在线利用,对调用提早、服务稳定性有比拟高的要求利用流量随业务变动比拟大,而且很难提前预估业务量会上涨多少,对弹性有比拟高的要求。有显著的业务低峰期,低峰期调用量比拟低,预计低峰期次要集中于早晨。利用启动工夫长:一个是 Java SpringBoot 的订单零碎,一个是基于大规格镜像的 AI 图片识别系统,启动工夫将近1分钟。小王的需要总结起来有三个: 一是心愿在运维上省事省心,交付 jar 包或者镜像后,只需简略的配置利用就能运行起来,不必专门破费精力搞运维、监控、告警。二是弹性能力要好,业务流量上涨时,能够主动地及时扩容,流量降落后,再主动缩容。三是通过应用云计算,进步资源利用率,在老本上更有劣势。上面就拆开看小王是如何一步一步进行技术选型的。 服务高度集成,免运维,高弹性在做技术选型时,小王思考过三种技术架构:SLB+云服务器+弹性伸缩的传统架构、K8s 架构、函数计算 (FC )架构。 传统架构须要本人搞 SLB 负载平衡;配置弹性伸缩服务,一直调试找到适合的伸缩策略;还要本人采集日志来创立告警和监控大盘。这一套下来运维和部署老本其实不是很低,有没有更省事的计划呢? 小王进一步调研了 K8s 架构,k8s 的 Services 与 Ingress 规定能够治理到应用层的拜访,这样就不必本人搞SLB负载平衡了,同时应用HPA来依据利用水位来程度伸缩。这样看似很不错,但真正测试时发现,HPA的伸缩是分钟级别的,缩容慢一点倒是问题不大,但流量上涨快的时候,扩容总是延后几分钟,会导致局部申请延时增高或失败,影响了服务可用性。如果把扩容的指标阈值调低些,倒是可能解决这个问题,但同时升高了资源利用率,老本上涨了不少。另外还须要本人搞日志采集、告警和监控大盘,运维老本也有不少。而且小王之前没有接触过k8s,k8s繁多的各种概念了解起来着实也有不少的老本。 基于FC的架构可能很好的解决下面几个问题。首先,FC 反对预留模式和基于实例指标的主动伸缩能力,这种模式下可能做到更灵活和疾速的扩缩容能力,并保障在扩缩容期间申请延时放弃安稳;其次,FC高 度集成了泛滥开箱即用的性能,体验丝滑又省心,如:提供http触发器,省去对接网关、SLB的工作;控制台提供残缺的可观测能力,轻松查看申请、实例状态和运行日志。最初,FC只须要为调用和调用时应用的沉闷资源付费,无调用时不产生费用,可能充沛进步资源利用率,减低老本。 上面咱们来具体介绍下预留模式的应用,以及如何通过闲置计费来升高预留的应用老本。 预留模式,完满解决冷启动FC反对按量和预留两种应用模式,按量模式是通过申请主动触发实例的创立和扩缩容,在调用量减少时创立实例,在申请缩小后销毁实例。按量模式充沛进步了资源利用率,但对于小王这种启动工夫比拟长的利用,按量模式创立实例时会有显著的冷启动景象。为了解决这种冷启动问题,FC提供了预留的应用模式。用户配置预留后,FC会创立指定数量的预留实例常驻于零碎中,直到用户更新预留配置将其开释。当有申请时,会优先调度上预留实例上,预留实例用满后,新申请会触发按量实例的创立。同时为了使预留实例量更好地贴合业务曲线,还提供了预留定时伸缩和按指标伸缩能力,来进步预留实例的利用率。点击这里查看更多详情。 通过这样的形式,即解决了利用冷启动工夫长的问题,又保障了预留实例维持在比拟高的利用率程度。即便偶然有比拟大的流量稳定,也能够长期扩容出按量实例来响应申请,尽量保障流量疾速上涨状况下服务的品质。 闲置计费,降本大杀器在实在的应用场景中,为了保障利用申请的低延时,即便在没有申请时,也要放弃肯定数量的预留实例,这就造成了老本的回升。有没有方法既做到低延时,又做到低成本呢?函数计算为了帮忙用户升高这种场景下的应用老本,推出了预留实例的闲置计费性能,上面咱们来具体理解下这个性能。 闲置计费依据预留实例是否在解决申请,咱们将实例辨别为闲置、沉闷两种状态,并为两种状态别离设置了计费单价。沉闷计费单价与原有的资源应用单价保持一致,闲置计费单价是沉闷计费单价的20%,开启闲置计费后可能帮忙您节俭大量的老本。 默认状况下,闲置计费性能处于敞开状态,此时预留模式的实例无论是否正在解决申请,FC都会为其调配CPU,并让实例始终处于沉闷状态,以保障实例在无申请时仍然能够失常运行后台任务。开启闲置计费性能后,当预留模式的实例无申请时,FC会将实例上的CPU解冻,使该实例进入闲置状态。 通过减少闲置计费,对于预留实例也做到了只为真正应用的CPU资源付费。当预留实例处于闲置时,只需领取20%的费用,就能应答实例冷启动的问题。这将帮忙用户明显降低预留实例的应用老本,同时用户也能够更少的关怀预留实例的利用率问题,放心大胆的应用预留实例。 咱们以上图为例,假如预留实例的利用率为60%,原有的应用老本为1。应用闲置计费后费用为60% * 1 + 40% * 20% *1 = 0.68,可能带来32%的费用降落。 配置形式能够通过控制台和SDK两种形式进行预留实例和闲置计费的配置。 登录函数计算控制台,在首页->弹性治理页面抉择创立规定,即可进行『闲置计费』的配置。同时能够应用SDK进行配置,反对Java、Go、Node.js等多种语言,详情能够参考API在线调试。 开启闲置计费后,能够在费用核心-账单详情-明细账单中查到弹性实例和性能实例的闲置资源应用费用(计费账单个别延时3~6小时产出)。 结语函数计算(FC)始终致力于为用户提供高弹性、免运维、低成本的全托管计算服务。本次闲置计费性能的公布,可能帮忙用户进一步升高应用预留实例的老本,让用户只为实在应用的预留资源付费。函数计算会逐渐开释更多serverless 的技术红利,在性能、老本、体验上一直为用户提供更极致的体现。 文档链接: 弹性治理:https://help.aliyun.com/document\_detail/185038.html 计费概述:https://help.aliyun.com/document\_detail/54301.html 版权申明:本文内容由阿里云实名注册用户自发奉献,版权归原作者所有,阿里云开发者社区不领有其著作权,亦不承当相应法律责任。具体规定请查看《阿里云开发者社区用户服务协定》和《阿里云开发者社区知识产权爱护指引》。如果您发现本社区中有涉嫌剽窃的内容,填写侵权投诉表单进行举报,一经查实,本社区将立即删除涉嫌侵权内容。

May 7, 2022 · 1 min · jiezi

关于运维:智能运维-VS-传统运维|AIOps服务管理解决方案全面梳理

云智慧 AIOps 社区是由云智慧发动,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交换社区。该社区致力于流传 AIOps 技术,旨在与各行业客户、用户、研究者和开发者们独特解决智能运维行业技术难题,推动 AIOps 技术在企业中落地,建设衰弱共赢的AIOps 开发者生态。运维服务治理的问题与挑战数字化转型背景下的IT运维随着业务的不断创新倒退,麻利开发、容器化、云计算等新技术的利用越来越多,与此同时,业务零碎架构也变得越来越简单,传统运维工作将会面临更多、更大的挑战。因而,确保 IT 零碎的继续衰弱是保障用户体验和业务倒退的根底。在上述背景下,云智慧将运维存在的挑战分为人员、流程、技术三个维度: 人员方面:现阶段,IT运维人员总是被动发展工作且重复性操作较多,在面对数百上千设施以及疾速迭代的技术栈时,因不足标准化的治理,使得更加宏大的业务零碎难以应答;流程方面:IT运维类的管理制度标准化水平有余;运维人员工作负荷也难以量化体现且不足认同感。技术方面:在面对宏大的设施和零碎数量时,企业短少自动化技术手段进行治理,导致企业对业务零碎的可用性预警有余,运维工作被动。 IT运维中面临的现状与痛点基于上述对运维背景及挑战剖析,云智慧将企业 IT 运维典型问题演绎总结为以下几个方面: 流程与制度不欠缺,存在沟通灰度;“建转运”过程不标准,效率低,运维工作量化能力弱,无奈造成考核根据;不足运维常识积淀;不足 AI 技术在运维服务治理中的利用。 新一代IT服务治理是业务与技术倒退的必然在上述的挑战下,运维服务治理的实践和工具都有了新的变动。ITIL 4 引入了服务价值体系的概念,它能够为组织提供一个弱小的、对立的、以价值为核心的方向。随着企业数字化的转型和倒退, IT 服务共享核心正在成为企业 IT 的重要服务支点,如何在工具中体现对共享服务型组织的撑持,成为了新一代ITSM 的重要方向。 在往年的 ITSM 工具要害能力报告中, Gartner提到了一个重要的能力-AITSM,即人工智能在 ITSM 中的利用,例如基于人工智能的虚构助理机器人,为用户提供对话式自助IT服务;联合知识库实现主动解决方案举荐;基于深度学习的相似工单等利用场景。以上均为新一代 ITSM 的技术倒退和利用。 此外,ITIL 4 在新时代客户体验、价值流和数字化转型的背景下,从新提炼了更多的 ITSM 实际,也采纳了新的工作办法(如精益、麻利以及DevOps),也促使 ITIL 跟上了新时代。云智慧在实践和前沿技术的指引下,推出了云智慧数字化服务治理解决方案。 解决方案IT服务管理体系—夯实组织信息化建设根底数字化运维的残缺场景为当业务用户方提出服务需要时,IT运维组织则会通过各种治理流程和流动来提供服务促成价值共创。 一个企业信息系统价值的实现,30%在于建设,70%在运维,稳固运行能力施展业务价值。 数字化运维服务治理的外围价值在于标准化、规范化、精细化治理。 从业务用户角度登程,便捷地申请服务申请、申报故障以及提出新需要是他们关注的重点。与此同时,问题解决过程疾速,过程可视化,对于业务用户来说也是良好的服务体验。以上过程的实现背地则需依赖于迷信的治理流程和运维组织撑持。 从IT运维组织角度登程,规范化、可量化IT服务则是重中之重。因而,运维治理则须要提供服务目录以及考核运维流程指标。此外,配置管理也是整个运维场景中的外围因素,它会为其余流程提供配置项信息数据,反对其余流程运行。例如,在变更治理流程中,配置管理能够提供变更影响剖析,帮忙评估变更危险和招集变更评审人员;同时,配置管理也为运行综合剖析和自动化作业、容量治理等场景提供根底数据。 分层设计的产品架构,不断改进优化产品基于上述的理论知识和用户实际场景,云智慧研发了数字化运维管理系统(DOSM)和CMDB两款产品,从产品维度云智慧将其分为了两个产品线,在理论落地的应用场景中,这两者亦是松耦合关系。 下图架构图从零碎技术实现的维度来介绍数字化运维平台的产品能力和功能模块。云智慧将产品所要实现的具象性能,形象为一个个彼此独立又互为关联的模块,并将这些模块依据业务及数据逻辑进行分层组合。 零碎设置层:提供了通用性的零碎本身治理能力,包含对立用户核心和日志审计,接口能力等;能力引擎层:是DOSM的外围能力层,为整个产品的流程、表单、音讯告诉、搜寻、内容聚合打下基础;业务设置层:是一些业务性能的配置和实现的能力,如运维治理流程的配置,以及一些通用业务,如例行工作、值班等;功能模块层:数字化运维服务治理性能落地,提供规范流程和表单模板,日常运维小工具等;对立门户层:提供了个性化的内容聚合、大屏数据展现、报表报告剖析等性能。下图右侧是与云智慧本身产品或第三方产品的集成能力,包含ChatOps机器人、自动化产品、监控工具、门户、告警核心、挪动平台等。 专业化、标准化的IT共享服务中心,降本增效IT 共享服务中心是 IT 服务治理的一个重要场景,也是IT集约化倒退的一个体现。现如今很多大型企业组织都在将 IT 独立进来,促使其从老本核心走向利润核心,共享核心不再仅仅为一个特定的业务服务,而开始思考服务老本。以上则必须先通过标准化服务来晋升服务质量和效率,升高服务老本。从整个企业组织层面来看,IT共享服务中心能够防止反复建设 IT 服务治理平台和人员投入。对内,对立治理基础架构和资源能够无效地撑持组织业务运行; 对外,提供标准化的服务能力和流程共享(如资源申请,账号开明,业务报障等)能够实现IT服务端到端的价值交付,从而晋升数字化体验,以及赋能业务倒退。 内置最佳实际,疾速帮忙企业规范化IT服务治理云智慧数字化运维服务治理产品,基于ITIL 4最佳实际,内置了多个ITIL规范治理流程,包含事件、问题、变更等多个罕用流程,从而升高了用户配置难度,让用户可能疾速上手实际。此外,产品还反对本地化公有部署和SaaS购买模式,本地化部署当初已齐全反对容器化部署,具备了更便捷的部署和服务扩大模式。 以上ITIL中的罕用流程均能够在云智慧数字化运维服务平台中开箱即用,以此帮忙企业组织高效解决、标准运维过程。上面为几类高频运维场景实例: 服务申请:次要是对外提供标准化服务,像申请虚拟机、邮箱扩容、域账号重置等,标准化的服务申请能够让A和B用户同样的服务体验;事件治理:指标是疾速复原业务,第一工夫解决故障,尽量减少业务中断工夫;问题治理:次要指标是查找根因,找出解决方案。流程次要是通过重现故障,考察剖析,找到解决方案;变更治理:变更是运维中的常见场景,变更是为了解决故障,晋升可用性。该流程次要是做变更危险评估,变更计划评审,业务验证等一系列流程动作。 多渠道的提单入口,晋升用户报单体验对于终端用户来说,零碎的易用性是可能推广进来被宽泛应用的根底。云智慧数字化运维服务治理平台提供了多渠道服务入。云智慧 DOSM 采纳了 H5 技术,实现了所有挪动终端和利用统一的用户体验。此外,在挪动端云智慧能够反对:企业微信、钉钉、飞书;不便用户随时提交工单同时也不便运维人员可能挪动解决和审批工单流动。在PC及Web页面,云智慧 DOSM 领有云小慧机器人; 同时,云智慧 DOSM 还反对与监控零碎、告警核心以及第三方零碎的集成,从而实现了主动生成工单的性能。 ...

May 6, 2022 · 1 min · jiezi

关于运维:开源GitOps产业联盟会员行-走进秒云

秒云简介MiaoYun秒云(成都元来云志科技有限公司)于2019年成立, 是国内首家专一于云原生智能运维的公司,总部位于成都,在西安、上海、北京、南京别离设有研发核心和营销中心。秒云产品定位于云原生一体化智能管运平台,最大化升高企业在云原生环境上的运维投入,让企业可能更专一于本身利用的开发和交付。 秒云一体化的解决了云原生环境设备适配、多集群、多云等问题,让企业各分支环境也能够轻松对立运维!在K8s生态成为企业云原生零碎常态化的时代,帮忙企业对立治理、智能运维、疾速构建扩散的云原生零碎环境,晋升多个云原生对立管理性、易用性和可观测性。 秒云针对中国企业进行了深度定制,全面适配信创体系,反对规范x86(Intel/AMD)以及国产芯片 “一云七芯”的混合部署场景。自成立以来,凭借过硬的产品实力,已胜利利用于电力、运营商、教育、金融、工业制作、政府、公安等多个行业标杆企业。 秒云客户墙(局部) 产品介绍秒云自主研发的秒云 云原生智能运维中台,内置云原生容器治理底座,针对云原生利用进行构建、编排、部署、观测、治理等全生命周期交付治理,疾速、平安、牢靠的落地云原生利用。 一键即可部署及纳管Kubernetes,按需“插拔”的近 30+扩大性能组件,分钟级构建,通过算法中台、数据中台、可视化中台、利用中台、治理中台,零代码轻松定制各种运维场景,蕴含数据分析模型、图表、告警、全景视图、界面菜单……都可通过全图形化形式零代码按需定制,让运维人员具象化、清晰地看到以后零碎的状态,从而升高教训门槛和不确定性。 秒云让传统企业具备互联网公司一样的能力,人人都能轻松成为云原生运维高手,零根底也能轻松治理云原生平台,让运维和研发可能更专一于交付和治理企业本身利用。 秒云一站式解决了企业云原生时代双态环境下的治理和运维难题,让每个企业轻松运维治理本人的云原生环境。秒云帮忙企业对立治理、智能运维、疾速构建云原生平台,升高企业在云原生时代人力、财力的老本投入。秒云可作为ISV的云原生操作系统,与其本身软件联合。不便ISV产品迭代开发、交付部署及前期运维降级;利用多渠道轻松造成裂变销售,多种单干模式已落地验证;零代码构建场景化智能运维利用,零碎“亚健康”基线评估,防止运维人员教训依赖,升高教训造就工夫。一云多芯,秒云满足信创国产化要求,已通过工信部一所金融信创容器云平台测试。公司资质秒云凭借过硬的技术实力和当先的产品劣势,成立仅两年工夫即被认定为四川省高新技术企业,荣获“双软企业”认证,并通过了ISO9001品质管理体系认证。秒云全面适配信创体系,反对规范x86(Intel/AMD)以及国产芯片 “一云七芯”的混合部署场景。先后成为四川信创联盟会员单位、信息技术利用翻新工作委员会成员、申威产业联盟成员。 秒云秉持着“一秒入云,一键智维”的理念,继续深耕云原生赛道,长期退出Linux基金会会员和CNCF云原生基金会会员;秒云在云原生畛域的技术积也累失去了业界生态的认可,21年和22年别离入选VIN威睿减速打算第二期和阿里云首期云原生加速器。 与OGA联盟、GitOps 的结合点秒云云原生智能运维中台作为云原生一体化管运平台,笼罩了企业在云原生转型过程中业务利用所需的构建、测试、部署、监控等一体化治理和智能化运维的需要,并齐全遵循GitOps继续交付模式。 退出后与OGA联盟一起做什么退出 OGA 联盟后,秒云将积极参与GitOps相干规范制订及技术布道流动,基于秒云专一在云原生智能运维场景下“对立治理、疾速构建、智能运维”的理念和劣势,与OGA联盟一起推广GitOps技术落地、反对GitOps产业化倒退;同时借助OGA的品牌效应和市场影响力,与OGA一起联结联盟内的各畛域生态会员,构建残缺的技术生态,实现产品、计划、品牌、市场的共赢。

May 6, 2022 · 1 min · jiezi

关于运维:告警风暴来袭智能运维应如何化解

云智慧 AIOps 社区是由云智慧发动,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交换社区。该社区致力于流传 AIOps 技术,旨在与各行业客户、用户、研究者和开发者们独特解决智能运维行业技术难题,推动 AIOps 技术在企业中落地,建设衰弱共赢的AIOps 开发者生态。本期咱们有幸邀请到了英国巴斯大学硕士生、 云智慧智能研究院 算法研究员卢同学作为主讲人,为咱们带来《AIOps 中告警治理办法定义》的分享,上面就让咱们一起来学习吧~ 引言随着大数据与AI技术的倒退,运维人员在工作中取得了许多高效算法的帮助,能够多角度疾速梳理海量的信息,放慢定位故障的速度。其中,告警音讯作为运维人员理解零碎运行状况的重要途径,是一种常见的信息起源。通常状况下,一套零碎会装备不同的监控核心,它们时时刻刻检测零碎的运行状况,并在某个服务器呈现故障时,收回对应的告警音讯。运维人员通过剖析这些告警音讯能及时精确的定位故障。基于这一利用场景,本文将从告警音讯的个性与挑战登程,介绍智能化告警算法如何在这个过程中发挥作用。 告警治理面临的挑战告警治理作为运维过程的重要阶段,面临着许多挑战。比方,传统运维场景中的一大难题—如何无效的解决告警风暴。告警风暴是指零碎在短 工夫 内收回海量告警音讯的景象,这通常是因为零碎呈现了某种故障,导致产生的告警音讯数远超运维人员所能解决的最大极限。如何对其进行正当的剖析也就成为了运维过程的一大难点。除了上述的例子之外,告警治理中还面临着各式各样的挑战,这些挑战的根本原因可演绎为以下几种: 告警信息多种多样,短少对立模板规范。 市面上的告警检测零碎是由多家厂商基于不同的规范与技术研发的,然而告警音讯应蕴含哪些信息?不同故障的告警形容应蕴含哪些内容?这些至今都没有对立的模版规范。导致许多重要的故障信息往往被暗藏在告警形容的海量文字中。同时,不同的监控零碎中信息并不能无效会集在一起,也使得故障信息比拟扩散,加大了运维人员剖析故障的难度。告警信息起源混淆,解决办法存在差别。 大部分告警检测零碎收集多种起源的信息,但不同设施与网络应用之间的告警解决办法也有显著差别,理论工作中对应负责的运维人员也不同,这种信息混淆也减少了告警分派解决的难度。告警触发条件不同,故障告诉精准度低。 通常状况下,监控零碎会设立不同的告警触发条件,即告警音讯的产生并不一定代表零碎曾经呈现故障,也可能是对故障的预警。只管这种预警机制有其存在的必要性,但不合理的告警触发条件很容易令零碎产生大量的无用信息,并频繁告诉运维人员,消耗人力物力。告警起因不明确,故障剖析难度大。 绝大部分告警音讯只有经验故障的设施名称、产生工夫、故障景象等数据,并没有产生故障根本原因的明确阐明,甚至可能暗藏在告警风暴中,这进一步加剧了剖析故障的难度,须要采纳多种办法无效梳理告警。总而言之,不齐备与多类别混淆的海量告警信息显著减少了运维人员的工作量,重大影响了故障定位及修复过程。如何利用智能化算法解决这些问题?该从什么角度抉择智能化算法?成为以后告警治理亟待解决的问题。 告警的根本个性咱们通过从数据的角度剖析告警的根本个性,以抉择失当的办法别离解决这些问题。通过剖析,告警次要具备以下三种根本个性: 相似性不同的告警信息之间可能存在肯定的相似性,这种相似性一方面可能体现在文本形容中,即来自于同一零碎的告警音讯往往遵循几个特定的模板格局,这使得同一模板下的不同告警信息可能存在肯定的文本相似性。另一方面也可能体现在所蕴含的信息中,比方某些告警信息可能都在形容某个特定程序或机器的运行状况,这些不同告警之间也存在肯定的信息相似性。基于这种相似性,咱们能够将海量的告警音讯合并为多个汇合,再别离解决。 相关性在相似性的根底上,不同模板或所含信息不同的告警之间也可能存在肯定关联。比方,假如多个应用程序均应用同一个数据库的数据,这些不同用处的利用又对应多个监控零碎。当数据库解体时,导致利用也呈现故障,令对应的监控零碎收回告警。这些告警尽管起源不同并遵循多个模板,但因应用同个数据库的数据导致文本和所含信息可能并不具备相似性,却又都属于利用场景下的告警,具备肯定的相关性。基于这种相关性,咱们能够将不同的告警音讯关联为多个汇合,再进一步剖析。 因果性从内部察看告警可能会给人一种印象:一个告警会引起另一个告警。然而,这种印象真的正确吗? 正如上文中所举的例子,假设数据库故障导致了应用层的故障,在数据库收回告警后,应用层也会收回多个告警。这些告警是显然存在因果性的,即数据库告警导致利用告警。但理论状况下,对因果性的剖析可能并不这么简略。 这次要是因为告警音讯往往只是对故障景象的形容,多个不同故障起因产生的故障景象可能没有区别,所以监控零碎收回的告警音讯也没有区别。比方,当数据库收回告警时,应用层也收回无奈应用的告警。然而,通过运维人员排查,实际上是因为网络连接不畅导致应用层无奈应用。同时,在这段 工夫 内利用并没有拜访数据库,即数据库的故障并没有传递到应用层。这种状况下,只管应用层和数据库的告警音讯看上去存在因果性,但并不合理,因为应用层的故障与数据库的故障之间没有因果关系。 通过以上两个例子能够看出,告警并不具备相对的因果性,这种因果关系并非存在于告警之间,而是在故障之间,须要通过根因剖析的梳理,能力确定这种因果关系是否正确。 智能算法下的告警管理体系数据起源作为连贯运维人员与故障的重要桥梁,现实的告警应蕴含足够多的信息。这些信息使咱们可能采纳多样化算法,帮忙运维人员从多角度梳理告警音讯,令他们在短时间内排除故障,缩小因故障带来的损失。然而理论状况下,监控零碎收回的大多数告警并不能满足信息量短缺的需要。因而,针对现实的告警音讯和必要的告警音讯,咱们别离提出了如下定义: 现实的告警信息: 蕴含括标识、名称、工夫、起源、级别、摘要、形容、持续时间、服务器、IP地址、告警生命周期、告警分派记录、负责的运维人员等等。必要的告警信息: 至多蕴含告警产生的工夫、设施名称、告警形容、告警级别、告警起源等,应尽量满足现实告警信息中的字段需要,当须要相似准确度的评估指标时,须要提供告警修复记录与运维工单等信息。须要留神的是,告警治理中所须要的数据并不局限于告警信息自身,也须要日志、指标、调用链和拓扑关系、工单等数据帮助进行告警治理, 这些数据的具体解释如下所示: 指标(Metrics): 是服务治理中的另一种要害数据类型,以固定的工夫距离(例如每分钟)间断收集指标,比方CPU的容量状况,可用于评估告警严重性。调用链和拓扑关系(Tracing and CMDB ): 服务器、应用程序等须要运维监控设施的拓扑架构图,比方网络结构图,可用于基于上下文的告警合并办法。日志(log): 设施或程序运行时产生的数据,蕴含了日期、工夫、使用者及动作等相干操作的形容,可用于告警定级、事件形象等状况。工单(Ticket): 工单通常是由告警或故障创立的,当运维人员在解决告警信息的过程中,发现须要进行深入分析的告警时,会创立对应的告警工单,典型的工单比方告警修复记录与故障报告,可用于判断告警关联准确性,也可用于评估告警严重性。三个阶段通过对告警数据根本个性的剖析,咱们能够理解到告警治理的重要性。依据告警信息的相似性和相关性生成告警事件,能够为运维人员提供更简洁的告警信息视图,帮忙他们更精确、疾速地辨认故障源,也能够将生成的告警事件作为智能根因剖析的重要依据。 因而,联合告警管理所面临的诸多挑战,咱们能够提出以下论断: 告警治理: 合并肯定工夫范畴内的告警信息为多个具备高度相似性的告警汇合,再将告警汇合关联为多个繁多概念的事件。重有代表性的告警事件化,使运维人员可能疾速取得告警事件的相干信息。 基于这一定义,告警管理体系一共分为三个阶段,告警富集、告警合并以及告警关联。 告警富集: 对于大部分算法来说,数据量的多少与数据所含信息的多少,都将在很大水平上影响后果的优劣。因而,在采纳更智能化的算法之前,须要收集更多相干信息以辅助后续的工作。定义: 告警富集分为信息收集和特色抽取两局部。信息收集是从其余数据源取得告警信息以外的其余数据,比方日志数据、指标数据、调用链和拓扑关系等。特色抽取是采纳告警解析与主题抽取等办法,从告警形容中获取告警类型、IP 地址、告警起因等具体告警信息。告警合并: 告警合并是由告警音讯生成警报的过程,每个警报只对应零碎中的一个故障,每个故障也只对应一个警报。定义: 将肯定工夫窗口内的雷同起源,类似模式的海量告警信息数据,依照规定聚类,或分类等办法,合并为多个外部特色较统一的告警信息汇合,也称之为警报(alert)并进行形象。警报形象: 警报形象次要指为了凸显警报相干信息,或便于运维人员诊断故障而进行的一些后处理工作,比方警报再定级便是综合思考零碎以后衰弱状态,及告警音讯散布状况后对警报优先级的评定。告警关联: 告警关联是由警报生成事件的过程,事件中所有警报都蕴含同一个问题的相干信息,事件内警报之间的相干关系该当可能被事件阅览者疾速发现,并且即便不具备运维专业知识的人士也可能解释其中的关联点。定义: 综合警报的工夫、空间和语意相关性,依据关联场景,将肯定工夫窗口内的多个警报关联为形容以后场景特定问题的汇合,每个汇合称为一个事件,并对其进行形象。对“场景”的解释: 此处的场景能够是基于语意的场景,比方模式统一的警报或类别统一的警报;也能够是基于数据分布的场景,比方常常共现的警报;也能够是基于空间的场景,比方存在肯定天文关系的警报,或存在肯定拓扑关系的警报。对事件形象的解释: 在关联实现后,咱们也能够依据事件内蕴含的警报信息从新确定事件的优先级,并为事件形容的问题提供一段简略的摘要,这些解决办法都可能帮忙运维人员在短时间内更疾速地理解重要事件。 细节形容在本节中,将针对告警管理体系中的不同阶段给出更具体的阐明。 告警富集办法:信息收集: 信息收集是指从内部获取信息,能够依照产生工夫,将雷同时间段内的指标,日志与调用链数据与告警进行关联。特征提取: 从告警信息外部提取特色的办法有很多,比方正则化与命名实体辨认。其中比较简单是正则化办法,即事后人为设定一些匹配规定,当文本中的信息满足匹配要求时,对应的信息会被取出。告警合并办法:文本类似度合并: 这种办法基于不同告警音讯所含的告警形容等文本信息进行分类,将语句类似的告警信息进行合并,并在肯定水平上联合已有规定生成警报。3.告警关联办法: 语义关联: 比拟典型的关联办法是基于警报类型的的关联办法,则侧重于对同一类型的警报进行关联,类型能够分为零碎告警事件、利用告警事件、数据库告警事件、网络告警事件、其余事件等。空间场景关联: 次要指基于警报的host起源/服务器拓扑关系等数据进行关联,将同一个host的警报放入一个事件内,以不便运维人员查看。或者将所有业务类的警报关联为一个事件,不便负责业务层的运维人员解决与本身相干的警报。数据分布关联: 典型的例子是将警报依照工夫散布进行关联,将常常一起呈现的警报关联为一个事件,这种办法能够无效解决分批次网络入侵中产生的警报音讯。评估指标降噪比长期以来,如何评估告警治理的成果都依赖于降噪比,但因为告警问题始终都没有明确的定义,对于什么是降噪比?不同的人有不同的解答。基于本文的定义,咱们提出了如下评估指标: 合并压缩比(Merge Compression ratio): 在告警合并阶段,能够通过合并压缩比过进行评估,即合并且通过解决后的警报总数与告警信息总数的比值。关联压缩比(Correlation Compression ratio): 在告警关联阶段,能够通过关联压缩比进行评估,即关联后的事件总数与警报总数的比值。降噪比(Noise Reduction Ratio): 对于告警管理体系整体,能够通过降噪比进行评估,即告警剖析过程中的合并压缩比乘关联压缩比。准确性除了降噪比之外,准确度也是一个重要的评判规范,告警治理产生的事件是否为客户所冀望的? ...

May 6, 2022 · 1 min · jiezi

关于运维:Tech-Talk-云技术有话聊-高业务负载虚拟机热迁移如何做到平滑

4月29日,服气云研发技术专家Frank.Lee在服气云《Tech Talk · 云技术有话聊》系列直播课上进行了《高业务负载虚拟机热迁徙的挑战和优化实际》的分享,具体介绍了原生QEMU在高业务负载虚拟机热迁徙场景里面临的挑战、导致高业务负载虚拟机热迁徙艰难的起因、服气云的优化实践经验分享等内容。以下是他分享的内容摘要,想要理解更多能够关注“深服气科技”公众号回顾本期直播。  一、虚拟机热迁徙技术介绍 热迁徙是指把虚拟机从一个物理主机(源主机)迁徙到另一个物理主机(目标主机),分为:只迁徙虚拟机运行地位的同存储热迁徙、同时迁徙虚拟机运行地位和存储地位的跨存储热迁徙。在热迁徙过程中,虚拟机业务不会中断,最初的停机迁徙阶段,虚构机会有短暂的进展,热迁徙实现后,虚构机会在目标主机上持续运行。 随着越来越多的用户将外围业务部署到云平台,用户对业务的停机工夫要求越来越高,甚至提出了零停机的能力要求。尤其是在物理主机保护、云平台热降级、云平台调度集群内虚拟机运行地位等场景中,虚拟机热迁徙操作的性能影响、迁徙后果、资源耗费、迁徙时长都会影响云平台的应用体验。 二、挑战和优化实际 挑战1:算法效率低下 原生QEMU热迁徙内存数据应用的压缩算法是zlib,它单核的压缩性能低,QEMU压缩线程的CPU耗费高。这些会导致:性能无奈满足高负载场景,在带宽受限场景下可能无奈热迁徙实现,会重大耗费物理主机的CPU资源,导致物理主机其它业务零碎性能降落。 服气云提出了QEMU热迁徙压缩算法替换为lz4的优化实际办法,这使得速率晋升7倍以上,CPU耗费升高80%。 挑战2:脏数据放大 QEMU在迁徙磁盘数据时,会通过BITMAP来记录磁盘脏数据块,原生QEMU的磁盘BITMAP对应数据块的粒度大小是1M,假如某个数据块中有4K数据产生批改,BITMAP也会将整个数据块(1M大小)标记为脏,后续就须要迁徙这1M的数据,由此带来了磁盘脏数据放大问题。 针对这个挑战,服气云实现了磁盘热迁徙BITMAP数据块粒度动静调整机制,将BITMAP数据块粒度做成迁徙前动静可配置,BITMAP数据块粒度默认值从1M改为64K。 挑战3:CPU空耗 原生QEMU进行跨存储热迁徙,在增量迭代迁徙阶段,热迁徙流程会遍历磁盘每个数据块,检测其状态是否为脏;在磁盘热迁徙进入到增量迭代的最初阶段,如果磁盘数据块总量比拟多,而残余脏数据块量比拟少时,热迁徙线程的CPU大量耗费在洁净数据块的有效遍历。在Oracle场景的实测后果,这里会导致60%以上的CPU额定耗费。 服气云改良了磁盘脏数据块的检索机制, 对磁盘脏数据块保护一个多级检索位图;磁盘热迁徙时,对脏数据块的检测形式,由遍历检测改为间接对脏数据块进行多级检索,可能更高效地定位脏数据块地位。最终实现了跨存储热迁徙总耗时降落20%,热迁徙线程的CPU耗费降落60%。 挑战4:业务性能受影响工夫较长 进入到增量迭代迁徙阶段后,如果内存脏数据的生成速率大于迁徙速率时,迁徙就永远无奈实现。原生QEMU通过CPU节流策略来解决此问题,原生QEMU热迁徙的CPU节流策略较为激进和板滞,在高业务负载场景下,CPU节流持续时间长,导致业务性能继续受到影响。 服气云实现了一套新的CPU节流策略,在热迁徙过程中引入间接节流和阶段式节流两种节流形式,替换QEMU默认的节流策略,大幅缩短切换downtime工夫,大概在2s内。 挑战5:热点内存的反复有效迁徙 当初的业务零碎在架构设计方面大多都遵循内存局部性原理,内存局部性原理分为:工夫局部性和空间局部性。依据内存局部性原理,虚拟机业务在运行过程中,会存在大量的热点内存,在短时间内被频繁地拜访和批改。虚拟机热迁徙进入到增量迭代迁徙阶段时,热点内存因为频繁批改,在每轮迭代都会变脏而反复迁徙。这会导致网络带宽和CPU资源的节约,以及热迁徙工夫变长。 服气云实现了一套热点内存脏数据提早迁徙机制——热点内存脏数据提早迁徙机制,缩小反复内存数据传输,耗时缩短30%,内存数据量升高35%。   三、优化实际成果总结 同存储热迁徙场景 (1)跑满万兆带宽,QEMU压缩线程的CPU耗费缩小80%; (2)热迁徙耗时缩小30%; (3)迁徙内存总量缩小35%; (4)Oracle虚拟机业务性能受影响工夫管制在6s以内。   跨存储热迁徙场景 (1)Oracle数据库场景(8K随机写IO模型),磁盘脏数据放大率从93降落到8,大幅升高了磁盘脏数据传输量; (2)QEMU热迁徙线程的CPU开销缩小60%; (3)跨存储热迁徙总耗时缩小20%; (4)Oracle虚拟机磁盘迁徙能力晋升10倍。 实践证明,深服气超交融承载的Oracle业务在迁徙过程中性能仅抖动了6s,其中业务中断工夫仅1s,下层业务可取得近乎0中断的平滑迁徙体验。 以上就是本次直播的次要内容。对云计算感兴趣的IT敌人能够关注“深服气科技”公众号回顾本期直播,理解更多云计算常识。

May 5, 2022 · 1 min · jiezi

关于运维:智能运维AIOps实践|日志语义异常检测全面解读

云智慧 AIOps 社区是由云智慧发动,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交换社区。该社区致力于流传 AIOps 技术,旨在与各行业客户、用户、研究者和开发者们独特解决智能运维行业技术难题,推动 AIOps 技术在企业中落地,建设衰弱共赢的AIOps 开发者生态。云智慧智能研究院着眼于运维人员在日志剖析方面所面临的问题与理论需要,以日志语义异样检测为切入点,进行了相干的剖析与试验。对在智能运维中如何进行日志剖析,给出了基于日志语义异样检测的答案。 一、背景日志在IT运维中扮演着重要角色。日志记录了软件系统运行时的详细信息,蕴含着丰盛的零碎信息。 零碎开发人员与运维人员能够依据日志监控零碎分析零碎的异样行为与谬误。因而,如何进行日志的异样检测也成为智能运维畛域亟待解决的问题,日志异样检测能够分为语义异样(执行后果)、执行异样(执行日志序列)与性能异样(执行 工夫 ) 。本文针对日志语义异样检测进行了剖析与试验。 二、问题与挑战日志异样类型日志记录着零碎在某个 工夫 点执行了某些操作以及相应操作的后果。 因而,当某些谬误产生导致系统异样时,日志中也会有相应异样记录。日志中记录的异样信息能够帮忙零碎开发人员与运维人员监控零碎,并分析零碎的异样和谬误,从而疾速定位异样、修复异样,以保护零碎的稳定性。因而,如何主动判断谬误日志中蕴含的异样类型成为亟待解决的问题。 实际上,尽管IT零碎/服务出现异常的场景泛滥、状况简单,然而依然能够对异样类型进行大抵分类,如网络异样、数据库异样、硬件异样、I/O异样、操作系统异样等。 每一个类型又能够进行细分,以硬件异样为例,可能存在CPU异样、磁盘空间有余、磁盘损坏等硬件上的异样。因而,主动判断日志异样类型的前提在于,制订对立的日志异样类型阐明规范、各类别中的细分类与特色,并标注一批规范的数据集进行学习。 日志与自然语言文本的区别与其余NLP工作相似,基于语义异样的日志分析方法须要首先对日志进行向量化示意。然而日志与自然语言文本有所不同: 日志为半结构化文本,日志通常包含日志头与日志形容信息,日志头中常常蕴含工夫戳、起源、日志等级等字段;而日志形容信息中则蕴含对以后操作与对应后果的形容,蕴含丰盛的语义信息;日志中存在大量反复,在日志形容信息中蕴含常量信息与变量值,往往将变量值作为参数符号化后,大量日志能够压缩为一个日志模板;日志中蕴含大量驼峰格局的连写字符串,这与不同编程语言的函数、类等命名格局无关,如android系统日志中,常见SendBroadcastPermission、DisplayPowerController、KeyguardViewMediator等字符串模式。越成熟的零碎,其日志格局与形容越对立,因而成熟的零碎/中间件的日志数据中蕴含的词汇量较小。日志的向量化基于日志文本的特殊性,对于日志的向量化示意须要思考以下问题: 日志向量化之前须要提取日志形容字段,对日志形容字段进行初始化;日志中的变量值通常为无意义的数值或者不同的ip、url、path等,若将原始参数值进行向量化,则会导致词汇量微小且影响后续计算,因而须要首先进行命名实体辨认,对变量值进行辨认与替换;日志非凡的写法须要制订新的规定对日志进行分词,而不能仅采纳通常的英文符号分词形式;日志反复量越大且越成熟的零碎,其日志格局与形容越对立会导致日志无效词汇量少,后续利用中会呈现OOV问题,因而须要联合日志数据与通用数据进行向量化训练。三、基于语义异样的日志剖析本文提出了一种基于语义异样的日志分析方法,如下图所示: 数据预处理数据预处理旨在将原始日志数据处理为算法要求的规范输出数据,整体流程包含:命名实体辨认、分词、过滤、大小写转换、向量化等。其中,命名实体辨认须要对timestamp,url,ip,file,path,number,email等日志中经常出现的实体进行辨认;分词须要思考日志中常见的驼峰表达式;在日志向量化过程中,利用通用语料(wikidata)+零碎/中间件日志语料+业务日志语料训练词向量,最终,词向量维度为200维,词库大小为583511。 日志起源检测如前文所说,越成熟的零碎/中间件/服务,其日志格局与形容越对立。因而,可针对不同起源的日志进行剖析,总结其日志格局,并提取正则表达式,为每一个起源的日志构建日志格局,依据日志格局检测日志起源。 咱们从logpai的loghub以及本公司业务零碎中获取到包含linux、mac、android、apache、arangodb、clickhouse、hadoop、ignite、kafka、nacos、ntpd、openstack、proxifier、redis、spark、ssh、tengine、zookeeper等18个零碎/中间件在内的日志,并提取日志格局,如下: 基于规定的日志起源检测办法,针对不同起源组件的日志进行测试,每个组件日志各抉择10000条日志进行测试,准确率达99.94% 。因而,针对成熟的零碎/两头组件,构建规定进行起源检测能够达到极高的准确率。 日志分类模型通常能够利用日志中蕴含的日志等级字段,如debug,info,warning,error等,对日志进行分类,然而理论中这种日志分类形式通常会存在两个问题: 有些零碎/业务日志中并不蕴含日志等级字段,如linux、mac、ntpd、proxifier、redis等,无奈用日志等级字段进行分类;有些零碎/业务日志中,日志等级字段标注不精确, 或者将异常情况产生时的相干状态或状况标注为“error”等,实际上这类日志语义上并不蕴含错误信息。因而,咱们首先对谬误日志与异样日志进行辨别:异样日志:产生异样时打印的日志,可能仅为异样产生时的某个状态或状况阐明,自身并不蕴含错误信息;谬误日志:语义中蕴含错误信息的日志。本文中,将日志分为失常日志与谬误日志,即依据日志的语义信息将日志进行分类。首先结构数据集:采集零碎/中间件日志、业务日志,提取日志模式并进行去重,采纳人工标注的形式标注数据集,抽取失常日志8926条,谬误日志4051条进行试验。利用传统机器学习中的二分类算法如 svm ,集成学习算法随机森林,深度学习的 bert 别离进行试验,后果如下: 异样分类模型<!----> 异样类型分类首先,对日志中蕴含的异样类型进行剖析与总结,咱们将日志中蕴含的异样类型分为:文件/文件夹操作异样、网络异样、数据库异样、硬件异样、零碎异样和其余异样6类。每一类中别离蕴含多个细分类异样,如文件/文件夹操作异样中蕴含文件或目录不存在、文件或目录无拜访权限、读/写文件失败、其余IO异样等。具体异样类型及ID如下所示。 试验数据集在数据采集过程中发现,上述异样类型及中异样的细分类数据集存在类别不均衡且某些细分类中没有数据的状况,因而采纳粗分类进行异样类型分类试验,将日志异样类型分为6类:文件/文件夹操作异样、网络异样、数据库异样、硬件异样、零碎异样、其余异样。各分类数据量如下: 后续试验中发现,因为4:硬件异样数据量少会导致试验后果较差;而硬件异样能够认为是零碎异样的一种,因而将4,5进行合并,最终数据集如下: 算法及试验后果剖析利用随机森林进行多分类试验,试验后果如下: 单个类别后果如下: 四、总结在本文中,咱们提出了一种基于语义异样的日志分析方法,并联合日志起源造成了输出一条原始日志,输入为<日志起源,日志类型,异样类型>的算法流程,以此提取出日志中蕴含的丰盛的语义异样信息,从而为零碎开发人员与运维人员监控零碎分析异样行为和谬误提供了无力撑持。 五、开源福利云智慧已开源数据可视化编排平台 FlyFish 。通过配置数据模型为用户提供上百种可视化图形组件,零编码即可实现合乎本人业务需要的炫酷可视化大屏。 同时,飞鱼也提供了灵便的拓展能力,反对组件开发、自定义函数与全局事件等配置, 面向简单需要场景可能保障高效开发与交付。 点击下方地址链接,欢送大家给 FlyFish 点赞送 Star。参加组件开发,更有万元现金等你来拿~ GitHub 地址: https://github.com/CloudWise-... Gitee 地址: https://gitee.com/CloudWise/f... 万元现金流动: http://bbs.aiops.cloudwise.co... 微信扫描辨认下方二维码,备注【飞鱼】退出AIOps社区飞鱼开发者交换群,与 FlyFish 我的项目 PMC 面对面交换~ ...

May 5, 2022 · 1 min · jiezi

关于运维:ubuntu22服务器启用

一、装置1.依照apt-get的形式装置nginxsudo apt-get install nginx 2.查看nginx是否装置胜利nginx -v 3.启动nginxsudo service nginx start 启动后,在网页重输出ip地址,即可看到nginx的欢送页面。至此nginx装置胜利 二、nginx文件装置实现之后的文件地位:/usr/sbin/nginx:主程序/etc/nginx:寄存配置文件/usr/share/nginx:寄存动态文件/var/log/nginx:寄存日志

May 2, 2022 · 1 min · jiezi

关于运维:一份送给IT工程师们的礼物观测云2022正式发布

往年4月,一场疫情,让所有人、所有行业都陷入了“我太难了!”的状态,尤其对还在封控中的上海,都在期待有一股新的能量把咱们唤醒,一扫疫情带来的阴郁。 2022年4月28日晚,一场具备划时代意义的发布会呈现了!20点整,倒数10秒后,一个“3D数字人”从屏幕中跃出!这是观测云在这非凡期间,为所有IT工程师们献上的一场“特地”模式的产品发布会。非凡的舞台、特效的互动、3D数字人演讲......一场主题为“To All Engineers”的产品发布会正式开启,一款联合寰球最前沿SRE理念和国内可观测性最佳实际的产品--观测云,正式亮相! 一、直击发布会现场,一场IT工程师们的科技盛宴观测云创始人兼CEO蒋烁淼学生率先退场,残缺诠释了“什么才是真正面向工程师的可观测性产品”,随后,观测云团队成员别离介绍了2022观测云全新降级的九大产品性能、强化的两项外围能力、新生态“AOE”打算与将来愿景。这场约45分钟的产品发布会,直播间观看人数冲破10万,独特见证了中国可观测性软件畛域的一座里程碑的诞生,一次划时代技术改革的开启。 随着全球化数字经济的倒退,云计算技术的一直降级,承载业务的IT基础设施规模越来越大,各个利用间的链路关系也变得越来越简单,每时每刻都在产生海量级的日志。在现今的零碎状态下,IT工程师们须保障数字系统可靠性,要面对的艰难一劳永逸。各个团队的工作内容越来越多,但对系统的运行状态却越来越看不清,往往在一个荫蔽问题曾经造成微小影响后,才后知后觉。蒋烁淼示意:“一个业务利用是由这么多的组件形成,对于开发工程师来说,代码的使用不当或者Bug,都会引起零碎的性能问题,甚至制作故障;而对于运维工程师来说,不能像传统运维那样被动地解决,须要面向用户体验和业务,无效地追踪整个零碎。数据驱动,这就是须要构建可观测性的重要起因。” 应用传统繁多监控工具或开源计划,往往须要面对性能割裂,互相兼容适配性不稳固,和界面难以对立的问题。蒋烁淼介绍道:“发明观测云就是为了帮忙IT工程师解决这些难题,观测云的指标是让每一个团队都能十分轻松简略地具备构建全面的零碎可观测性的能力。对立地建设整个零碎可观测性是DevOps和SRE可能落地的充沛必要条件。”无论电商、游戏、社交、金融、医疗或其余行业,都能够通过观测云一个平台,对各种技术栈、开发框架、业务指标等实现对立地采集、对立地治理、对立地监控、对立地观测和对立地数据利用。 二、九大产品性能、两项外围准则、全新AOE生态打算惊艳亮相一款优良的可观测性产品该实现哪些基本功能?在发布会上,观测云产品总监曹新宇带来《观测云整体能力概览》的主题分享,全面论述观测云产品遵循的一个产品、一个界面、一个采集器的设计准则,现场展现并详解了包含“监控告警”“指标采集”“异样检测”“事件告诉”“可用性监测”“用户拜访监测”“平安监测”“日志剖析”“利用性能监测”的九大基本功能,让观看直播的敌人们全面地感触到可观测性的技术价值与观测云产品魅力。 观测云声称放弃每两周一次更新,在高频迭代下,如何始终保持本身平台的稳定性,重点强化的是哪些组件?观测云CTO徐季秋带来了解答。他示意,观测云保持两项外围准则 :1.全面拥抱云原生,优化本身架构。观测云对客户的SLA是站在寰球顶尖私有云的SLA之上的。2.欲观人,先自观。观测云多个可用区之间的SaaS相互观测,通过本身的智能巡检,SRE团队的被动观测,可提前发现隐患,能高效优化配置。观测云本人就是通过可观测性保障SaaS平台可靠性的最佳实际。将来,观测云将继续加大研发投入,晋升自研组件的易用性与可扩展性,在OpenTeleMetry 的OTLP协定下,宽泛兼容优良的开源工具。三个重点的自研组件是:一站式采集引擎DataKit,对立的查问引擎DQL,Serverless数据处理引擎Dataflux-function。其中Datakit和Function曾经开源,代码托管在极狐GitLab,心愿为国内的根底软件倒退奉献更多力量,并和开源社区一起成长。 为服务好宽广工程师们、技术社群和商业合作伙伴,观测云生态业务VP蔡文瑜揭晓观测云“新生态AOE打算”,心愿通过这项以Advanced、Open和Efficient为宗旨的“AOE”打算,联结更多气味相投的搭档们,独特发明反对可观测性继续翻新和倒退的生态环境。蔡文瑜介绍道:“观测云会继续做国内可观测性理念和技术的布道者;会为工程师们提供凋谢、优质的交换单干平台;会踊跃听取用户的倡议反馈,开释用户的创造力,使产品更具生命力;会保持凋谢单干,以更多的联结解决方案模式进入到各行业;会用心服务好代理商,简化代理商的商务对接工作,一起建设技术服务网络。所有的所有,都是为了能向IT工程师们献上更好的产品,更棒的礼物!”随后,CEO蒋烁淼再次退场,走漏本次发布会后的短期内,观测云的几项重要降级打算:4月底,公布社区版(截止发稿曾经公布),用户能够收费测试观测云部署版;4月底,凋谢CI可视化性能(截止发稿曾经公布),帮忙开发工程师们更清晰追踪代码运行状态;5月初,进一步上线实时Profiling性能,能够查看程序运行时的堆栈信息和内存占用状况;6 月,上线智能巡检性能。可基于根本数据模型,通过算法定时扫描零碎,智能预警潜在危险;6月,同步凋谢智能巡检开发平台,不便工程师们依据本人需要,自定义智能巡检能力。 最初带来结尾致辞:“聪慧的团队会观测,这是我作为一个工程师和技术管理者最大的感悟,我也将这句话作为了咱们产品的口号。一个成熟的技术团队,就应该把握通过数据视角去剖析问题的办法。观测云心愿帮忙中国的宽广技术团队,疾速地领有相干的能力,让每一个技术团队都因数据而变得更加 Smart!” 期待在2023观测云产品发布会时,一起遇见更优良的观测云。 观测将来,观测云乘风向前!

April 29, 2022 · 1 min · jiezi

关于运维:ConsulManager应用场景1如何优雅的基于Consul自动同步ECS主机监控

【ConsulManager介绍】Consul字段设计说明服务首次启动时会创立一个随机秘钥,寄存到consul_kv的/ConsulManager/assets/secret/skey,该秘钥用于对登录Token,各云厂商账号AKSK的加解密应用。云厂商的每个账号下的ECS实例信息:会存储到Consul的对应Services下的实例中,ECS的实例ID会作为ServiceID。云厂商的每个账号下的AKSK和分组信息:寄存到consul_kv的/ConsulManager/assets下各个云厂商的目录下的aksk(加密存储)和group目录。分组字段:是采集云厂商用于资源分组的字段,阿里云:资源组,华为云:企业我的项目,腾讯云:所属我的项目。请在创立云主机时设置好属组。新增的各个云厂商的ECS同步工作:会寄存到consul_kv的/ConsulManager/jobs下,服务启动的时候会加载这些工作。每次同步工作的执行后果:会存储到consul_kv的/ConsulManager/record/jobs的各个云厂商目录下。新增云厂商的数据源之后会主动同步一次分组信息,ECS信息则会在设置的工夫距离之后才会同步,能够手动点击同步按钮同步一次。Linux默认监控node_exporter的9100端口,Windows默认监控windows_exporter的9128端口。配置阐明1. 新增同步源在Web页面点击ECS 云主机监控/接入数据源,点击新增同步源,输出各字段:账户可随便填写,用来辨别云厂商不同云账户的标识,反对中文,例如用主账户的名称。填写的AKSK须要有获取ECS的权限以及各云厂商分组信息的权限。(留神:腾讯云的分组信息因为在ECS中没有找到对应接口,是从分布式数据库TDSQL-查问我的项目列表 (DCDB)的接口中获取的,AKSK须要有对应权限。)抉择好对应的ECS所在区域(暂反对国内),以及分组与ECS的刷新距离,确认即可,分组信息会主动同步一次,ECS信息则会在设置的工夫距离之后才会同步,能够手动点击同步按钮同步一次。 2. 查看云主机列表能够点击查看按钮或者在云主机列表中查看同步后的ECS信息。(华为云暂未获取到ECS到期日信息) 3. 配置Prometheus点击ECS 云主机监控/Prometheus 配置,依据须要来生产各账号、零碎(均反对多选)的Prometheus配置信息,复制配置后,追加到prometheus.yml的开端,重启Prometheus即可。 4. 查看Prometheus在Prometheus的Web页面中,点击Status-Targets,能看到新增的Job即示意数据同步到Prometheus。 5. 导入Node Exporter Dashboard更新了主机监控的grafana看板,可匹配主动同步形式采集ECS信息字段的展现。优化了大量图表,应用新版表格重建,新增衰弱评分概念,并新增了整体资源耗费信息的一些图表。导入ID:8919具体URL:https://grafana.com/grafana/dashboards/8919留神:被动关机的ECS,会在同步时候从Consul中革除,即会在Prometheus中去除(缩小有效的告警),从新开机后会减少回去。各ECS的Node_exporter须要自行装置。【最近7天P99资源使用率】图表须要在Prometheus减少记录规定(采集1小时后出数据):- name: node_usage_record_rules interval: 1m rules: - record: cpu:usage:rate1m expr: (1 - avg(rate(node_cpu_seconds_total{mode="idle"}[1m])) by (instance,vendor,account,group,name)) * 100 - record: mem:usage:rate1m expr: (1 - node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes) * 100

April 29, 2022 · 1 min · jiezi

关于运维:ConsulManager应用场景2如何优雅的使用Consul管理Blackbox站点监控

【ConsulManager介绍】Consul字段设计说明所有数据存在一个名为blackbox_exporter的Services项中,每个监控指标为一个子Service。每个Service应用Meta的kv保留监控指标的属性:module,company,project,env,name,instance,别离示意:监控类型,公司部门,我的项目,环境,名称,实例url。新增监控时,监控类型字段(module)和Blackbox配置中的module必须保持一致。前5个字段合并即为consul的serviceID,作为惟一监控项标识配置Prometheus与Blackbox原理:基于Consul实现Prometheus的主动发现性能配置把Consul每个service的Meta的KV关联到Prometheus每个指标的标签。依据每个指标的标签来对监控指标分类,分组,方便管理保护。 1. 配置Blackbox_Exporter在Web页面点击Blackbox 站点监控/Blackbox 配置,点击复制配置。编辑blackbox_exporter的blackbox.yml,清空已有的配置,把复制的内容粘贴进去,重启blackbox_exporter。 2. 配置Prometheus在Web页面点击Blackbox 站点监控/Prometheus 配置,点击复制配置。编辑Prometheus的prometheus.yml,把复制的内容追加到最初,reload或重启Prometheus。 3. 配置Prometheus告警规定在Web页面点击Blackbox 站点监控/告警规定,点击复制配置。编辑Prometheus的rules.yml,把复制的内容追加到最初,reload或重启Prometheus。 4. 查看Prometheus在Prometheus的Web页面中,点击Status-Targets,能看到新增的Job即示意数据同步到Prometheus。 5. 导入Blackbox Exporter Dashboard反对Grafana 8,基于blackbox_exporter 0.19.0设计采纳图表+曲线图形式展现TCP,ICMP,HTTPS的服务状态,各阶段申请延时,HTTPS证书信息等优化展现成果,反对监控指标的分组、分类级联展现,多服务同时对比展现。导入ID:9965具体URL:https://grafana.com/grafana/dashboards/9965批量导入脚本在units目录下instance.list中写入监控指标的信息:JOB名称,公司/部门,我的项目,环境,名称,实例url,每行一个,空格分隔。 留神:前5个字段组合起来必须惟一,作为一个监控项的ID。即Consul的ServiceID 批改units目录下导入脚本中的consul_token和consul_url,保留后执行input.py,即可导入所有监控指标到Consul,并合乎Prometheus的主动发现配置。

April 29, 2022 · 1 min · jiezi

关于运维:阿里云EMAS旗下低代码平台Mobi开放定向内测

一、产品介绍Mobi是面向全端(Web、Native App、H5、全平台小程序、PC、IoT利用等)场景,模型驱动的低代码开发平台(Low Code Development Platform ),提供一站式的可视化利用建模、页面搭建、数据建模和流程编排能力,基于云原生架构反对利用的弹性扩大和零老本运维,帮忙客户高效地解决利用开发、定制和保护的问题。 二、定向内测目前,Mobi处于私有云版本内测中,诚邀对低代码有强烈需要的企业或集体开发者进行深度共创,为了理解您的需要,咱们特意设计了这套问卷,请您填写:https://survey.aliyun.com/app...1、本次邀约名额限时限量凋谢,高质量实现问卷者先到先得2、mobi团队原厂产研一对一沟通,利用低代码技术解决您的利用开发问题 三、Mobi的利用场景1、客户体验翻新(Customer Experience Innovation)以客户和员工的每个业务触点体验作为抓手,通过低代码平台疾速的撑持利用翻新,通过利用扩大和迭代晋升企业和员工对于企业的满意度。 2、业务流程自动化(Process Automation)以企业外部各类定制化的治理流程作为指标,无需重构已有零碎,通过低代码平台对已有系统集成和新的流程编排设计,低成本、轻量级的解决跨业务流程流转问题,进步企业运行效率。 3、企业SaaS定制(Enterprise Software Customization)当通用型SaaS(如OA、CRM、ERP)无奈满足企业业务诉求时,可通过低代码平台对已有SaaS的数据和接口集成,通过可视化的形式增加新的业务利用,加强企业SaaS能力,满足企业100%定制化需要。 4、系统集成与扩大(System Integration & Extension)在企业数字化革新过程中,要依靠于已有零碎运行同时构建新的数字化业务,应用低代码平台对已有零碎进行集成和对立接口化革新,解决异构零碎的集成与对立凋谢问题。 欢送退出Mobi内测体验交换钉钉群,群号:32946835

April 28, 2022 · 1 min · jiezi

关于运维:观测云新增俄勒冈站点布局全球可观测服务网络

近日,观测云新增海内区1(俄勒冈)站点,与此前公布的“中国区1(杭州)”“中国区2(宁夏)”两大站点独特打造一张笼罩广、技术强、服务佳的可观测网络,服务好国内用户的出海需要。 随着中国经济的高速倒退,越来越多中国企业走出国门,业务延长向寰球。同时,这些企业的数字化零碎,也在大规模扩张,用以撑持前端业务的高速倒退。面对跨境散布的基础设施与数据网络,如何治理好企业的全球化数字平台,保障系统可靠性,是大多数企业的IT团队正在应答的新一轮挑战。 观测云,国内当先的全链路可观测性平台,为进一步保障中国用户的寰球业务零碎稳固,让部署在海内的数字化节点也能够被高效监测,新增海内区1(俄勒冈)站点(该站点可直连AWS俄勒冈可用区)。 至此,观测云共有“中国区1(杭州)”“中国区2(宁夏)”和海内区1(俄勒冈)3大站点,后续还会推出更多地区站点。指标为国内用户,提供可笼罩寰球的可观测服务网络。 观测云的所有站点都反对收费应用额度,按量计费和多种结算形式。除能应用观测云费用核心账户间接结算外,以后还能够通过亚马逊云中国区账户、阿里云中国区账户或长虹佳华CSP平台账户,合并观测云账单结算。用户可自由选择适宜的服务站点和结算形式,便捷订阅观测云服务。 咱们对来自不同地区的网络链接,做了最大水平优化。您可依据基础设施的次要部署地位,抉择就近的观测云站点,以获取最佳服务体验。同时咱们保障所有节点提供的服务范畴(SoW)和服务规范(SLA)都是统一的。 部署站点举荐1、若部署在华东、华南地区:能够优先思考“中国区1(杭州)”站点;2、若部署在华北、西部地区:能够优先思考“中国区2(宁夏)”;3、若部署在海内:能够优先思考“海内区1(俄勒冈)”。 更多征询,请随时关注观测云公众号内容更新。或扫码进入观测云用户社区,与寰球用户交换观测云应用办法和实现零碎可观测性经验。扫码增加小助手即可退出观测云官网技术社群 观测云将于2022年4月28日,以线上直播模式举办2022观测云产品发布会,欢送扫码进群,与小伙伴们一起看直播。2022观测云产品发布会,精彩不容错过直播工夫:4月28日 20:00

April 27, 2022 · 1 min · jiezi

关于运维:3hhdesk许可更新指导

作为纯国产终端管理器&外置文件管理器HHDESK上线统信商店以来,受到了宽广用户的青眼,HHDESK新版本其性能也曾经可能跟老牌国外终端软件如SecureCRT等进行全面反抗,但如何在UOS上进行许可更新成为大家比拟困惑的事件。为了大家疾速不便的更新许可,恒辉录制了在UOS上更新HHDESK许可的操作领导,心愿能给大家带来帮忙。https://www.bilibili.com/vide...

April 27, 2022 · 1 min · jiezi

关于运维:观测云入驻阿里云心选商城带来云上系统可观测全面体验

“观测云”是一款专门为DevOps团队打造的产品,构建起面向数据的DevOps能力。包含端到端的用户体验追踪、理解利用内函数的每一次调用、全面监控云时代的基础设施、疾速发现零碎的平安危险。通过齐全凋谢的仪表盘定制能力,帮忙工程师们疾速展示数据可视化。 2022年4月,观测云正式入驻阿里云心选商城。本次上架商品包含观测云全副性能,以SaaS订阅形式获取,并可反对按量计费。用户可间接在阿里云账号内操作订阅,抉择按天合并出账,再通过阿里云账号内余额对立领取和获取发票。阿里云用户们可实现以最简便的商务流程,疾速应用观测云服务。观测云:全面构建零碎可观测,用数字化形式掌控数字化零碎观测云从每一个业务零碎登程,可疾速构建全链路的可观测性。使产品、开发、测试、运维团队在实时数据的驱动下协同工作,用数字化掌控数字化零碎。 观测星散成并自动化了基础设施监控、应用程序性能监控和日志治理,为整个技术栈提供实时可察看性。通过对指标、日志与链路的全面采集和聚合存储,向用户提供对立标签、对立界面、对立语言的可观测平台。 观测云可能为您提供:●超过300个经测验的技术栈接入模板,并在社区力量的帮忙下一直扩容中。无论您的零碎和利用是单云、多云还是混合云,观测云都有可用的数据集成形式,让您疾速上手,构建零碎的可观测。●不论您的应用程序和工作负载位于何处,观测云可能主动发现服务拓扑,提供从客户端到数据库的端到端全门路追踪,反映每笔业务在各利用组件中的理论通过门路、响应耗时和处理结果。主动统计服务要害性能指标,构建服务调用关系图,深层解析解决流程,问题本源。●弱小的搜寻、筛选和分组性能,可对数据进行分层存储,以降低成本,并由您来掌控数据的生命周期治理。同时也提供灵便的自定义视图和仪表板展现,让您可能依据业务的需要,量化和可视化要害指标数据和系统可靠性程度。●反对针对主机、容器、网络、安全设备等各类资产信息进行定期的安全检查,一键发现恶意程序、系统漏洞、缺点等安全隐患,主动匹配关联巡检事件,对平安巡检的过程和后果进行详细描述,并提出平安保障工作倡议,为您的上云过程保驾护航。●向工程师们提供微信、钉钉等多种 IM 工具、以及Webhook形式告警,高效帮忙DevOps团队全面洞察状态,疾速找到隐患,轻松协同解决,同时无效地升高告警风暴。●在一个平台中监控基础设施、日志、利用性能和用户体验,会集整个企业软件系统的所有性能数据,主动进行关联,并提供可视化的拓扑和链路剖析。工程师在一个界面中进行钻取,疾速找到问题的本源。 阿里云将与观测云的强强联合,为更多工程师们提供优质的SaaS技术与服务。将来,观测云将持续强化本身核心技术能力,依靠阿里云的技术和生态反对,普惠更多用户。 另外,4月28日20:00观测云将举办线上产品发布会,欢送扫码退出钉钉群观看 附:观测云用户界面示例 图 1:基础设施对立监控 图 2:最终用户体验监测 图 3:数据的关联展现 图 4:用户自定义仪表盘 戳链接理解产品详情https://market.aliyun.com/pro...

April 26, 2022 · 1 min · jiezi

关于运维:Linux命令-常用总结二

Linux文件系统注:Windows有盘符,Linux没有盘符的概念只有根目录/bin 寄存二进制文件和一般的命令/etc 寄存系统管理和配置文件/home 寄存所有用户文件的根目录,是用户主目录的基点,比方用户user的主目录就是/home/user,能够用~user示意;/root Root家run 长期(零碎)tmp 长期var 日志,邮件/lib 寄存着和零碎运行相干的库文件 ;/usr usr/bin 用户装置的应用程序cmd [-option] [parameter]帮忙手册:cmd --help mam cmd manul手册目录相干pwd (print work directory)查看以后所处门路ls (list) 查看以后门路下所有内容ls -l 以列表显示 =llls -a 显示暗藏文件 (all). 示意以后门路,.. 示意上一级门路**ls -l -h ** 列表显示文件的单位ls -lha**ls Desktop ** 列举某一门路下的文件通配符查找文件 * ?[ ]ls *.txt 只查找后缀为.txt的文件, *代表0个或者多个字符ls e* 查找以e结尾的文件ls ?? 列举出所有为两个字符的文件,?代表一个字符ls [1234]23.odt 列出结尾为1234中的一个字符的文件 或者[1-4]cd (change directory) 关上目录或者更改门路,输首字母按Tab可主动补全cd Desktop/aa 能够关上多级门路cd .. 返回上一级门路cd ~ 间接回到home目录cd - 是返回上次应用的目录cd / 是返回根目录文件的操作创立touch 创立文件,touch haha hehe 如果加空格则示意创立了两个文件hehe 和 hahatouch "haha hehe" 要创立带空格的文件须要用空格援用起来,不倡议用空格命名**mkdir ** 创立文件夹(目录)mkdir -p /root/test/A/B/C 创立递归目录删除 rmrm 移除文件,也能够移除暗藏文件rm -d / -rf 移除文件夹 加 f 不须要进行确认挪动(剪切,改名)mv相对路径mv text.txt aa //将text.txt文件挪动到aa文件夹下,也能够整体将文件夹挪动到其余文件夹下mv 125.odt ./126.odt //将125.odt剪切到当前目录并重命名绝对路径mv text.txt /home/yujiu/桌面/aa复制 cpcp 125.txt aa // CP 源文件 目标目录**cp -r aa/bb . **//将aa文件夹下的bb文件夹复制到以后门路,.示意以后门路搜寻 findfind /home -name 125.txt 准确搜寻find /home -name '12*' 含糊搜寻以12结尾的文件find /home -iname abc 疏忽大小写搜寻find /home -size +1 1=1数据库=512字节=0.5KB +代表大于 -代表小于find /home/yujiu/Desktop/ -type f/d /l 按文件类型搜寻,f示意文件/d示意文件夹/l代表软链接,linkfind /home/yujiu/Desktop/ -mmin -5 搜寻目录下5分钟内被批改过的文件mmin 上次文件内容被批改工夫amin 上次文件被拜访工夫cmin 上次文件属性(文件的权限)被批改工夫-5 五分钟内 +5超过5分钟Ctrl+C 终止搜寻**locate ** 搜寻 比find快sudo updatedb 以管理员权限更新索引库条件连接符-a 两个条件同时满足 and-o 两个条件满足其中一个 or文件查看cat 和 more 查看文件内容cat 126.txt 全副显示cat -b 126.txt 显示行号不包含空行cat -n 126.txt 显示行号包含空行more 126.txt 分页显示 (空格 页查看,回车行查看,Q退出)less 命令和more 一样,能够向上翻页和换行,less /service 能够搜寻对于service的关键词head -n 7 /etc/services 查看文件的前7行tail -n 3 /etc/services 查看文件的后三行grep 文件内容搜寻grep user 126.txt 搜寻126.txt文件下的usergrep -n user 126.txt 显示行号grep -v user 126.txt 反向搜寻,搜寻不蕴含user的内容grep ^'#' /etc/services 抓取以结尾的内容grep s$ /etc/services 抓取以s结尾的内容echo 回显echo hello 将hello显示在屏幕中echo hello > 126.txt 将hello显示在126.txt文件中,笼罩原文内容echo hello >> 126.txt 追加到文本开端显示ls > 126.txt >示意将ls列出的内容显示在文件中 实用于日志保留which 查看命令所在的地位clear 清屏 ctrl + L管道把一个命令的输入,通过管道连贯,作为另一个命令的输出ls -lh | grep 125.txtgrep -v ^'#' /etc/services|more 分页显示软链接 ln -sln -s /etc/issue /tmp/issue.soft //创立文件/etc/issue的软链接/tmp/issue.softln /etc/issue /tmp/issue.hard //创立文件/etc/issue的硬链接/tmp/issue.hard 硬链接和源文件同步更新软连贯特色:(相似于Windows快捷方式)1、lrwxrwxrwx l 软链接,软连贯文件的权限都为rwx rwx rwx2、文件大小-只是符号链接3、/tmp/issue.soft -> /etc/issue 箭头指向源文件硬链接特色:1、拷贝 cp -p + 同步更新 echo "www.baidu.net" >> /etc/issue2、通过i节点辨认3、不能跨分区4、不能针对目录应用linux 中命令打不进去yum install cmd用户切换: su +用户名导出设施的尸体文件: ...

April 26, 2022 · 2 min · jiezi

关于运维:工程师们看过来|这是我见过的IT圈最潮的产品发布会了

近年来,“可观测性”话题在寰球技术圈掀起一轮轮热度后,国内IT圈也终于沸腾了!2022年,国内各家云服务商、监控运维软件服务商纷纷跟进,推出新一代基于可观测性能力的工具或产品,一时间百花齐放。国内IT工程师们对可观测性畛域的技术前沿也投以最高关注,报以最大激情,期待早日在该赛道内诞生出国产旗舰级产品,不再望洋兴叹。基于10年云服务教训积淀,历时4年开发迭代,凝固200+开发运维工程师心血,汇聚有数社区用户的奉献,国内首款专为IT工程师们打造的全链路可观测产品——观测云,在万众期待下终于要迎来正式公布。2022年4月28日晚8点,以“To All Engineers”为主题的2022观测云产品发布会闪亮来袭!观测云是国内第一批可观测性理念布道者,领有标志性域名guance.com,近几年始终致力于推动可观测性在国内技术和行业生态的落地倒退;同时又是事必躬亲的实践者,多年深耕云计算服务畛域,厚积薄发,精雕细琢出一款全自研的可观测产品,性能已达到寰球领先水平。在长达近2年的客户推广和用户调研过程中,播种统一认可和继续好评,并累积到少量技术用户粉丝,已声名远扬。终于,在2022年4月28日晚8点,这万众瞩目的时刻就将到来!用最新的理念,为工程师们打造最好的产品观测云是一款实现全链路可观测性的平台。集成并自动化了基础设施监控、应用程序性能监控和日志治理,为整个技术栈提供实时可察看性。通过对指标、日志与链路的全面采集和聚合存储,向用户提供对立标签、对立界面、对立语言的可观测平台。性能包含端到端的用户体验追踪,理解利用内函数的每一次调用,全面监控云时代的基础设施,疾速发现零碎的平安危险。通过齐全凋谢的仪表盘定制能力,帮忙工程师们疾速展示数据可视化,使产品、开发、测试、运维团队在实时数据的驱动下协同工作,用数字化掌控数字化零碎。本场发布会,观测云将携2022全新版本正式亮相,从产品架构、核心技术、利用实际到生态愿景等视角作全面介绍,让所有观看发布会的敌人们,都能疾速理解观测云近些年的倒退历程和指标愿景,喜爱上这款合乎工程师偏好的数字化前沿工具,一起开启全新的可观测性将来!2022年国内IT圈首个全程数字人形象退场发布会,酷炫视觉燃爆全场观测云总部坐落于中国上海,疫情之下,共克时艰。为让发布会能如约揭幕,不负工程师们的激情期待,观测云克服重重困难,与业内顶尖直播技术团队,独特策动了这场2022年国内IT圈首个全程数字人形象退场发布会,敬请期待现场酷炫成果,定会给您惊喜!观测云CEO蒋烁淼及外围团队成员,将应用充斥科技感的3D专属数字人形象,配合实时真人演讲,打造更具表现力的现场成果,给到直播观众最新­­鲜、最亲切的观看体验!本场发布会将在阿里云开发者社区、InfoQ、流动行、稀土掘金、CSDN、SegmentFault 、云技术、阅码场、DataFun等平台实时直播互动。(特地鸣谢云原生计算基金会、开源GitOps产业联盟的反对!)这是一场与诚意同行,以科技致敬的发布会!再次诚邀所有敌人们一起退出,开启这场往年最值得期待的­可观测性之旅!

April 25, 2022 · 1 min · jiezi

关于运维:拥抱开放Serverless-时代的下一征程

简介:许多用户的利用其实并不是从零便开始应用 Serverless,而是出于对 Serverless 理念的认同,基于架构降级演进的诉求,冀望将原有的部署环境迁徙或者是混部于 Serverless 之中。那么在此场景下,利用迁徙革新的老本显得尤为重要...Serverless 作为云计算的最佳实际和将来演进趋势,其全托管免运维的应用体验和按量付费的老本劣势使得它在云原生时代备受推崇。Serverless 的应用场景也由事件驱动,数据处理等局部特定场景转向更为宽泛通用化的 WEB,微服务,AI,进而在电商,互娱,出行,乃至传统行业都有浸透。 在 Serverless 的遍及与推广过程中,开发运维人员尽管认同其降本提效的外围价值,但同时被诸如厂商锁定,黑盒化,全屏蔽等一系列 Serverless 全包的个性所困扰;进而所引发的迁徙老本高,问题排查难度大,根因定界剖析艰难等痛点亟需解决。 所谓凋谢,是指用户能够解脱心智累赘的,在不变更语言利用的前提下从任意平台迁徙至 Serverless,是指用户能够即开即用的获取 Serverless 利用的全生命周期外围数据,更是指用户能够将其原有的架构与 Serverless 架构进行交融,实现云上云下云间的互通与混部。拥抱凋谢后 Serverless 将不会是须要革新以适配兼容的,可望而不可即的技术试验品,也不是一座独立进去的,与原有技术体系割裂的数据孤岛,而是承载技术开发者们现实与事实的,可能让技术变得更加普惠、通用、共享的最短门路之一。 阿里云保持在 Serverless 畛域继续投入并在技术竞争力上维持领先地位, SAE (Serveless 利用引擎)作为业界首款面向利用的 Serverless PaaS,可能提供老本更优、效率更高的一站式利用托管计划。SAE 在 2018 年外部孵化之初就秉持着零门槛,零革新的主旨进行利用(工作)的 Serverless 革新和落地实际,并且在产品的倒退历程中一直踊跃寻求被集成,增进 DEVOPS 全流程体验,三年内助力千余家客户实现利用的云原生 Serverless 化。SAE 目前已有和行将推出的性能均围绕着“拥抱凋谢”开展,上面咱们一起看看 SAE 目前所提供的产品性能个性以及它背地的思考逻辑。 Serverless 部署架构的开放性许多用户的利用其实并不是从零便开始应用 Serverless,而是出于对 Serverless 理念的认同,基于架构降级演进的诉求,冀望将原有的部署环境如物理机,云主机,Kubernetes 进行迁徙或者是混部于 Serverless 之中。那么在此场景下,利用迁徙革新的老本显得尤为重要,然而 Serverless 平缓的学习曲线和厂商生态锁定的刻板印象,令诸多开发者望而生畏。正如先前所述,SAE 主打零门槛,零革新迁徙,利用其实无需批改任何代码逻辑,便可间接部署在 SAE 当中,而对于非容器类的利用,SAE 也提供内置的镜像构建能力,并借助公布单使得全 CICD 变得流程化、自动化、可视化。上面咱们重点介绍一下跨平台的应用场景。 SAE与云主机混部SAE 反对与云主机(ECS)实例进行混部,以便于在存量迁徙的场景下实现疾速弹性,施展 SAE 的劣势,整个过程无需任何开发革新。具体的形式为,将存量 ECS 实例退出到 SAE 实例申明应用的 SLB 后端虚构服务器组中,SAE 利用在部署、扩缩容、进行、启动、重启、垂直扩缩容等场景中,会主动动静保护 SLB 后端的实例,对立对外提供服务。 ...

April 25, 2022 · 1 min · jiezi

关于运维:阿里云新版云计算架构师ACE认证专家解读会重磅来袭

简介:专家命题人十分解读 9600元全额代金券限量发放!流动钉群:31889256。3月28日,阿里云新版云计算架构师ACE认证正式降级公布,面向云架构师、解决方案架构师、资深运维/交付等人群,提供技术能力认证。自降级以来,新版ACE认证受到十分多关注者的报考与征询,命题人组特于下周为大家带来五晚的全方位专家解读会! 直播工夫:4月25日-4月29日 直播钉群:31889256 专家命题人现场解读&答疑新版ACE认证三个环节的全方位解读:口试&试验&面试现场更有取得9600元全额代金券机会和丰盛阿里云周边礼品版权申明:本文内容由阿里云实名注册用户自发奉献,版权归原作者所有,阿里云开发者社区不领有其著作权,亦不承当相应法律责任。具体规定请查看《阿里云开发者社区用户服务协定》和《阿里云开发者社区知识产权爱护指引》。如果您发现本社区中有涉嫌剽窃的内容,填写侵权投诉表单进行举报,一经查实,本社区将立即删除涉嫌侵权内容。

April 24, 2022 · 1 min · jiezi

关于运维:生产环境安装PrometheusGrafana

装置Prometheuswget https://github.com/prometheus... tar -zxvf prometheus-2.34.0.linux-amd64.tar.gzmv prometheus-2.34.0.linux-amd64 prometheus vim prometheus.yml # my global configglobal: scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute. evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute. # scrape_timeout is set to the global default (10s).# Alertmanager configurationalerting: alertmanagers: - static_configs: - targets: - localhost:9093# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.rule_files: - "rules/host_rules.yml" # - "first_rules.yml" # - "second_rules.yml"# A scrape configuration containing exactly one endpoint to scrape:# Here it's Prometheus itself.scrape_configs: # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config. - job_name: "prometheus" # metrics_path defaults to '/metrics' # scheme defaults to 'http'. static_configs: - targets: ["localhost:9090"] - job_name: 'agent-web01' static_configs: - targets: ['172.31.32.104:9100'] - job_name: 'agent-web02' static_configs: - targets: ['172.31.29.223:9100'] - job_name: 'java' static_configs: - targets: ['172.31.29.223:8100'] metrics_path: '/actuator/prometheus'创立规定mkdir -p /root/prometheus/rules ...

April 24, 2022 · 2 min · jiezi

关于运维:Ampere-Computing释放观测云芯算力强强联合推动可观测性发展

Gartner预测,到2025年,云原生平台将成为95%以上新数字利用的根底,而在2021年这一比例只有不到40%。热潮之下,越来越多的企业和开发者推动业务与技术的翻新向云原生演进。 云时代,云原生开启新赛道云原生时代,技术突飞猛进。是否与国内前沿概念、尖端技术胜利接轨,如何无效施展本身产品能力与技术劣势,是各行业企业独特面临的重要课题。如果局限在过来的教训和形式,因循旧的软、硬件体系架构而上云,那只是云技术的模式利用,无奈充分发挥云的弱小能力,云原生更是无从谈起。云基础设施中,CPU是数据中心的根底。在宏大的市场规模下,如果沿用曾经应用了40多年的传统CPU架构,因为能耗高、密度低,预计到2025年将会导致能源需求增长2倍,空间需增长1.6倍。无论对云原生的翻新,还是对可继续倒退,传统的计算技术架构都已顾此失彼。云原生时代要以新技术、新办法来构建新硬件、新软件和新服务,能力从云技术中取得更高的可用性与可扩大能力,晋升公布和运维的效率。将来全栈云原生体系的基础设施须要面向未来,用更古代的计算设计办法构建专为云而设计的处理器产品。 Ampere Computing,应云而生Ampere Computing专一为云,致力于塑造超大规模云计算和边缘计算的将来。2020年,Ampere Computing向市场推出业内首款云原生处理器Ampere® Altra®。Ampere Altra 处理器的单线程设计能够保障云原生利用在多租户的环境下,不受资源共享的烦扰,实现性能线性扩大,以更高的性能、更低的功耗以及更多的物理内核为云服务厂商提供低的TCO和绿色可继续倒退的新架构。作为云计算服务的领导者,阿里云在2021年7月正式推出了基于Ampere Altra处理器,面向容器、微服务、DevOps等云原生场景的云实例产品g6r和c6r。近期,国内当先的云时代的零碎可观测平台——观测云,胜利地实现了在c6r云实例上的部署,并已开始向SaaS订阅用户提供服务。 观测云, 可观测性的弄潮儿作为国内一款实现业务全链路可观测性的产品,观测云于2021年横空出世,并在2022年进入高速成长期,取得市场支流用户群体的宽泛关注和认可。 观测云能够从每一个业务零碎登程,全面构建全链路的可观测性,包含端到端的用户体验追踪,理解利用内函数的每一次调用,全面监控云时代的基础设施,疾速发现零碎的平安危险。通过齐全凋谢的仪表盘定制能力,帮忙工程师们疾速展示数据可视化。同时,反对集成超过300种技术栈,及全面适配所有的云平台和云原生环境。 Ampere Computing “芯”实例,降本增效之选实现零碎全链路可观测性的目标,是为了更好地保护系统可靠性。观测云作为一个提供可观测能力的平台,对自身的可靠性就有更高要求,并要随时解决剖析海量日志,放弃面对简单业务环境变动的高速响应。因而,观测云在高频迭代本身版本性能的同时,也始终在优化部署底座,Ampere Computing计划的呈现,为观测云提供了新的部署抉择。是否能在放弃SaaS平台可靠性、性能和平安的前提下,通过尽可能少的适配革新,实现整体降本增效呢?测试结果显示,在同样的vCPU数量和内存配比环境下,观测云部署在Ampere Computing实例上的版本,通过的性能压测数据进步20%左右;在价格方面,Ampere Computing实例单价低于传统实例超过20%,即对于观测云来说,抉择Ampere Computing作为SaaS部署底座,能够立刻取得性能晋升与老本升高的双重劣势。 在兼容性方面,Ampere Computing实例全副跑通观测云需依赖的内部技术栈,能够做到无缝迁徙。尤其对Redis、ES等支流存储,在做到完满兼容状况下,还实现了局部优化。随着观测云对ARM指令集的继续深度优化,性能还有更进一步晋升后劲。 观测云CEO蒋烁淼示意:“咱们本来就想试试,把观测云底座运行在ARM平台上是否能降本增效。基于Ampere Computing 芯片的云服务器实例的呈现,给了咱们惊喜和新的思路。咱们立即着手测试,适配ARM指令集过程很迅速,而且后果十分优良,带来了近40%的性价比晋升,并且他能全副兼容咱们所应用的技术栈,代码简直不必调整。这阐明Ampere Computing 的技术能力和生态体系都值得信赖,所以咱们立刻把观测云的一套SaaS底座迁徙了下来,之后的迭代版本也会继续在Ampere Computing 平台上公布,心愿能和Ampere Computing 一起共创更深度单干。” 将来观测云将持续强化本身核心技术能力,与Ampere Computing独特打造更具劣势的产品计划,让技术普惠更多用户。 4.28 观测云产品发布会 观测云将于4月28日20:00 以对话直播模式举办以“TO ALL ENGINEERS”为主题的2022观测云产品发布会。诚邀宽广工程师敌人共赴产品发布会盛宴,在线共享和探讨IT工程师新思维冲破之路。本场产品发布会现已凋谢预约!长按辨认下方海报二维码,您将:l领先预约本场发布会直播l退出观测云社群与技术大咖畅聊l第一工夫取得观测云产品动静l观测云技术团队在线答疑   赶快增加奥布斯小助手报名吧!(会后更有惊喜好礼支付哦!赶快报名预约!)

April 22, 2022 · 1 min · jiezi

关于运维:观测云登陆阿里云计算巢共建ISV新生态

2022年3月18日,观测云通过阿里云“云合打算”搭档认证,同时成为登陆阿里云计算巢平台的首家可观测性解决方案ISV。 https://partner.aliyun.com/ma...一、深度交融优势互补,共建利用新生态计算巢服务(Compute Nest)是阿里云凋谢给企业应用服务商和其客户的服务治理PaaS平台。以计算为巢,深度被集成。服务商可能在计算巢上公布私有化部署服务,为其客户提供云上软件一键部署的能力;同时也反对全托管模式的服务,赋能服务商托管其客户资源。随着云计算技术倒退进入成熟期,企业数字化过程减速,企业上云进入“全面上云”的新倒退阶段,企业应用云化正在成为企业倒退的新抉择。相比传统模式,云原生时代的PaaS/SaaS软件具备灵活性高、迭代速度快、付费多元等多项劣势,能够疾速助力企业上云,减速数字化转型。但企业在从信息化到全面云化的过程中,企业的数字化、智能化的能力均面临不少挑战:企业软件如何云化部署,各业务零碎如何集成,数据如何买通共享,用户数据安全和隐衷如何保障……从后期上云需要确认,到前期正式交付、继续运维,全面云化的复杂程度、经营老本等挑战让大量企业却步。基于此,阿里云面向ISV生态搭档凋谢计算巢服务平台,通过全新的交付模式、服务模式和经营模式,与ISV合作伙伴开展更严密的单干。其中,计算巢的虚构互联网能力在ISV合作伙伴和用户之间构建了更稳固、更平安、更高性价比的私网连贯,保障了服务的安全性,更好地实现集成,一起服务好更多的云上客户。阿里云弹性计算体验与控制系统负责人田涛涛示意:“观测云是目前国内能力十分全面的可观测性解决方案的提供商,咱们非常高兴在阿里云计算巢平台上与观测云达成了深度单干。通过计算巢的赋能,实现了高效的自动化部署以及灵便的按量计费模式,为用户提供更加便捷的抉择。将来,阿里云计算巢将保持实际‘以计算为巢,深度被集成’主旨,与观测云持续深刻单干,为客户发明更大价值。”二、全面可观测,观测云让数据赋能企业观测云是⼀个具备可观测性的统⼀实时监测平台,可帮忙客⼾疾速实现零碎可观测,是国内率先实现SaaS化的可观测性产品,为客⼾的业务长时间在线不中断,提供数据化⼿段的全链路保障服务。观测云以外围自研产品为根底,凋谢API多元化集成,施展云计算技术能力,实现自动化部署、一键智能诊断、一体化监控预警等性能,实现自动化资源创立和利用部署。观测云作为一个⼀体化零碎可观测平台,用数据驱动所有,统⼀满⾜云、云原⽣、应⽤及业务上的监测需要。随着云服务器和云原生利用的一直减少,企业与工程师对系统监测的可观测性、可靠性提出更高要求。观测云凭借多年积淀的技术、资源和业余能力,在国内可观测性畛域已获得当先劣势,真正做到让数据赋能企业,实现数字化转型。观测云CEO蒋烁淼示意:“通过这次与阿里云计算巢的单干,解决了咱们以往面对私有化实例交付的两大难点:一是领有阿里云的背书,排除了客户对diy基础设施的安全性和可靠性的担心;二是观测云自身是一个性能高度弹性利用,计算巢的资源编排性能和咱们完满符合,满足了客户随时弹性扩容、按量计费需要。心愿更多的ISV能像咱们一样,享受到阿里云计算巢带来的劣势。”将来,观测云将继续加强技术创新与产品研发,踊跃拥抱阿里云ISV生态,将单干推向新的高度。 点击理解发布会详情:https://www.guance.com/produc...

April 21, 2022 · 1 min · jiezi

关于运维:JuiceFS-缓存预热详解

缓存预热是一个比拟常见的概念,置信很多小伙伴都有所理解。对于 JuiceFS 来说,缓存预热就是将须要操作的数据事后从对象存储拉取到本地,从而取得与应用本地存储相似的性能体现。 缓存预热JuiceFS 缓存预热是一种被动缓存伎俩,它能够将高频应用的数据事后缓存到本地,从而晋升文件的读写效率。 应用 warmup 子命令预热缓存: juicefs warmup [command options] [PATH ...]可用选项: --file 或 -f:通过文件批量指定预热门路--threads 或 -p:并发线程,默认 50 个线程。--background 或 -b:后盾运行只能预热曾经挂载的文件系统中的文件,即预热的门路必须在本地挂载点上。预热一个目录例如,将文件系统挂载点中的 dataset-1 目录缓存到本地: juicefs warmup /mnt/jfs/dataset-1预热多个目录或文件当须要同时预热多个目录或文件的缓存时,能够将所有门路写入一个文本文件。例如,创立一个名为 warm.txt 的文本文件,每行一个挂载点中的门路: /mnt/jfs/dataset-1/mnt/jfs/dataset-2/mnt/jfs/pics通过文件批量指定预热门路: juicefs warmup -f warm.txt缓存地位取决于操作系统,JuiceFS 的默认缓存门路如下: Linux:/var/jfsCachemacOS:$HOME/.juicefs/cacheWindows:%USERPROFILE%\.juicefs\cache对于 Linux 零碎,要留神默认缓存门路要求管理员权限,普通用户须要有权应用 sudo 能力设置胜利,例如: sudo juicefs mount redis://127.0.0.1:6379/1 /mnt/myjfs另外,能够在挂载文件系统时通过 --cache-dir 选项设置在以后零碎能够拜访的任何存储门路上。对于没有拜访 /var 目录权限的普通用户,能够把缓存设置在用户的 HOME 目录中,例如: juicefs mount --cache-dir ~/jfscache redis://127.0.0.1:6379/1 /mnt/myjfs将缓存设置在速度更快的 SSD 磁盘能够无效晋升性能。内存盘如果对文件的读性能有更高要求,能够把缓存设置在内存盘上。对于 Linux 零碎,通过 df 命令查看 tmpfs 类型的文件系统: $ df -Th | grep tmpfs文件系统 类型 容量 已用 可用 已用% 挂载点tmpfs tmpfs 362M 2.0M 360M 1% /runtmpfs tmpfs 3.8G 0 3.8G 0% /dev/shmtmpfs tmpfs 5.0M 4.0K 5.0M 1% /run/lock其中 /dev/shm 是典型的内存盘,能够作为 JuiceFS 的缓存门路应用,它的容量个别是内存的一半,能够依据须要手动调整容量,例如,将缓存盘的容量调整为 32GB: ...

April 19, 2022 · 1 min · jiezi

关于运维:Dubbo-编程之夏报名启动了

咱们很快乐地发表 Apache Dubbo 已正式作为独立我的项目参加到 GSoC 2022(2022 谷歌编程夏令营)中,以后贡献者报名阶段也曾经正式启动,如果您对 Dubbo、对 GSoC、对开源感兴趣,欢送报名参加。值得注意的是往年 GSoC 规定的一个变动:往年的流动同时对在校大学生、社会员工凋谢。也就是说,只有是对开源和编码感兴趣的开发者就能够报名加入 Dubbo 我的项目夏令营。 这曾经是 Apache Dubbo 社区第 3 次加入谷歌编程夏令营了,之前两届都获得了圆满的胜利。一方面 Dubbo 社区收到了很多颇有价值的奉献;另一方面通过与社区及导师的单干,贡献者集体机技能与视线失去了很大的晋升,一些参与者在后续的继续奉献过程中被提名为 Apache Dubbo Committer/PMC,也借此收到了很多优良企业抛出的工作邀请橄榄枝。 对于 GSoCGoogle Summer of Code 暨谷歌编程夏令营是一个全球性的编程我的项目,专一于为开源我的项目引入新的贡献者。GSoC贡献者在导师的领导下,与一个开源组织单干进行为期 12 周以上的编程我的项目。自2005年以来,谷歌代码之夏打算曾经将来自 112 个国家的 18000 多名新的开源贡献者与来自 118 个国家的 17000 多名导师分割起来。Google Summer of Code 为 746 个开源组织提供了超过 4000 万行代码。 在谷歌代码之夏期间,参加的贡献者与来自开源组织的导师结对,接触真实世界的软件开发技术。贡献者将从经验丰富的开源开发人员那里学习,同时为事实世界的我的项目编写代码!提供大量津贴作为处分。参加的组织应用该我的项目来辨认和引进新的、激情的开发者。在 GSoC 完结后的很长一段时间里,这些新开发人员中的许多人将持续为他们的新社区和开源做出奉献。 GSoC 残缺流程以下是申请并参加到 GSoC 中的根本流程,如要链接 2022 具体时间表,请参考文后报名须知大节。 • 贡献者提交报名申请贡献者找到感兴趣的开源社区与议题,针对议题撰写提案并提交。 • 贡献者 Proposal 评估开源社区与导师收到提案后,启动评估流程。 • 贡献者 Proposal 评估后果颁布开源社区与导师与 Proposal 贡献者取得联系,对于评估通过的。 ...

April 19, 2022 · 1 min · jiezi

关于运维:4月28日一场为IT工程师们准备的盛宴

在云原生时代,云原生、麻利开发、CI/CD、边缘计算等一系列新理念和新技术日益成熟,这些不拘一格的新技术为IT工程师们带来种种幸福的同时,也随之带来了新的困扰!开源工具分支版本繁多,云上资源配置随时变动,技术栈版本高速迭代,使零碎环境每时每刻都充斥不确定性,但保障系统的稳定性依然是IT工程师们的首要职责,应用传统的监控工具已难以适应,它们通常只能发现已知的故障。对于未知的问题,往往在曾经造成微小的影响后才豁然开朗。要保障系统可靠性,必先实现零碎可观测性,这已成为当代“系统可靠性”工程师们的共识。观测云正是填补了国内可观测性理念和技术规范的空缺,缩短了与国内前沿实践、尖端技术之间的间隔,为国内可观测性技术的倒退贡献力量。4月28日20点整,观测云产品将首次亮相。为了让宽广IT工程师们全方位理解可观测性,本场发布会将以线上模式进行,并将在InfoQ、流动行、稀土掘金、CSDN、SegmentFault 、云技术、阅码场、DataFun等平台实时直播互动。(特地鸣谢云原生计算基金会、开源GitOps产业联盟的反对!)2022观测云产品发布会,是观测云团队赠予每一位IT工程师的一份礼物。一个成熟的技术团队如何通过把握数据视角去剖析及构建本人的可观测性平台?如何从0-1去构建本人的零碎可观测体系? 2022年4月28日早晨20:00,让咱们一起去摸索,去寻找答案!

April 18, 2022 · 1 min · jiezi

关于运维:阿里云Elasticsearch可观测性线上工作坊开课啦还能免费领取集群

简介:实在场景,实操短训,限时收费支付阿里云Elasticsearch集群~ 本可观测性解决方案是基于阿里云 Elasticsearch服务的一站式解决方案,具备齐备的日志、指标、APM 和用户体验仿真采集能力,能够在大规模云原生的环境下实现基于服务质量指标的运维治理。本实战工作坊基于多层架构的宠物诊所为示例利用,手把手的疏导参与者搭建可观测性治理平台,体验分档次的收集整合、剖析、关联和搜寻运维数据的全过程。 退出咱们流动工夫:4月20日 14:30 直播地点:钉群直播 退出形式:钉钉扫描海报二维码 特邀讲师:刘征,Elastic 开发者布道师,《DevOps Handbook》《The Site Reliability Workbook》译者;精通DevOps/SRE/ITSM等理论体系和相干实际等落地实现。 您将取得Elastic 开发者布道师直播解说,手把手传授计划整个搭建过程,在线答疑一次性搞清 Elastic Stack 整个技术栈的构造和用法基于实在的多层利用的全套实操练习,学习所得可复用至生产环境构建一个实在的服务水平指标(SLO)监控大屏实操筹备阐明1、创立一个阿里云 ES 集群一个(倡议新建,版本符合要求的话能够利旧)。 收费申领链接:https://www.aliyun.com/product/bigdata/elasticsearch2、提前准备好一个 CentOS 7/8 虚拟机,虚拟机最低 4GB 内存,倡议8GB新建虚拟机,可利旧。 3、ES集群和虚拟机最好在同一个网络中,所有端口都能够通信。 版权申明:本文内容由阿里云实名注册用户自发奉献,版权归原作者所有,阿里云开发者社区不领有其著作权,亦不承当相应法律责任。具体规定请查看《阿里云开发者社区用户服务协定》和《阿里云开发者社区知识产权爱护指引》。如果您发现本社区中有涉嫌剽窃的内容,填写侵权投诉表单进行举报,一经查实,本社区将立即删除涉嫌侵权内容。

April 18, 2022 · 1 min · jiezi

关于运维:2022观测云产品发布会前瞻中国工程师的可观测技术困境如何破局

以“TO ALL ENGINEERS”为主题的2022观测云产品发布会,预约于2022年4月28日 20:00 以对话直播模式收场。这是2022年国内软件行业的首个以全线上模式举办的重磅级产品发布会。观测云CEO蒋烁淼将在线与工程师们相聚,介绍观测云最新版本性能,公布观测云2022年度新策略,独特瞻望国内可观测性畛域倒退的美好未来。 受寰球疫情的影响,传统线下汇集型信息交互模式逐步转向线上平台,云计算行业由此进入黄金发展期。使业务在线化,已成为各行业寻求数字化倒退的默认共识。 在云计算大背景下,ITOM、DevOps、SRE等理念纷纷被催生壮大。在这股技术倒退浪潮中,作为保障数字化平台可靠性的最佳实际之一的“可观测性”更是异军突起,引得寰球各大厂商纷纷投入关注。纵观整个2021年,新公布产品工具成千上万,监控工具Datadog凭借基础设施治理和应用程序性能察看能力一举成为该畛域内超级巨头,市值一度超过VMware。 那么,国内的可观测性相干生态已倒退到哪个阶段,前沿技术有哪些劣势,具备可观测性的产品有哪些亮点,对国内工程师有哪些意义,这场发布会或者能给咱们一些答案。 作为中国可观测性畛域的准独角兽——观测云,一直夯实产品性能,延展产品边界,已为金融、游戏、批发、SaaS、工业、SRE等行业提供联合利用和业务多维度需要个性,从基础设施、中间件、数据库、利用服务端代码到客户端都具备完整性、一致性的可观测性解决方案与技术服务,取得海内外企业与技术团队的统一好评。 为进一步纵深推动云计算行业倒退,减速中国工程师在“可观测性”的认知拓展与技术利用,2022年观测云产品重磅降级,全新定义为“疾速实现零碎可观测,对立满足云、云原生、利用及业务上的监测需要”的SaaS产品,用数据观测零碎可用性,帮忙宽广工程师通过观测云让简单零碎变得有条理,保障数量宏大的用户体验,享受软件工程品质更高、迭代更顺利的可观测体验。 4月28日20:00,观测云诚邀您共赴产品发布会盛宴,在线共享和探讨中国工程师新思维冲破之路。

April 11, 2022 · 1 min · jiezi

关于运维:足不出户搞定交付独家交付秘籍第二回

简介:在后疫情时代,遇到无奈出差、无奈访客时,如何保障交付按时保质的进行,做好运维品质的保障,从而不影响企业整体营收,已成为咱们生死攸关的难题。小锤在遇到无奈只通过近程就实现我的项目交付验收,以及无奈近程反对运维保障时,他们是如何胜利该问题的呢,本文将一一讲述! 作者:晨念、聪言、新钰 大家好,我是专一于软件应用交付的交付王小锤!咱们交付铁三角团队(专一交付的我、开发老哥铁子、售前大佬强哥)又来了。 作为一家提供大数据分析服务的 ISV 企业,面对国内仍旧严厉的疫情局势,以及不可预估的关闭管控,返回客户现场已不再便捷。因无奈出差而导致的我的项目延期交付时有发生,而对于产品的后续运维也经常因无奈到客户现场,进行无效排查而导致业务不稳固等问题产生,导致客户口碑载道。 企业口碑直线降落,业绩节节下滑,企业整体营膨胀减,处境变得越发艰巨,曾经到了思考是否进行人力缩减来降低成本的境地,因而在疫情导致无奈出差、无奈访客的大背景下,如何保障交付按时保质的进行,做好运维品质的保障,从而不影响企业整体营收,已成为咱们生死攸关的难题。 生死攸关之战近程交付难每当疫情忽然严厉之时,咱们的产品交付就变得尤为艰难。这不,那天咱们原打算去上海现场交付,忽然看到上海「隔江而治」的封控治理政策,我登时感到交付所面临的挑战进一步严厉了。我对铁子和强哥道:“这次的产品交付原定下周三收尾,按计划登程去现场交付的话齐全来得及,但当初受疫情影响,何时去到客户现场进行交付还不得而知,只管近程也可实现 70 %-80 %的交付工作,但无奈齐全实现近程交付的落地应用,到时又产生延期交付,定会让客户对咱们产生不靠谱的印象。不止如此,我的项目未收尾,尾款未入账,你们想想,咱们以前 10 号的工资都延到 20 号发了,恐怕是公司资金周转不开了。” 近程运维难就在我与铁子还有强哥诉苦时,手机响起了刺耳的铃声,并不是我的铃声不悦耳,而是近期接到的电话广泛都是客户现场打来的,让咱们去进行后续运维保障工作。我接起电话,安抚着客户,放下电话,果然不出所料,又是一通客户现场呈现问题的电话,不巧的是这又是位上海客户。客户埋怨现场始终显示告警信息,而咱们只能约客户一会儿开个视频,近程领导他们本人入手敲命令行来进行修复。”说到这,我长叹一声,“好难啊~~”。 营收业绩继续降落售前强哥看我在唉声叹气,起身拍着我的肩膀刺激道:“我也好不到哪儿去。只管国内疫情放慢了数字化转型的步调,去年的咱们也抓住了这一时机,促成许多企业在进行转型或云上迁徙的时候抉择咱们,所以去年整体企业也迎来了规模化倒退,签了好多单子,然而这也间接促使往年,你们须要交付的软件应用很多很多,于是乎你们才会面临规模化交付的问题。 而往年因为很多单子延期交付、运维保障没有做的很好,公司效益不太好,老板给咱们施加了很大的压力,让咱们售前团队想尽一切办法来进一步的拓宽市场,签更多的单子,所以我往年出差特地多,时不时就须要去进行客户访问,来促使商务单干事项的达成,而当初疫情期间,为了积极响应国家疫情防控政策,咱们便很少去跨省出差与访客了。哦,对了,你们据说了吗?我听小道消息说,老板前段时间和 hr 老大探讨,说再这样上来可能要思考缩减人力老本了,当初咱们售前这边的人压力都特地大,人人自危!” 看着我和强哥在互相诉苦,头发日渐稠密铁子忽然想起前几日还在为交付品质问题兵戎相见的咱们,被动分割云原生利用交付平台 ADP (以下简称 ADP)的阿莫寻求帮忙的事件。于是咱们火速连线阿莫,看看可有什么良策助咱们渡过难关。近程会议接通后,咱们将当初的难题告知阿莫,阿莫听完也没有旁敲侧击,间接给出了咱们解决的对策。 地道战——在离线通道透过摄像头,阿莫看向着急的我说道:“小锤,咱们交付和运维的时候须要出差是常事,近程实现齐全的交付和运维对你们来说是难事。然而别慌,咱们 ADP 有个神招式,招式不起眼,然而成果极强,助力你们近程搞定交付与运维。” 我忙说:“快说来听听”。只见阿莫镇定自若的说道:“ ADP 提供在离线通道能力,能够帮忙实现近程交付运维、应答规模化交付问题。 高效实现近程交付与运维利用的交付和运维,往往须要相干人员返回客户现场反对,而当无奈返回的时候,也就意味着进度停滞不前,存在我的项目延期的危险。 作为 ISV 的你们应该更分明,交付进来的产品往往不是通过繁多产品就能够实现客户需要,可能须要交融多款数据类型的产品,须要多个团队协同交付,而当你们无奈直接触达客户现场,但问题须要关联方协同解决时,现场人员就须要一直转述问题,并依据批示实现操作,这让大家的效率大打折扣。 ADP 通过在客户环境和阿里云建设一条平安、稳固的在离线通道,提供了中转客户现场的高速公路,来解决上述问题。 基于该通道: 交付人员可能近程勘验交付环境,100%近程实现部署利用并实现交付验收。运维人员可能近程诊断问题,近程疾速响应并实现运维操作。遇到须要协同排查的状况,关联方也能疾速理解现场信息,问题的解决霎时变得高效了。轻松应答规模化交付咱们当初企业发展势头良好,其实许多产品曾经进入到规模化交付阶段,面对扩散在全国各地的大量交付我的项目,方才你们还提出如何更为高效地治理每个我的项目的利用版本的问题。 这个问题的话,通过 ADP 的在离线通道能力,是能够为客户提供对立治理集群的能力的,这样你们便可能轻松追踪、治理数百个交付我的项目的版本。 也就是说,即便铁子对利用进行版本升级,你们也不须要一个局点一个局点的出差去交付部署了,而是可能批量进行操作,足不出户就能实现所有我的项目的利用更新。 劣势: 降本提效:开启近程交付/运维新模式,晋升企业交付效率,升高人力老本,助力实现规模化交付。平安可控:提供稳固、灵便、可控的连贯通道,保障交付运维安全性。简略易用:无需治理云资源,一键实现通道初始化。”阵地战——行业解决方案核心阿莫持续道:“听方才你们的形容,在当初疫情期间,你们因为交付不顺利所带来的业务压力很重大,而咱们有一个行业解决方案核心这样的平台,你们能够理解下。 在线化平台搭建,实现商务停顿推动作为大数据行业的 ISV,预计你们已发现,在帮忙用户实现数字化转型时,很难只靠一个产品或者一个团队就可能实现全链路反对,其实往往须要 独立软件开发商、软件集成商以及交付服务商独特单干,来产出相应的行业解决方案。当解决方案确定后,这时候你们预计会想,就算是线上搞定行业解决方案的搭建,但还须要面临后续的商务演示、对客 POC 等一系列商务对接,售前还是须要去到客户现场,强哥的出差在劫难逃。 打造商务经营阵地,实现规模化倒退NO,NO,NO!对于 ISV 的你们,或者软件集成商而言,ADP 解决方案核心则能够作为产业供需的纽带,帮忙建设厂商跟行业终端用户之间的高效商务联接。你们能够领有本人产品的规模化经营阵地,将你们的产品疾速整合,作为一个整体,疾速的实现解决方案的对客商务演示、POC 验收以及最终的交付部署,实现可复制、规模化的产品成单交付。 也就是说铁子,你们的开发团队在线高效将行业解决方案整合好后,将成品上传到 ADP 解决方案核心并制作不同的解决方案产品对客规格。客户无需关怀简单的交付配置,就能够像网上购物一样筛选本人须要的规格,自行在离线一键部署,实现近程商务演示、POC 体验,商务 License 受权等流程。这样,售前大佬强哥你便无需再出差。不仅如此,通过平台的天然流量还可吸引到其余潜在客户,帮忙企业规模化倒退。 跨产品高效协同,加强产品可靠性正当阿莫筹备持续说上来时,铁子插话道:“这点很好,可能近程就把商务侧的事件搞定,然而有一点,其实没有你们 ADP 解决方案核心,咱们本身将一个个产品进行打包,交付部署也能够的,就是慢了点。那上传到咱们 ADP 解决方案核心还有什么其余亮点,或者说能给咱们带来什么额定的产品增值能力?” ...

April 11, 2022 · 1 min · jiezi

关于运维:年营业额百亿的企业都在如何做数字化转型

数字化转型对企业的重要性曾经显而易见。对于很多企业来讲,数字化转型相当于在重塑企业的外围竞争力。如果没有跟上时代的脉搏,可能就会黯然来到历史的舞台。 而作为数字化转型的重要组成部分之一,AIOps的重要性曾经被越来越多企业所熟知,在数字化转型的大背景下,如何放弃企业运维力量能够高效长久的运行成为了关键所在。 以前兴许你听过很屡次对于数字化转型与AIOps的分享,也听了许多“高大上”的概念。这次,咱们不谈概念,联合云智慧在AIOps行业多年的积攒,从实际的角度给你带来一些干货,AIOps在数字化转型中,到底都干了什么,有哪些落地的案例能够参考的,这就是本次Meetup想要带给你的内容。咱们不谈概念,来点理论的。 直播预报主题:年营业额百亿的企业都在如何做数字化转型工夫:4月14日 19:00-20:00 讲师简介李诚,云智慧团体副总裁,首席布道师,超过15年以上的云计算,大数据,AIOps畛域的征询与实战经验。曾任微软首席技术架构师,戴尔云计算高级专家,是国内最早一批云计算及大数据专家,2017年开始智能运维畛域架构设计及业务实际,曾服务过泛滥顶级企业包含:中国航信,交通银行,中国人寿,碧桂园,越秀地产,珠海机场等。 听众受害金融、政府、能源多个行业实际案例分享。深度分析年营业额百亿的大型企业都在如何数字化转型智能运维分级成熟度模型解析,从Level0到Level5。让你精准定位企业目前存在的问题报名形式扫描下方二维码,增加小助手微信,备注「0414」获取直播链接!每周一场技术分享,可从小助手处获取直播主题及排期! 对于 MeetupAIOps Developer Meetup是由AIOps社区推出的,面向宽广开发者的系列线上直播及线下分享流动,咱们将汇聚AIOps社区专家团的力量给你提供优质的技术内容,无论是技术解读、开源治理、行业解决方案,置信宽广developers总能在这里找到你想要的内容。 AIOps社区是由云智慧发动,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交换社区。该社区致力于流传AIOps技术,旨在与各行业客户、用户、研究者和开发者们独特解决智能运维行业技术难题、推动AIOps技术在企业中落地、建设衰弱共赢的AIOps开发者生态。

April 11, 2022 · 1 min · jiezi

关于运维:防火墙中-drop-与-reject-的区别

drop 和 reject 都是用来回绝数据包连贯的,但 drop 和 reject 回绝的后果是不一样的。 大家能够应用以下例子来测试,而后在服务端抓包 # iptablesiptables -A INPUT 5 -p tcp --dport 8086 -j REJECT --reject-with tcp-resetiptables -A INPUT -p tcp --dport 8088 -j DROP# reject 默认是 icmp-port-unreachableiptables -A INPUT -p tcp --dport 8089 -j REJECT --reject-with icmp-port-unreachable从试验后果来看: drop:客户端 telnet 会始终发送 syn 申请包到服务器,服务端间接将数据抛弃(即黑洞掉),最终客户端会返回 Operation timed outreject tcp reset:telnet 发送 syn 包到服务端,服务端间接返回 reset 包,返回十分快。客户端显示 "Connection refused"reject icmp port-unreachable:telnet 发送 syn 包到服务端,服务端返回 icmp port unreachable 给客户端,客户端显示 "Connection refused"何时应用 DROP,何时应用 REJECT,它们的利用场景是什么样的? ...

April 8, 2022 · 1 min · jiezi

关于运维:OpenKruise-v11功能增强与上游对齐大规模场景性能优化

简介:在 v1.1 版本中,OpenKruise 对不少已有性能做了扩大与加强,并且优化了在大规模集群中的运行性能。以下对 v1.1 的局部性能做简要介绍。 作者:酒祝(王思宇) 云原生利用自动化治理套件、CNCF Sandbox 我的项目 -- OpenKruise,近期公布了 v1.1 版本。 OpenKruise[1] 是针对 Kubernetes 的加强能力套件,聚焦于云原生利用的部署、降级、运维、稳定性防护等畛域。所有的性能都通过 CRD 等规范形式扩大,能够实用于 1.16 以上版本的任意 Kubernetes 集群。单条 helm 命令即可实现 Kruise 的一键部署,无需更多配置。 版本解析在 v1.1 版本中,OpenKruise 对不少已有性能做了扩大与加强,并且优化了在大规模集群中的运行性能。以下对 v1.1 的局部性能做简要介绍。 值得注意的是,OpenKruise v1.1 曾经将 Kubernetes 代码依赖版本升级到 v1.22,这意味着用户能够在 CloneSet 等工作负载的 pod template 模板中应用 up to v1.22 的新字段等, 但用户装置应用 OpenKruise 所兼容的 Kubernetes 集群版本依然放弃在 >= v1.16。 原地降级反对容器程序优先级去年底公布的 v1.0 版本,OpenKruise 引入了容器启动顺序控制[2]性能, 它反对为一个 Pod 中的多个容器定义不同的权重关系,并在 Pod 创立时依照权重来管制不同容器的启动程序。 在 v1.0 中,这个性能仅仅可能作用于每个 Pod 的创立阶段。当创立实现后,如果对 Pod 中多个容器做原地降级,则这些容器都会被同时执行降级操作。 ...

April 8, 2022 · 3 min · jiezi

关于运维:结合场景快速了解智能运维算法体系核心知识

云智慧 AIOps 社区是由云智慧发动,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交换社区。该社区致力于流传 AIOps 技术,旨在与各行业客户、用户、研究者和开发者们独特解决智能运维行业技术难题,推动 AIOps 技术在企业中落地,建设衰弱共赢的AIOps 开发者生态。本文内容来自云智慧智能研究院的Bowen与Kappa从场景、算法、实际的角度为智能运维行业开掘了一条算法体系建设的清晰门路。 一、智能运维之问智能运维,又称AIOps,它可能将大数据、AI 机器学习和其余技术相结合,通过被动、个性化和动静的洞察力反对所有次要IT的经营性能。AIOps平台反对同时应用多个数据源、数据收集办法、剖析技术(实时和深度)和示意技术(Gartner 2016)。在搜索引擎中输出“智能运维”四个字,人们能查到有数对于智能运维算法的形容:人工智能、深度学习、时序数据、异样检测、根因定位、智能压缩、拓扑发现、问题自愈、大数据算法等新名词。读者肯定会收回这样的疑难:智能运维到底是一项技术?一种利用?还是一次实际?这些名词之间又有哪些关联? 站在这样一个信息爆炸、新名词遍地的时代,企业管理者、智能运维建设者、迷信研究者该如何去理解智能运维算法的钻研、落地和实际的实质?本文试图从场景、算法、实际的角度为智能运维行业开掘一条算法体系建设的清晰门路。 二、以数据为根底、以场景为导向、以算法为撑持“人们对新事物的认知过程总是螺旋式迭代演进的,智能运维也是如此。智能运维是运维倒退的方向,而且是一个长期的过程——从经验主义到数据驱动,再回归到业务驱动的过程”。行业内达成了高度的、更加面向事实的共识:以数据为根底、以场景为导向、以算法为撑持。 笔者认为与人工智能、大数据、区块链等技术体系不同,智能运维并不是一项“全新”的技术,而是一个以智能运维场景为根底的智能技术利用和交融,剥来到场景单谈“智能运维算法”不具备实际意义,智能运维的外围在于摸索智能技术如何转化、服务、适配运维行业的倒退、如何给运维行业带来解决问题的新思路。 在智能运维的实际中,越来越多的研究者、实践者、从业者开始意识到,解决运维畛域的问题,要依附算法翻新,但又不能仅仅依附算法翻新,“不剖析业务、不梳理场景,更新一套算法,成果晋升95%”的故事在行业内的听众越来越少,相同解决问题的算法越来越受到欢送。 三、场景与数据在解析智能运维之前,咱们无妨先了解运维的实质。运维(这里次要针对IT类运维),实质上是对网络、服务器、服务的生命周期各个阶段的经营与保护,在老本、稳定性、效率上达成统一可承受的状态[1]。借助Peter Bourgon在2017 Distributed Tracing Summit[2]对运维所面对的指标、日志、追踪及其关系的定义方法,从而对运维场景与数据进行开掘和定义: 所谓运维,就是围绕着以下三种场景所进行的常识开掘、数据统计、事件发现等具体操作。 指标、日志、追踪这三个原始数据项(即图中的三个圆)。原始数据项的转化(即图中的虚线)如日志能够产生告警、日志能够产生指标。原始数据项的组合(即图中两圆的穿插局部)如指标和追踪的交加:申请范畴内的指标状况等。基于此,运维场景能够被定义为三种类型:一元场景、转化场景和二元场景。 为了不失一般性,本文所说的“场景”指的是“形象场景”,在不同应用领域能够衍生出不同的“具体场景”。 一元场景:指标、追踪、日志繁多数据项下的场景,即上图中的三个圆。 指标:可聚合的逻辑计量单元。指标既能够是根底指标也能够是业务指标,如CPU使用率、硬盘容量、APP新增用户数等。日志:对离散的不间断事件的一种记录。日志又分为系统日志、利用日志、自在日志等。追踪:单次申请范畴内的所有信息,即调用链信息。调用链可能在零碎初始化时被定义,也可能在执行过程中被挖掘。转化场景:一元场景存在着基于信息抽取或信息强化后的转化关系,即上图中的虚线。 日志→指标:通过日志取得指标数据。如:‘2021-01-2215:06:43-algorithm_lab.py[line:38]-INFO:User Cnt 1021’就蕴含着在2021-01-22 15:06:43工夫,用户数(User Cnt)为1021这个指标数据。日志→追踪:通过对日志的聚合和转化失去追踪。日志中往往能够挖掘出事件实在的调用链信息,例如银行在实现交易事件时要求每个解决逻辑都打印交易的惟一编号(UUID),因而一个交易事件的残缺调用链能够通过日志信息获取。追踪→指标:通过调用链的剖析取得调用范畴内的指标。如工作响应工夫、工作资源耗费等指标须要通过一个残缺调用链周期能力出现。指标、日志、追踪→告警: 多个源头产生的告警。这里所说的告警并不是一个运维的根本观测项,精确的说告警是一个派生观测项,指标、日志、追踪所产生的的异样和信息均能够通过告警来出现。二元场景:通过两种根本观测项穿插所产生的场景,即上图中任意两圆的交加。 日志+指标:可聚合或合成的事件。在指标产生异样时,运维人员往往心愿通过查问此时的日志来合成出指标呈现问题的事件起因。日志+追踪:一个调用周期内的事件。在一个调用周期中产生了哪些事件或有哪些信息,须要在追踪的范畴内查找日志。追踪+指标:一个调用周期内的指标。当调用链产生异样时,往往须要这个调用中的多个指标配合来综合解决运维问题。四、算法技术来自Facebook AI研究院的团队发动了Papers with Code[3]我的项目,其致力于在机器学习畛域创立一个自在、开源的社区,提供包含学术论文、代码和评估指标在内的多种资源。他们将智能技术分为计算机视觉、自然语言解决等16个大类;1952个工作。 本文对其中的四类进行简略介绍: 计算机视觉类:是一门钻研如何使机器“看”的迷信,进一步说,是指用摄影机和电脑代替人眼对指标进行辨认、跟踪和测量并进一步做图形处理,使电脑解决成为更适宜人眼察看或传送给仪器检测的图像。作为一个迷信学科,计算机视觉钻研相干的实践和技术,试图建设可能从图像或者多维数据中获取“信息”的人工智能零碎。其在人工智能畛域利用最为宽泛,包含人脸识别、指标检测、图像分类等多个细分算法钻研畛域。自然语言解决类:钻研能实现人与计算机之间用自然语言进行无效通信的各种实践和办法。自然语言解决是一门融汇语言学、计算机科学、数学于一体的迷信。因而,这一畛域的钻研将波及自然语言,即人们日常应用的语言,所以它与语言学的钻研有着亲密的分割,但又有重要的区别。自然语言解决并不是个别地钻研自然语言,而在于研制能无效地实现自然语言通信的计算机系统,特地是其中的软件系统。因此它是计算机科学的一部分。其钻研领域包含命名实体辨认、问答零碎、情感剖析、文本生成等。时序数据类:工夫序列数据是通过对立指标按工夫程序记录的数据列。在同一数据列中的各个数据必须是同口径的,要求具备可比性。时序数据能够是期间数,也能够是点数。工夫序列剖析的目标是通过找出样本内工夫序列的统计个性和倒退规律性,构建工夫序列模型,进行样本外预测。其钻研领域包含时序数据的预测、异样检测、数据分类等。图算法:指利用特制的线条算图求得答案的一种简便算法。无向图、有向图和网络能使用很多罕用的图算法,这些算法包含:各种遍历算法(这些遍历相似于树的遍历)、寻找最短门路的算法、寻找网络中最低代价门路的算法、答复一些简略的相干问题(例如,图是否连通,图中两个顶点间的最短门路是什么等等)的算法。图算法可利用到多种场合,例如:优化管道、路由表、快递服务、通信网站等。为了不便形容,这里把常识图谱相干钻研从建模角度分类为图算法。典型的钻研场景包含:常识开掘、常识示意、最短路、最大流等算法。五、智能运维算法体系所谓智能运维算法体系,即围绕着运维场景与数据的一次AI使能。 一元场景下的智能运维算法赋能:指标+AI:利用时序数据类相干智能算法,赋能于指标计算,能够开掘指标异样检测、容量预测、衰弱度检测等场景,实现指标场景智能化。日志+AI:利用自然语言解决、分类聚类等智能算法于日志场景中,能够开掘日志解析、日志实体辨认、日志分类等场景,实现日志场景智能化。追踪+AI:利用图算法等智能算法赋能于调用链场景中,能够开掘门路曝光、调用链优化治理等场景,实现追踪场景智能化。转化场景下的智能运维算法赋能:日志→指标+AI:利用自然语言解决算法中的命名实体辨认技术,赋能于日志模式的辨认过程中,能够精准、高效辨认日志中的指标信息,实现从日志到指标的转化场景智能化。日志→追踪+AI:利用常识图谱、概率图模型等智能算法能够在一次调用周期中开掘指标信息,利用于调用链分析、过程开掘等场景中,实现从追踪到指标的转化场景智能化。指标、日志、追踪→告警 +AI:因为指标、日志、追踪均能够产生告警,反之,能够对对立事件下不同观测(指标、日志、追踪)的告警进行告警智能压缩、告警智能克制并应用实体辨认、语义辨认等技术,实现从指标、日志、追踪到告警的转化场景智能化。二元场景下的智能运维算法赋能:指标+追踪+AI:系统故障往往会影响指标数据并沿着调用链进行流传,因而利用图模型(随机游走、概率图模型)等技术能够无效进行基于指标的根因定位,实现指标和追踪场景的智能化。指标+日志+AI:当指标产生异样时,日志往往可能更清晰地展示异样产生时的零碎状态,实现指标异样剖析;同时,通过辨认日志模式,将模式变动状况应用工夫序列异样检测相干算法进行检测,实现指标和日志场景的智能化。追踪+日志+AI:当零碎产生故障时,剖析零碎调用链上的节点的日志模式、内容变动状况往往可能无效进行基于日志的根因定位,实现追踪和日志场景的智能化。六、不同场景下的智能算法举例一元场景智能化:容量预测容量预测是一个典型的针对指标这一一元场景的智能算法利用。 动静扩缩容、资源布局、磁盘容量等是指标预测常见的场景,该类场景通常属于机器学习中的回归问题,其从预测工夫长短角度可分为长期预测和短期预测。前者要求预测模型具备较低的偏差,联合现有的工夫序列合成、统计、深度学习等不同类型预测算法,可在低频成分中采纳集成学习思路进行求解;后者要求预测模型具备较低的方差,常联合短期工夫窗进行求解。求解后果联合指标边界及优化条件从而满足场景需要。 在某银行客户跑批时长预测理论场景中,以历史整体业务及子业务跑批时长数据作为训练数据,使用深度学习模型别离对整体及子业务跑批时长进行建模,对当下跑批工夫进行预测,为客户预计跑批工夫及动静调配资源决策提供无效根据。 在某航空客户的扩缩容场景中,须要通过业务量变动联合历史基础设施资源的应用对将来云端资源需要进行正当预计,使用基于时序合成和深度学习的混合模型进行建模,正当地预测出将来云端的资源需要,为客户做出正确括缩容决策提供重要依据,为客户发明价值。 值得一提的是,在指标一元场景(时序数据)的智能化过程中,该当保持“以数据为根底、以场景为导向、以算法为撑持”的建设思路,首先要从智能技术中残缺梳理针对时序数据的各流派算法(如上图所示,其能够分为基于时序数据合成的算法、基于深度学习的算法、基于回归剖析的算法),其次对算法的评估该当以实在的业务数据体现为规范,在长期的算法实际过程中,笔者及团队积攒了大量算法适配教训,通过对海量数据的试验和比照剖析,不难总结出一些理性的认知,例如:对算法效率和 并发 数要求高时,不倡议优先应用以深度学习为代表的的办法;对于没有显著周期的数据,不倡议优先应用基于 工夫 序列合成的办法;对于存在渐变等模式变动的数据,往往交融回归剖析类办法和实际序列合成的办法会有不错的成果。 转化场景智能化:日志异样检测日志异样检测是一个典型的从日志到指标再到异样检测的转化场景智能算法利用。 在理论利用中,通过对企业的邮件服务器进行日志采集之后,利用相似自然语言解决中的NER(命名实体辨认)算法,对日志进行实体辨认,提取日志中要害实体,如:工夫、IP、状态等;例如对于“登录失败”事件,日志中的形容可能是“登录失败”、“登录不胜利”等等,算法对其进行智能辨认,最终归集为“登录失败”事件的数,将其转化为指标,造成“登录失败”指标数据;随后能够通过指标异样检测算法检测到某工夫点为异样点,实现日志到指标转化场景的AI使能。 二元场景智能化:基于指标的根因定位 指标+调用链二元场景下的智能利用 基于指标的根因定位是一个典型的指标加调用链二元场景智能算法利用。 上图所示的是一个简化后的零碎调用链拓扑图,包含5台物理机、8台基于物理机的虚拟机、3个MySQL数据服务、3个Apache服务、2个业务散发节点、2个具体业务利用的运维场景。当APP1产生业务异样告警时,运维人员会沿着散发节点(vm1)、Apache(vm2)、Apache(vm4)查找问题,当发现vm2未产生异样指标告警,而vm4有相似状况后,会持续沿着vm4向下排查,找到其数据库MySQL(vm5),发现vm5也有相似异样,是否就由此推断vm5为此次异样的根因呢?有教训的运维人员会持续对vm5的依赖节点、关联节点进行排查。事实上,本次故障是因为与vm5共享物理主机的vm8产生异样而导致的“连锁反应”,真正的异样根因是vm8。那么如何系统地解决上图所示的问题?这就波及到“图”相干的算法对二元场景的AI使能过程。实际中,通过对系统进行建模(如将上图中服务建模为“点”;资源依赖、调用链依赖建模为“边”;指标的类似度建模为“边权”等)能够将简单零碎与图中的“点”、“边”、“边权”等建设映射关系,故障的流传变成了在“图”的概率转移问题,进而对根因进行辅助定位。 七、智能运维之答智能运维,是“以数据为根底、以场景为导向、以算法为撑持”的应用科学,笔者认为在具体利用实际中,不存在无场景、无数据而仅靠算法就可能解决的问题。如果有,那么这是一套“魔法”而不是一套“算法”。同时,依据上文所述的系统化算法体系建设计划,咱们置信,也始终在见证算法在具体的场景中找到“用武之地”,施展决定性作用,并最终解决运维畛域中的问题。 如上图所示,通过本文的论述,咱们对智能运维算法体系的了解不应仅是右下角的“大类”与“子类”算法名词的沉积,而应该是系统化的、层次化的体系结构,并与一元场景、转化场景、二元场景产生对应关联。只有建设这样“平面”的算法体系结构,能力防止自觉追寻“热词”,从场景、数据、算法多层次进行智能运维算法体系布局。无场景、不智能,云智慧将沿着这样的算法体系一直耕耘,期待与所有客户、从业者、研究者共享智慧、共享智能技术带来的一次科技盛宴。 参考文献 [1] 百度百科, https://baike.baidu.com/item/%E8%BF%90%E7%BB%B4 [2] Peter Bourgon, https://peter.bourgon.org/blog/2017/02/21/metrics-tracing-and-logging.html ...

April 7, 2022 · 1 min · jiezi

关于运维:系统性能分析从入门到进阶

作者 | 勿非 本文以零碎为核心, 联合日常工作和用例, 由浅入深地介绍了性能剖析的一些办法和领会, 心愿对想理解零碎性能剖析的同学有所帮忙。 入门篇资源角度USE产品跑在零碎的各种资源下面, 从系统资源的角度入门性能剖析是个不错的抉择, 咱们以业界出名大牛 Brendan Gregg 的 USE 办法开始, USE 特点就是简略无效适宜入门, 用 Brendan 的话形容 USE 的成果: I find it solves about 80% of server issues with 5% of the effort.USE 从系统资源的角度, 包含但不限于 CPU, 内存, 磁盘, 网络等, 关注以下3个方面: • Utilization (U): as a percent over a time interval. eg, "one disk is running at 90% utilization". 大多数状况能够正当揣测利用率高可能会影响性能 • Saturation (S): as a queue length. eg, "the CPUs have an average run queue length of four". 资源竞争的强烈水平 ...

April 6, 2022 · 13 min · jiezi

关于运维:招商银行-KubeVela-离线部署实践

招商银行云平台开发团队自 2021 年开始接触 KubeVela,并摸索 KubeVela 在招商银行云平台的落地实际,借此晋升云原生利用交付与治理能力。同时因为金融保险行业的特殊性,网络安全管控措施绝对严格,行内网络无奈间接拉取 Docker Hub 镜像,同时行内临时没有可用的 Helm 镜像源。因而,要想实现 KubeVela 在行内公有环境的落地,必须进行齐全的离线部署。 本文将以 KubeVela v1.2.5 版本为例,介绍招商银行 KubeVela 的离线部署实际,来帮忙其余用户在离线环境中更便捷的实现 KubeVela 的部署。 KubeVela 离线部署计划咱们将 KubeVela 的离线部署次要分为三局部,别离是 Vela Cli、Vela Core 以及 Addon 的离线部署,每一部分次要波及到相干 docker 镜像的加载及 Helm 的 repackage,通过该离线部署计划,可能大大放慢 KubeVela 在离线环境的部署。 在离线部署前请确保 Kubernetes 集群版本 >= v1.19 && < v1.22,KubeVela 管制立体依赖 Kubernetes,能够搁置在任何托管 Kubernetes 作为底座的产品或自建 Kubernetes 集群中。同时你也能够应用 kind 或 minikube 在本地部署、测试 KubeVela。 Vela Cli 离线部署• 首先,须要通过 KubeVela 的公布日志[1]下载你所需版本的 vela 二进制文件• 解压二进制文件,并且在 $PATH 中配置相应的环境变量• 解压二进制文件• tar -zxvf vela-v1.2.5-linux-amd64.tar.gz• mv ./linux-amd64/vela /usr/local/bin/vela• 设置环境变量• vi /etc/profile• export PATH="$PATH:/usr/local/bin"• source /etc/profile• 通过 vela version 验证 Vela Cli 的装置,并查看输入 ...

April 6, 2022 · 2 min · jiezi

关于运维:运维老师傅问题排查经验总结

腾讯蓝鲸智云,简称蓝鲸,是腾讯互动娱乐事业群(Interactive Entertainment Group,简称 IEG)自研自用的一套用于构建企业研发经营一体化体系的 PaaS 开发框架,该套体系不仅提供了根底运维(公布变更、监控解决、数值调整、数据提取等)的无人值守服务,而且还给运维人员提供了解决方案(工具),并随时调整,防止重复性的操作服务。导语看似无章可循问题进行排查时能够说是世界上最缓和且难度、强度最大的工作之一,尤其面对极高支出的业务、海量服务经营,带来极大的恐慌感并引发肾上腺素飙升,压力的存在可能诱发咱们犯下的低级失误。克服这种白痴般的本能,咱们须要克服本人快要暴发的一腔怒火、强制本人以井井有条的形式逐个发展尝试。其实做运维练就的是一种心态,足够淡定遇事而不乱,从容应对才是真。排查出问题并找到根本原因加以解决,集体认为是一件很成就感的事件。已经有人问过我:“你是怎么想到问题呈现在xxx的?又是怎么确认根本原因是xxx的?”,我只能轻描淡写的答复:“靠教训”,而后感觉这个逼装得还能够。其实这里说的“靠教训”是很含糊的,始终以来大家可能都感觉排查问题要靠教训,然而又说不出具体通过什么样的教训排查出了问题,最初让排查问题逐步变成了一门玄学。其实问题排查工作往往遵循一些通用且不成文的实际规定,并不是一门所谓的玄说,联合本身经验、总结,心愿能为大家的理论工作带来助益。 从入行到当初,遇到过各式各样,千奇百怪的问题,然而每个业务状态和零碎均不一样,咱们往往能搜寻到很多某一个或一类问题解决办法,但集体感觉认知办法、教训难复制,所以抽(套)象(路)说说对于“问题排查”的方法论,心愿能与您产生更多的共鸣。 一、排查问题犹如破案运维排查线上问题犹如警察破案一样,是一个不停剖析线索,推理的过程,但在筹备排查问题之前,咱们应该明确三个认知: 认知,简直是人和人之间惟一的实质差异。 —— 傅盛《认知降级三部曲》零碎出现异常是失常 时至今日计算机系统曾经变得异样简单,一次用户申请可能要通过发送申请,DNS解析,运营商网络,负载平衡,服务器,虚拟机(容器),视业务逻辑的复杂程度可能还要调用组件,缓存,存储和数据库等。每个环节都可能呈现问题,有的组件又是分布式的,大大增加的排查问题的难度,所以呈现问题后不要慌,放弃好的心态。首要任务是复原零碎“飞机在产生紧急情况下,飞行员的首要任务是放弃飞机航行,相比保障乘客与飞机平安着陆,故障定位和排除是主要指标”,所以复原线上零碎是首要任务,而不是立马找到它产生的起因。假相永远只有一个计算机是一门迷信,而且计算机的世界里都是由0或1组成,在这个世界里只有是或否,没有两头地带,所以在计算机世界凡事都有根本原因,没有偶尔产生,一切都是必然。二、理解案情,评估大小先评估出这个问题的影响范畴,是全网,某些地区,还是某条链路不可用的问题,还是很多业务线都呈现问题,评估出案情的大小,到底是一般的民事案件,还是刑事案件。 三、理清线索,整顿剖析理清手头已失去的信息或线索,比方监控上有网络报警,有用户反馈无法访问,有开发人员反馈服务器有问题,同时间段有做变更等等,尽量不要漏掉这些看似无关紧要的线索,把这些线索先整顿下来,前面一并剖析。 推理的过程,就是依据已知线索,通过正当的设想、推断得出一个惟一的后果。线索是整个推理过程的终点,线索给出的好有不好、是否有谬误,间接会影响推理的品质,因而是最根底、也是最重要的一环。线索的梳理,最常犯错误就是信息有余,主观臆断。四、扩充你的信息量被动扩充信息的接管面,比方问询一下开发或算法同学,明天有没有做线上改变,网络组有无重大调整。从中获取到有价值的信息点,对于排查问题至关重要。查看监控,细看某个监控项的变动,追踪日志和调试信息都是扩充信息量的伎俩。 拓展知识面,空闲工夫多些理解相关联系统,比方架构,部署,逻辑等。一旦故障产生,探讨中也可提供你解决办法的思路,触类旁通,推动问题的排查与解决。五、剖析证词,甄别对错如果是内部提出的问题,比方业务投诉,用户反馈等信息,有时候是可信的,有时候人却是不可信的,举个例子之前有开发反馈成果有问题,有些广告位bias异样,有些失常,让咱们帮查查零碎的问题,然而最初是代码调用一处动静配置造成的。有些时候反馈的信息,是通过形容者过滤加工过的信息,他的排查和剖析有可能把你带偏了,在收集信息同时须要以扫视、狐疑的态度,剖析每个人的证词。 每个人的学习能力其实都很强的,随着教训的积攒,甄别证词能力也会逐步晋升。六、看清问题实质“听到马蹄声时,猜马,不要猜斑马”看到一件景象或一件事件,要看本质而不只是外表的货色,听到马蹄声时候猜是什么马,是什么人的马,是来干什么的而不是猜它是斑马还是白马还是黑马。 排查问题也一样切忌先入为主,有时候看似不可能产生、极其简略的事件可能就是最终起因,不要轻易的排除掉某项起因,比方“宇宙射线引发SSD数据谬误”。 很早之前碰到过一个某svr耗时高问题,查了很久也做了一些调优仍然不奏效,最初发现其实是网卡跑满了。七、确定方向,发展定位确定侦察方向,如从大到小,从上到下排查步骤,从大到小先看比方IDC网络,机房状态等比拟宏观的中央是否有问题,逐个排除,逐渐放大问题范畴。从上到下先从景象产生的顶端调用链逐个排查,逐渐向下深刻。 并不是所有问题都从大到小从上到下,宏观问题只有达到一定量级才会引发”量变”,从而引起的留神,在通往量变过程中,你的业务可能曾经收到某中影响而体现的很明确,此时须要宏观剖析,而后再逐步到宏观来诊断。八、总结记录,破案归档好忘性不如烂笔头,然而在一片凌乱问题剖析当中,让运维平心静气地记录下问题与判断的确有点不切实际。但即使如此,咱们依然能够在事件完结后为保留一份剖析材料,总结并记录处理过程中的执行步骤以及解决路径,则能帮忙本人和团队积攒贵重的解决教训。 以上办法流程翻译成运维术语: 九、吃一堑长一智出了问题并不可怕,怕的是咱们从问题中学不到什么,怕的是相似的问题重现,进步问题定位的效率,有哪些值得去做,比方: 建设长效错误码机制,应用具统计、可视意义的数字来简短形容谬误含意和领域,正所谓稀释就是精髓,这一点在错误码屡试不爽。失常程序中打谬误日志次要是为了更好地排查问题和解决问题,提供重要线索和领导。然而在理论中打的谬误日志内容和格局变动多样,谬误提醒上可能残缺不全、没有相干背景、不明其义,使得排查解决问题成为十分不不便或者耗时的操作。而实际上只有开发稍加用心,也需就会缩小排查问题的很多无用功。如何编写无效的谬误日志,建设日志规范,也是十分有利于问题剖析的。定位问题防止二次侵害,当某个看似难以捉摸的难题呈现时,本能可能是重启,尽快让零碎恢复正常。尽管这样的形式常常可能解决问题而且起效神速,但同时也很可能把状况推向令人难以置信的好转深渊。问题排查伎俩包含重新启动不稳固零碎、尝试自动记录数据库、文件系统修复等等,这些形式往往的确能搞定难题并让零碎重回生产轨道,但同时也没准导致数据恢复致力付之东流,毁掉确定问题根本原因的机会甚至大大缩短关键性零碎的停机工夫。保留现场也十分重要,跟破案现场要要求现场勘察、样本采集、排查、锁定一模一样,对于难以重现问题,尽量创造条件保留了能够用于故障重现的数据或现场。线上环境复杂多变,尽管这一点并不能马上解决问题起到间接作用,但保持这种解决思路,为开发和测试创造条件,升高因难以重现的疑难故障的挂起率,最终有助于业务的长期稳固。建设集中的数据可视平台,不至于遇到问题才开始着手剖析,若是对业务没有足够的理解又没有数据依赖,就很可能在解决问题时雪上加霜。建设沙箱影子零碎,模仿复杂多变的现网环境,躲避线上影响,重现或压测问题,如:TCPCopy、DubboCopy等搭建开源的日志可视计划,帮助咱们去解决最初”一公里”的问题,常见如:ELK、Log.io等善其事必先利其器,常见零碎排查工具Perf、IPTraf、Netperf、TcpDump、GDB、Pstack、jstack、strace,top、iotop、Tsar等… …十、结语总结这几年解决问题的一些思路和教训,能够演绎提炼如下几句: 收集信息,随时记录;协调资源,把控影响;沉着判断,从容剖析; 大胆假如,审慎尝试; 踊跃总结,以备后用。 运维专家或者是每个运维人追寻的幻想,他们敏锐的嗅觉仿佛总能揪出系统故障的根本原因。这种快速反应、精确定位的能力源自多年来解决简单零碎难题的教训积攒与集体常识储备,而且其胜利很难被复制。尽管没有哪家机构违心为其颁发认证资质,尽管如此,这依然是大家所乐于追寻的一种“超自然”的本事。 本文分享经营中的一些心得和领会。文中波及的办法、教训和思维不代表最佳实际。 蓝鲸智云简介腾讯蓝鲸智云(简称蓝鲸)软件体系是一套基于PaaS的技术解决方案,致力于打造行业当先的一站式自动化运维平台。目前曾经推出社区版、企业版、私有云版,欢送体验。请点击拜访蓝鲸官网:http://bk.tencent.com

April 6, 2022 · 1 min · jiezi

关于运维:技术人生专栏作者来直播间啦欢迎来提问

你是否还在期待技术人生系列的新篇章?你是否无数次在公众号重复搜寻关键字?你是否苦苦守候作者却等不到他?你是否... 好消息!好消息!小编请来了作者自己承受大家“催更”的激情! 扫码立即预约直播~ 4月7日(周四)15:00,技术人生专栏作者 贺迷信(晨末)将在阿里巴巴中间件视频号与读者们现场互动,据说还带来了诚意满满的惊喜~ 还有什么想问的问题,想对作者大大说的话,大家都能够留言公众号【阿里巴巴中间件】。最受关注的问题将在现场对作者进行发问哦~!赶快口头起来~ “催更”迫不及待! 往期金句先确定好心态的问题当前,接下来就须要一些能够被实际测验的方法论来帮忙大家突破本人层级的解放,实现自我冲破,从而在成长的根底上取得负责更重要的事件的机会,通过做好更重要的事件来获取更更重要的事件的机会,这样肯定会在某个阶段,你负责的事件,须要齐全以真正的技术一号位的角色去落地,那么那个时候表演技术一号位的角色也就是瓜熟蒂落的事件了。——「技术人生」专题第1篇:什么是技术一号位? 面对非常复杂的事件的时候,咱们须要可能有正当的实践工具来撑持本人,将简单的状况骨干脉络理分明,而后剖析它为什么当初会是这样,过来是什么样的,在什么条件下,将来会倒退成什么样,而后再剖析哪些要害局部是咱们能够通过实际行动影响的,从而通过影响要害局部来疏导事物将来的倒退方向。——「技术人生」第2篇:学会剖析事物的实质 咱们须要主观辩证地对待探索事物法则的行为,这是从知其然上溯其所以然的过程。——「技术人生」第3篇:解决问题的法则总结 正确的做法是,问题的剖析和拆解必须交给迷信的方法论,而决策才要交给价值观。所以,对于须要做业务或组织决策的人而言,必须把握一种迷信的方法论。——「技术人生」第4篇:技术、业务、组织的个别法则及应答策略 “帮忙客户实现业务数字化”这个要求,并不是让你进行倒退你本人的技术,而是要求你对“业务”两个字投入更多的精力,要对它有新的了解,而不是把它当做“障碍我写代码的事件”。所以用一个比喻来形容,就是:做业务开发的研发同学,不论是什么程度,什么等级,带不带人,都须要“技术”和“业务”两条腿走路。——「技术人生」第5篇——浅谈如何成为技术一号位? 首先,业务是服务提供方满足需求方诉求的次要模式。其次,业务是服务提供方和需求方独特形成的对立统一体。最初,人的实质决定了业务的存在与否。——「技术人生」第6篇:技术同学应该如何了解业务? 读者好评 往期相干内容: 「技术人生」第1篇:什么是技术一号位?「技术人生」第2篇:学会剖析事物的实质「技术人生」第3篇:解决问题的法则总结「技术人生」第4篇:技术、业务、组织的个别法则及应答策略「技术人生」第5篇——浅谈如何成为技术一号位?「技术人生」第6篇:技术同学应该如何了解业务?

April 6, 2022 · 1 min · jiezi

关于运维:我们是如何解决偶发性的502错误的

从ingress的监控核心,咱们看到,失败率尽管不高,但始终保持在0.05到0.1的程度: 咱们用这样的条件去查问,发现绝大部分谬误是502谬误: status>=500 | select status, count(*) a group by status order by a desc 那么502谬误到底是个什么谬误呢?百度百科给出的解释是: 502 Bad Gateway是指谬误网关,有效网关;在互联网中示意一种网络谬误。 体现在WEB浏览器中给出的页面反馈。 它通常并不意味着上游服务器已敞开(无响应网关/代理) ,而是上游服务器和网关/代理应用不统一的协定替换数据。 鉴于互联网协议是相当分明的,它往往意味着一个或两个机器已不正确或不齐全编程。还有人说是超时导致的: 马上在评论区有人反驳: 百度百科对504谬误的解释: 504谬误代表网关超时(Gateway timeout),是指服务器作为网关或代理,然而没有及时从上游服务器收到申请。 服务器(不肯定是Web 服务器)正在作为一个网关或代理来实现客户(如您的浏览器或咱们的CheckUpDown 机器人)拜访所需网址的申请。显然,504谬误才是超时,而502并不是。 而且从咱们对502谬误日志的进一步剖析来看,产生502谬误时的申请工夫和响应工夫都极短,不可能是超时。 查502与504的区别,只有这个说法绝对靠谱: 也就是说咱们后端的服务是可能响应的,但响应不符合要求,所以呈现了502谬误。但这种谬误并不是必然的,如果是必然呈现,则网站整体不可用,早就被发现了,正因为它是偶发的,所以有必要看一下在产生502的时候到底产生了什么。 为此咱们把nginx的logtail日志的stderr输入关上: 此前这里原本是false,当初咱们把它改成true,使它可能将谬误日志输入进去,便于咱们查找起因。 stderr谬误输入之后,立即就能在日志里看到大量的这种谬误: 2022/04/02 16:59:55 [error] 11168#11168: *739601507 recv() failed (104: Connection reset by peer) while reading response header from upstream, client: 49.93.83.68, server: www.domain.com, request: "POST /myserver/service HTTP/1.1", upstream: "http://192.108.1.121:8080/myserver/service", host: "www.domain.com"从字面意思来了解,是说上游服务器间接敞开了连贯。然而上游服务器为什么要敞开连贯呢?将错误信息放入搜索引擎进一步排查,很多文章将咱们的思路导向了keepalive这个方向,最应该查看的是keepalive_timeout和keepalive_request这两个属性。 ...

April 3, 2022 · 2 min · jiezi

关于运维:天翼云分布式缓存服务Redis的应用场景干货

作为分布式缓存零碎,Redis大量的利用于互联网行业的各类利用,即便是传统行业,只有是面向公众客户的互联网利用,因用户数的激增,也纷纷基于Redis做架构的革新。 像微博及 Twitter 这两大社交平台重度依赖 Redis 来承载海量用户拜访,通过构建可灵便扩大的Redis集群让其可能承载上亿用户的拜访规模。 咱们依照Redis数据结构维度,其实用的具体场景如下:List: 双向列表,实用于最新列表,关注列表;Set: 实用于无程序的汇合,点赞点踩,抽奖,已读,独特好友;SortedSet : 具备排序加成性能,实用于排行榜,优先队列的实现;Hash:对象属性,不定长属性数;KV : 繁多数值,实用于验证码,缓存等实现。上面咱们列举一些出名网站应用Redis的案例: 新浪微博新浪微博最早大规模利用Redis,具体的利用的场景如下:hash sets: 关注列表, 粉丝列表, 双向关注列表;string(counter): 微博数, 粉丝数;sort sets(主动排序): TopN, 热门微博等, 主动排序;lists(queue): push/sub揭示。 唯品会唯品会采纳Redis集群架构,次要利用于后端业务,大数据实时举荐/ETL、风控、营销三大业应用。在线有生产几十个cluster集群,约2千个实例,单个集群的实例最大达到250+。 今日头条用户建模数据采纳MySQL/MongoDB以及Memcache/Redis的数据库+缓存的架构,用户建模数据是指当用户开始应用今日头条后,对用户动作的日志进行实时剖析, 会对用户的每个动作进行学习,并对用户的趣味进行开掘所产生的数据。 阿里巴巴阿里巴巴的很多业务线都用到了Redis,比方每个人关注店铺的列表、菜鸟的订单散发零碎中订单的排序规定等。 南航其电商营销平台采纳了Redis-Cluster架构,用来缓存机票信息,航班动静更新,上线后查问晋升成果非常显著,响应工夫从 7-8 秒降到一百多毫秒,实现机票信息"秒出"。还有大型游戏中排行榜,也会利用到Redis。 最初说一下12306网站,也用到了分布式缓存零碎,用户缓存余票信息,但其背地的分布式缓存零碎采纳的是GemFire,而不是Redis,能够把GemFire了解为增强版的Redis。

April 2, 2022 · 1 min · jiezi

关于运维:恒源云Gpushare如何防止训练不中断技巧大放送1

1、训练期间因网络抖动中断,怎么将训练任务放到后盾运行?举荐应用 Tmux 终端复用器,可能将过程放到后盾运行,须要时从新接管。 为了避免 SSH 因网络断开造成的过程运行中断,倡议把所有须要长期运行的训练等工作都应用 Tmux 终端。参考 Tmux 文档。 2、敞开本地电脑,训练任务会中断吗?如果是通过 Tmux 将工作放在后盾运行,或应用 JupyterLab 浏览器运行的工作,敞开本地电脑不会中断训练。 如果是间接在终端中执行训练,或应用 VSCode 等 IDE 连贯执行训练,则敞开电脑会中断训练。 3、敞开 JupyterLab 浏览器,训练任务会中断吗?若是敞开了 JupyterLab 的浏览器页面,只有实例不敞开,JupyterLab 中 NoteBook 和终端中的训练任务会持续运行。 4、敞开 VSCode、PyCharm、iTerm2 等 IDE 或终端,训练任务会中断吗?应用 IDE 连贯到实例执行训练任务,如果敞开 IDE 或终端会中断训练任务。 如果须要后盾运行举荐应用 Tmux 终端。参考 Tmux 文档。

April 1, 2022 · 1 min · jiezi

关于运维:打通源码高效定位代码问题|云效工程师指北

简介:为了帮忙企业和团队开掘更多源代码价值以赋能日常代码研发、运维等工作,云效代码团队在大数据和智能化方向进行了一系列的摸索和实际(例如代码搜寻与举荐),本文次要介绍咱们如何通过间接买通源代码来进步研发与运维效率。 大家好,我叫胡飞虎,花名虎仔,目前负责云效旗下产品 Codeup 代码托管的设计与开发。代码作为企业最外围的数据资产,除了被构建、部署之外还有更大的价值。为了帮忙企业和团队开掘更多源代码价值以赋能日常代码研发、运维等工作,云效代码团队在大数据和智能化方向进行了一系列的摸索和实际(例如代码搜寻与举荐),本文次要介绍咱们如何通过间接买通源代码来进步研发与运维效率。 随着微服务架构的风行,一个业务流程须要多个微服务共同完成。一旦呈现问题,运维人员在面对数量多、调用链路简单的状况下,很难疾速锁定导致问题产生的罪魁祸首:代码。 为了进步排查效率,目前常见的解决方案是:链路跟踪+日志剖析工具相结合。即通过链路跟踪产品(如阿里云的Tracing Analysis)可视化还原业务执行过程的零碎调用链路的拓扑、接口申请量与耗时等数据,再配合日志剖析工具(如阿里云的SLS)进一步剖析链路中某个零碎的具体日志从而锁定出问题的大抵坐标。 现实状况是开发人员可能自助剖析并解决联调过程中遇到的问题,但理论状况是一旦被依赖的服务执行返回失败时测试流程就终止了,必须要等到上游服务提供方的共事帮助排查能力解决;尤其当遇到在紧急场景时,更是考究一个“快”字,如果过于依赖排查人员对代码的相熟水平以及必须下载到本地电脑能力剖析的诸多限度,势必会升高问题排查的效率。 究其根源,链路跟踪+日志剖析工具的排查模式存在两个待解的问题: 无奈间接锁定有问题的源码,现有的定位形式只能查找到问题产生的现场信息(如产生的工夫、上下文数据和一些形容信息),而短少产生问题的凶手信息,即源代码数据;限度条件多,首先须要排查人员事先晓得问题可能波及的代码库;其次代码库必须提前下载到本地PC电脑能力查看剖析,如果身边没有电脑则无奈进行上来。买通源码,解决最初一公里为了解决上述2个问题,云效代码治理平台 Codeup 联结阿里云日志服务工具 SLS 一起买通了日志到源码追溯的通道。管理员在实现一次配对后,开发者在排查过程中就无需关怀日志与代码库的关联关系,也无需长期申请代码库权限,让在线代码问题的排查变得简略而高效。 这里波及到两款工具,其中 Codeup 是代码托管产品,提供了代码源文件的存储与版本控制、代码文本搜寻等服务;SLS 提供了海量日志数据的收集、存储、检索等服务。 首先通过 SLS 收集上报业务零碎打印的日志数据,一旦生产环境呈现问题并由监控零碎发出报警,则开发或运维人员接到报警后第一工夫登录 SLS 控制台查问具体的日志详情,而后剖析具体日志详情以及一键跳转日志关联的源码仓库,定位到问题代码行,整个过程零打碎敲,让解决人员专一于问题自身,极大进步解决问题的效率。 实际操作指南1、登录阿里云日志服务 SLS 界面,由管理员配置日志库与代码库的关联关系,通过点击图1所示的“查看源码”性能,能够进入配置页面。配置是一次性工作,失效后无需反复配置。 图1 “查看源码”初始化入口 2、抉择「查看源码」,抉择业务对应的云效代码库,如果代码暂未托管至云效 Codeup,别放心,这里反对一键疾速导入三方代码库到 Codeup,具体可见下方操作视频。 点击观看 http://mpvideo.qpic.cn/0b2ebm... 3、配置胜利后会在高级选项里新增“代码诊断”入口,如图3所示(入口名称可自定义,此处中自定义为:代码诊断)。 图2 初始设置实现效果图 4、查看 SLS 日志详情,如需配合源码剖析,则只需抉择相应代码相干日志关键字,而后点击「代码诊断」即可,如图4~6所示,点击后能够在 SLS 页面间接查看相干的代码片段。 图3 代码查问交互 图4 关联查问的代码片段 图5 Codeup托管的代码详情 上述能力能够能够很好地解决日常联调场景和在线应急场景的问题。 日常联调场景中可能通过日志记录搜寻问题代码,自助解决全链路调试过程中呈现的一些相似参数校验,运行时异样等简略的代码问题。在线应急场景下,可能通过一个traceID轻松从链路中定位问题的零碎,再从零碎的日志中查问具体日志数据,最初通过日志数据中记录的代码摘要疾速搜寻查问源码内容。整个过程一键实现,只有有相应的日志和代码库权限即可,即便没有PC电脑,挪动设施一样可能搞定。原文链接本文为阿里云原创内容,未经容许不得转载。

April 1, 2022 · 1 min · jiezi

关于运维:清华自研时间序列数据库Apache-IoTDB原理解析

云智慧 AIOps 社区是由云智慧发动,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交换社区。该社区致力于流传 AIOps 技术,旨在与各行业客户、用户、研究者和开发者们独特解决智能运维行业技术难题,推动 AIOps 技术在企业中落地,建设衰弱共赢的AIOps 开发者生态。智能运维畛域的数据特点指标数据作为运维场景中的重要观测项,是服务可用性监控、零碎衰弱度度量等场景的次要数据起源。从上面架构示意图中们能够看出,采集器采集服务器上各种指标数据,发往音讯队列,通过实时流解决和离线计算最终存入到数据库。 在这个上述场景中,咱们往往会遇到以下几种数据挑战: 咱们日常须要监控的指标数量超百万,峰值时甚至会达到千万级,每天积淀下来的指标数据量达到GB级别,甚至TB级别。针对指标数据的日常剖析行为通常波及到近1小时、近1天、近7天、近30天、近1年等多种时间跨度。对范畴查问的性能有肯定要求。3)在数据传输过程中,因为受到网络、设施资源等起因造成短时间内呈现乱序达到、缺丢点、峰谷潮、反复数据等问题 4)因为服务器或设施自身起因,采集的指标数据工夫往往不够精准,导致数据粒度不齐整的问题。例如对于秒级别的指标,上一个采集的数据点的工夫戳是2021-01-01 10:00:00:000下一个数据点的有可能是2021-01-01 10:00:01:015。而不同的指标雷同时刻采集的数据点工夫戳别离是2021-01-01 10:00:00:000和2021-01-01 10:00:00:015。 至此整体的需要根本曾经明确,在做数据库选型时须要满足以下需要: 1)反对数据长时间存储; 2)反对大时间跨度的疾速检索; 3)高速的数据吞吐能力; 4)高效的数据压缩比; 5)可能无效的解决数据的乱序、缺失值、粒度不齐整以及反复数据等数据品质问题。 智能运维畛域的时序数据该如何存储对于上述的需要咱们该如何选型?是传统的关系型数据库,还是通用的NoSQL数据库,亦或是专用的时序数据库?他们是否满足上述数据库选型的需要? 数据如何存储还要联合数据自身的特点。这里以一个实在场景中的案例,某运营商有约3000万的监控指标,并且采集的过程中存在空值数据、数据缺失、数据反复等状况,甚至会呈现新的指标。如果一分钟采集一次指标在容许肯定数据提早的状况下,写入速率要超过50w/s,一天须要存储432亿的数据,这对关系数据库来说无论是从写入速率是在查问时效都很难满足需要。 再看看通用的NoSQL数据库,首先先简略梳理一下这些指标数据的特点,咱们发现这些指标数据除了有工夫戳和指标值外还会有一些tag 来标识数据来自那台机器,通过采集器理论的采集数据的样例如下图所示: 在通用的NoSql 数据库尽管能够满足吞吐量性能以及查问性能,然而为了满足指标的动静变更咱们只能依照一个设施一张表或者多个设施共享一张表的建模形式如下图所示。 无论是一个设施一张表还是多个设施共享一张表的存储形式,为了可能辨别数据来哪个指标,咱们只能把tags作为一列进行存储,不难发现这种这样建表形式会呈现大量的tag数据冗余存储的问题。并且通用的NoSql数据库往往在解决数据反复的问题上并不敌对,更多的是依附一些排重策略来实现。排重策略通常有两种:一种是依附内部的排重形式达到存储时数据曾经排重,另一种是存储不排除查问时依附sql来做排重。如果应用第一种数据排重无疑会减少零碎的复杂度,如果应用第二种这会导致在处理过程的呈现数据冗余存储的状况。而且通用的NoSql数据库还存在一个问题就是:没有原生操作反对粒度卡齐或者线性填充来解决数据品质差的问题。 然而咱们下面的遇到的一些数据挑战理论是属于时序数据库要解决的典型问题,市面上也有许多优良的时序数据库,例如InfluxDB、Apache IoTDB等,它们在高吞吐、低延时查问、数据去重、数据填充、数据降采样、高压缩比等性能方面皆能满足第一章中的数据存储需要。接下来咱们来重点看下齐全开源的Apache IoTDB它是如何设计的。 IoTDB的设计IoTDB的架构IoTDB是基于LSM-Tree(Log-Structured Merge Tree)的架构进行设计的列式存储数据库,LSMtree的核心思想就是放弃局部读的能力来换取最大的写入能力。从下图中IoTDB的整体架构图中咱们能够看出IoTDB次要有三局部形成:别离是数据库引擎、存储引擎和剖析引擎。 数据库引擎次要是负责sql语句的解析、数据写入、数据查问、数据删除等性能。 存储引擎次要是由TsFile来组成也是IoTDB的最具特色的设计,它不仅能够为IoTDB存储引擎应用,而且还能够间接通过链接器供剖析引擎应用,同时还对外开放了TsFile的API,用户也能够本人间接通过API来获取外面的内容。 剖析引擎次要是用于与开源的数据处理平台对接等。 IoTDB的数据读写流程下面提到了IoTDB是基于LSM-Tree的思维来实现的,从以下数据写入流程图中咱们能够看出:数据通过time detector时会依据内存中保护的最大工夫戳来判断是否数据有序,在内存缓冲区memtable中分为有序序列和乱序序列,同时为了保障在断电后数据不失落,IoTDB也会把数据写入到WAL(Write-Ahead Logging)中,到此客户端的数据写入就曾经实现。随着数据的一直写入,memtable中的数据达到肯定的水平后,IoTDB通过submit flush task把memtable变成Immutable最终刷到磁盘变成Sstable即TsFile文件,同时当长久化的TsFile文件达到肯定水平会触发合并。 下面介绍了IoTDB数据的写入流程后,咱们再来看下IoTDB外围的查问流程。如下图所示,当客户端发送查问申请时,首先通过Antlr4进行sql 解析,而后去内存中的MemTable、ImmuTable和硬盘中TsFile中进行查问。当然,IoTDB这里会通过BloomFilter 和索引来进步数据的查问效率。咱们晓得BloomFilter的原理是哈希后果不存在那么肯定没有此数据,如果哈希后果存在,IoTDB那么还须要持续借助索引进行进一步的查找。 TsFile构造上一节IoTDB的读写流程都离不开TsFile,那咱们看看IoTDB最外围TsFile是怎么一个构造。从上面的TsFile 构造示意图中能够看出TsFile整体分为两局部:一部分是数据区,另一部分是索引区。 数据区次要包含Page 数据页、Chunk数据块和ChunkGroup数据组。其中Page 由一个 PageHeader 和一段数据(time-value 编码的键值对)组成,Chunk数据块由多个Page和一个Chunk Header组成,ChunkGroup 存储了一个实体(Entity) 一段时间的数据,它由若干个 Chunk, 一个字节的分隔符 0x00 和一个ChunkFooter组成。 索引区次要包含TimeseriesIndex、IndexOfTimeseriesIndex和BloomFilter,其中TimeseriesIndex蕴含1个头信息和数据块索引(ChunkIndex)列表,头信息记录文件内某条工夫序列的数据类型、统计信息(最大最小工夫戳等);数据块索引列表记录该序列各Chunk在文件中的 offset,并记录相干统计信息(最大最小工夫戳等);IndexOfTimeseriesIndex用于索引各TimeseriesIndex在文件中的 offset;BloomFilter针对实体(Entity)的布隆过滤器。下图中TsFile包含两个实体 d1、d2,每个实体别离蕴含三个物理量 s1、s2、s3,共 6 个工夫序列,每个工夫序列蕴含两个 Chunk。 ...

April 1, 2022 · 1 min · jiezi

关于运维:轻轻松松实现本地和云主机之间的文件上传下载

云主机开明后在进行利用部署时面临的第一个问题是如何将应用软件安装包、利用数据上传至云主机。利用几个很简略的工具就能够将本地文件上传至云主机。先说Windows云主机。Windows远程桌面反对近程驱动器映射,通过配置将本地硬盘映射为云主机的一个磁盘,就能够将本地磁盘的文件拷到云主机上。配置办法为运行远程桌面客户端,点击本地资源,找到本地设施和资源局部,点击详细信息 把须要映射的磁盘后面打上勾,点击确定实现配置。再应用远程桌面客户端连上云主机后,在资源管理器里,就可以看你本地的磁盘了。就像操作你本地的磁盘一样,对文件进行复制粘贴。 再说Linux云主机将文件拷到Linux云主机上须要应用scp工具。如果您是应用的Windows桌面,举荐应用winscp这款收费的小工具。应用搜索引擎搜寻winscp即可。官方网站是 https://winscp.net  ,举荐去官方网站下载,避免重要工具内被歹意植入木马。装置后运行winscp,按提醒输出云主机的IP地址,端口如果你没有批改过的话则为默认的22端口。再输出云主机的用户名和明码。点击登录。 第一次登录时软件提醒是否将主机密钥增加到缓存中,点击是。 登录后界面就和一般的FTP客户端一样,将右边的本地窗口选中文件拖到左边的云主机窗口对应的目录就能够将本地文件上传至云主机。从左边的云主机窗口选中文件拖到右边的本地窗口则是从文件从云主机下载到本地。 应用SCP上传文件反对断点续传,Windows的远程桌面就不反对断点续传了。如果是上传几个G的大文件至Windows云主机或者您本地的网络条件不好,还是在Windows云主机上装一个FTP服务器吧。

March 30, 2022 · 1 min · jiezi

关于运维:通过IPv6隧道实现天翼云云主机IPv4和IPv6双栈接入

IPv4,即以后天翼云云主机上调配的弹性IP如 42.123.125.182 模式的IP地址。随着互联网的蓬勃发展,寰球IPv4公网IP地址曾经面临枯竭,而用于解决IPv4地址枯竭问题推出的IPv6的正式商用却依然是一个漫长的过程。 以后云主机调配应用IPv4地址对于一般的接入拜访需要都是没有问题的。但2017年6月1日起,苹果公司要求苹果利用商店中上架的所有iOS应用程序必须反对IPv6-Only网络环境,也就说苹果用户在纯IPv6网络环境下须要依然可能失常应用这个App,如果iOS利用后端连贯的服务器是天翼云云主机,则天翼云云主机也要求反对IPv6的拜访。 咱们来看一下云主机反对IPv6拜访到底是什么意思。首先咱们要理解一点对于DNS的基础知识。DNS即域名服务,有了DNS咱们拜访天翼云官网的时候只有记住 ctyun.cn 这个域名,而不必记住 118.85.194.44 这一长串数字,DNS保留的即是域名和IP地址的对应关系。 DNS有多种类型的记录,其中A记录用于IPv4环境,AAAA记录用于IPv6环境。当初我有一个域名是ipv6.ctyun.pw,曾经别离配置了A记录和AAAA记录。在IPv4环境下拜访 ipv6.ctyun.pw这个域名,DNS服务器将会返回IPv4地址 42.123.125.182;在IPv6环境下拜访 ipv6.ctyun.pw 这个域名,DNS服务器将会返回IPv6地址 2001:470:23:201::2 而云主机反对IPv6拜访,即咱们须要在云主机上生成一个相似 2001:470:23:201::2 这样的IPv6地址,并能在IPv6环境下失常拜访咱们的云主机。IPv6的过渡计划有多种,明天介绍以后最为罕用的IPv6隧道代理计划。通过IPv6隧道,云主机将和隧道服务器之间创立一条隧道,IPv6用户通过这条隧道,最终拜访到天翼云的云主机。 Hurricane Electric ( https://tunnelbroker.net ) 提供收费的IPv6隧道服务,本文将以CentOS6.6为例,形容在天翼云云主机上应用Hurricane Electric的IPv6隧道服务,配置IPv6反对的过程。示例云主机绑定的弹性IP地址为 42.123.124.3,内网IP为 192.168.1.20,操作系统为CentOS 6.6。 1、云主机平安组配置在后续的配置中IPv6隧道服务将应用 66.220.2.74 这个IP地址对云主机进行ICMP探测。如果云主机平安组未开启容许ICMP,须要减少一条规定,容许 66.220.2.74 对云主机的ICMP拜访,否则后续的配置将不胜利。 2、 操作系统配置启用IPV6批改云主机的 /etc/sysctl.conf 配置文件,退出以下配置net.ipv6.conf.all.disable_ipv6 = 0net.ipv6.conf.default.disable_ipv6 = 0net.ipv6.conf.lo.disable_ipv6 = 0 配置/etc/sysconfig/network,退出以下配置NETWORKING_IPV6=yes配置实现后重启云主机Windows能够跳过这一步 3、 注册IPV6隧道服务登录 https://tunnelbroker.net 网站,注册一个账号,登录邮箱点击链接激活账号。以账号登录 tunnelbroker网站,点击首页右边菜单的 Create  Regular Tunnel。 输出云主机的公网IP,抉择一个隧道服务器,点击Create tunnel按钮。在本例中咱们输出云主机的公网IP 42.123.124.3,并抉择应用北美的一台隧道服务器。 页面返回提醒创立隧道胜利,并且给云主机调配了一个IPV6地址 2001:470:23.201::2。 点击Tab页的Example Configurations,下拉菜单抉择Linux-route2,页面将显示Linux操作系统的配置命令  同样也能够切换到其它操作系统,获取相应操作系统的配置命令。比方Windows 2008用户能够抉择切换到Windows Vista/2008/7/8,获取Windows的配置命令。 在命令中 42.123.124.3 是本测试用例中云主机的公网IP。因为天翼云云主机网卡的IP地址为内网IP,咱们须要相应地批改一下命令。本例中云主机内网IP是 192.168.1.20,则将命令中的 42.123.124.3改为 192.168.1.20 modprobe ipv6ip tunnel add he-ipv6 mode sit remote 74.82.46.6 local 192.168.1.20 ttl 255ip link set he-ipv6 upip addr add 2001:470:23:201::2/64 dev he-ipv6ip route add ::/0 dev he-ipv6ip -f inet6 addr ...

March 29, 2022 · 2 min · jiezi

关于运维:使用对等连接在天翼云两个用户的云网络之间架起一座天桥

设想一下,某区园外面有栋楼,两栋楼里的某两家公司业务来往十分亲密,员工常常须要当面沟通。然而从这栋楼走到另一栋楼,须要下到一楼,走过一条街,再上另一栋楼。某天,A公司的老板说,咱们间接修一座天桥到B公司所在楼的办公室去吧。其实这样的桥很多,比方驰名的吉隆坡双子塔,双塔两头就有一座天桥连接起来。 在云计算中,同样有相似的业务场景:两家不同的公司因为有业务往来,他们的云主机须要进行网络互通。思考到公网带宽以及公网潜在平安问题,他们想要实现云主机的内网互通。这就要应用到VPC对等连贯。对等连贯须要一条的条件,那咱们想一下两栋楼之间架一座天桥须要哪些条件:1、两栋楼不能离得太远 必须在同一个园区2、两栋楼的名字不能雷同,不然从这栋楼去另一栋楼会迷路3、两栋楼的治理单位须要进行商议,一方发动建桥的申请,另一方批准4、两栋楼都须要做路牌信息,通知楼里的人去另一栋该怎么走 对应到天翼云的对等连贯,须要的条件是:1、两个用户必须在同一个资源池,跨资源池不反对2、两个用户的VPC网段不能雷同,这个用户用了 192.168.0.0/24,另一个用户就不能用这个网段3、两个用户须要进行对等连贯协商,其中一个用户发动连贯,另一个用户承受连贯4、两个用户的VPC须要做路由配置,通知云主机去对方的云主机的路由该怎么走。 假设咱们有A用户及B用户,都在同一个资源池。A用户的VPC网段为 192.168.0.0/16,B用户VPC网段为172.16.0.0/16。上面实战配置过程。 咱们从A用户发动对等连贯,由B用户承受。1、B用户登入ctyun.cn门户,进入VPC设置,查看B用户的VPC信息,记录VPC ID,并通知A用户。这里的VPC ID就相当于B用户办公室的门牌号码信息,通知A用户我的办公室在这里。 2、A用户登入ctyun.cn,进入虚构公有云控制台,在左侧菜单中点击“对等连贯”,点击申请对等连贯。 3、进入申请对等连贯配置。本端VPC在下拉中抉择A用户的 192.168.0.0/16段所属VPC。租户抉择其它租户。对端账户名输出B用户的ctyun账号,对端VPC ID输出第一步中获取的B用户VPC ID。点击确定实现增加。这里租户也能够为以后租户,也就是说如果用户创立了多个不同网段VPC,想要使它们内网互通,就能够抉择以后租户。 4、回到对等连贯列表页面。能够看到对等连贯的状态变成“待承受”。 5、B用户进入虚构公有云控制台,在左侧菜单中点击“对等连贯”设置。能够看到有一个对等连贯申请,状态为待承受。点击“承受申请”按钮。 6、确认申请无误后,点击确定实现对等连贯创立。 7、这时候对等连贯曾经创立胜利了,在对等连贯列表中能够看到对等连贯的状态为已承受。但这时候A用户的 192.168.0.0/16 网段云主机还不能与 B 用户的 172.16.0.0/16网段云主机进行通信。因为咱们还没有设置路牌,192.168.0.0/16网段不晓得去172.16.0.0/16网段应该走对等连贯。进入A用户的虚构公有云控制台,在左侧菜单中选择对等连贯。点击对等链接的名称,进入对等链接具体设置。 在关联路由设置中,点击“增加本端路由”按钮输出目标地址 172.16.0.0/16,也就是给A用户的云主机加一块路牌信息,往172.16.0.0/16网段应该走对等连贯,别走错路了。 8、最初,B用户也要在天翼云虚构公有云控制台的对等连贯配置中,增加对应的本端路由。B用户增加的路由为 192.168.0.0/16,也就是A用户的VPC网段。 9、A用户和B用户都增加实现后,单方的云主机就能够实现内网互通了。 总结:1、对等连贯只反对在同一资源池内的VPC之间创立2、对等连贯能够在同一用户的不同VPC或不同用户的VPC之间创立3、创立对等连贯的VPC网段不能雷同4、最重要的,对等连贯完全免费

March 29, 2022 · 1 min · jiezi

关于运维:云原生时代的运维体系进化

作者 | 易立 云原生曾经成为数字经济技术的翻新基石,并且正在粗浅地扭转企业上云和用云的形式。云原生的用云形式能够帮忙企业最大化取得云价值,也给企业的计算基础设施、利用架构、组织文化和研发流程带来新一轮改革。而业务和技术挑战也催生了新一代云原生运维技术体系。 本文整顿自阿里云资深技术专家、容器服务研发负责人易立在阿里云联结主办的“2021云上架构与运维峰会”中的演讲实录,分享了云原生时代运维技术收回的重要扭转,以及源自阿里云超大规模云原生利用倒退过程中的CloudOps实际。 新商业带来新机遇与新挑战阿里云对云原生的定义是因云而生的软件、硬件和架构,帮忙企业最大化取得云价值。云原生技术带来的变动蕴含几个维度: • 首先是计算基础设施的变动,蕴含虚拟化、容器、函数计算的新的计算状态,帮忙利用高效地运行在公共云、公有云、边缘云等不同的云环境。• 其次是利用架构的变动。利用微服务、服务网格等技术帮忙企业构建分布式、松耦合、高弹性、高容错的现代化利用。• 最初是组织、文化和流程的变动。比方 DevOps、DevSecOps、FinOps、 SRE 等理念继续推动现代化的软件开发流程和组织降级。 回顾云原生呈现的时代背景,挪动互联网的呈现扭转了商业的状态,扭转了人与人沟通的形式,让任何人在任何工夫、任何地点都能够轻松获取本人所需的服务。IT 零碎须要可能应答互联网规模的快速增长,并且可能疾速迭代、低成本试错。 以 Netflix、阿里为代表的一系列互联网公司推动了新一代利用架构的改革,Spring Cloud、Apache Dubbo 等微服务架构应运而生。微服务架构解决了传统单体式利用存在的几个问题:每个服务能够独立部署和交付,大大晋升了业务敏捷性;每个服务能够独立横向扩容,应答互联网规模的挑战。 与传统单体利用相比,分布式的微服务架构具备更快的迭代速度、更低的开发复杂性和更好的可扩展性。但同时,它的部署和运维的复杂性却大大增加。咱们须要如何应答? 此外,“脉冲”计算成为常态。比方双十一大促期间,零点须要的算力是平时的数十倍;一个突发的新闻事件,可能让上千万用户涌向社交媒体。云计算无疑是解决突发流量洪峰的更加经济、高效的形式。如何上好云、用好云、管好云,如何让利用能够更加充分利用基础设施的弹性,成为企业运维团队的关注重点。这些业务和技术挑战也催生了云原生的运维技术体系 – CloudOps。 云原生时代运维技术改革1、云原生运维解决之道CloudOps 要解决几个关键问题:• 标准化:标准化能够促成开发团队与运维团队的沟通和协同,标准化也有助于生态分工,推动更多自动化工具的呈现。• 自动化:只有自动化运维,能力撑持互联网规模的挑战,能力继续撑持业务的疾速迭代与稳定性。• 数智化:数据化、AI 加强的自动化运维成为将来倒退的必然趋势 2、容器 “利用集装箱”重塑软件供应链在传统的利用散发、部署过程中,常会因为不足规范导致工具碎片化,比方 Java 利用和 AI 利用的部署,须要齐全不同的技术栈,交付效率低。此外,为了防止利用之间的环境抵触,咱们常常须要将每个利用独自部署在一个独立的物理机或者虚拟机上,这也造成了很多资源节约。 2013 年开源的容器技术 Docker 呈现,开创性地提出了基于容器镜像的利用散发和交付形式,重塑了软件开发、交付和运维的整个生命周期。 就像传统的供应链体系为例,不论什么样的产品都是通过应用集装箱来进行运输,极大晋升了物流效率,使得全球化的分工协同成为可能。 容器镜像将利用和其依赖的应用环境一起打包。镜像能够通过镜像仓库进行散发,能够统一的形式运行在开发、测试和生产环境中。 容器技术是一种轻量化 OS 虚拟化能力,能够晋升利用部署密度,优化资源利用率,与传统的虚拟化技术相比,更加麻利、轻量,具备更好的弹性和可移植性。 容器作为云时代的“利用集装箱”,重塑了整个软件供应链,也开启了云原生技术浪潮。 3、容器技术减速不可变基础设施理念落地在传统的软件部署和变更过程中,常常会呈现因为环境间的差别导致利用呈现不可用的问题。比方,新版本利用须要依赖 JDK11 的能力,而如果部署环境中没有更新 JDK 版本,就会导致利用失败。“It works on my machine”也成了开发人员打趣的口头禅。而且随着工夫的推移,零碎的配置曾经不可考,采纳原地降级的形式在变更的时候一不留神就会掉进坑里。 不可变基础设施(Immutable Infrastructure)是由 Chad Fowler 于 2013 年提出的一个理念,其核心思想是“任何基础设施实例一旦创立,就变成为只读状态,如须要批改和降级,则应用新的实例进行替换。” 这种模式能够缩小配置管理的复杂性,确保系统配置变更能够牢靠地、反复地执行。而且一旦部署出错时可进行疾速回滚。Docker 和 Kubernetes 容器技术正是实现 Immutable Infrastructure 模式的最佳形式。当咱们为容器利用更新一个镜像版本的时候,Kubernetes 会新创建一个容器,并且通过负载平衡将新申请路由到新容器,而后销毁老容器,这防止了令人头疼的配置漂移问题。 ...

March 25, 2022 · 2 min · jiezi

关于运维:专访-KubeVela-核心团队如何简化云原生复杂环境下的应用交付和管理

作者 | Infoq Tina 背景12 月 9 日,在 2021 年 KubeCon 云原生技术峰会上,CNCF 开源我的项目 KubeVela 发表推出了 1.2 版本。 KubeVela 是一个简略易用且高度可扩大的利用交付和治理平台,基于 Kubernetes 与 OAM 技术构建。其外围性能是让开发人员方便快捷地在 Kubernetes 上定义与交付古代微服务利用,而无需理解任何 Kubernetes 自身相干的细节。 KubeVela 于 2020 年 11 月开源,2021 年 4 月公布 1.0 版本。 2021 年 7 月,KubeVela 和 OAM 我的项目整体捐献给 CNCF 基金会托管。 在 1.2 版本中,KubeVela 新增了以利用为核心的控制面板 UI 性能,使利用组装、散发、交付流程变得更简略,并能够通过 UI 控制台及时理解整个交付链路状态,简化多云/混合环境交付形式。另外还新增了基于订阅模型的开源利用交付零碎 ,使企业和云原生利用开发者只须要在 GitHub/Gitlab 上批改代码,就能够主动实现云原生利用交付的整个链路。 从开源到当初曾经有一年多,KubeVela 社区获得了什么样的停顿?有了哪些落地实际?1.2 版本中为什么会新减少这两个性能,适宜于什么场景? 为解答这些问题,InfoQ 采访了 OAM/KubeVela 产品和开源社区负责人曾庆国。 嘉宾简介:曾庆国(花名:悦达),阿里云技术专家,目前负责 OAM/KubeVela 产品和开源社区,从事云原生、利用交付、开源畛域钻研和实际多年,致力于推动云原生利用标准化和云原生技术“亲民化”。 专访问答InfoQ:目前基于 Kubernetes 的云原生利用交付还存在哪些挑战和难点?业界对应的有哪些解决方案? ...

March 25, 2022 · 2 min · jiezi

关于运维:DubboAdmin-正式支持-30-服务治理

作者介绍 程露,Java开发工程师,中间件开发爱好者,关注服务治理。严浩,Dubbo 贡献者,关注RPC、服务治理等畛域。 前言Dubbo 置信大家并不生疏,是一款微服务开发框架,它提供了 RPC 通信与微服务治理两大要害能力。大家在日常开发中更多应用的是 dubbo 提供的 RPC 通信这一部分能力,而对其提供的服务治理的能力应用绝对少一些,本文的重点将放在服务治理这方面。dubbo 框架提供了极其丰富的服务治理的性能如流量管制、动静配置、服务 Mock、服务测试等性能,而 dubbo-admin 的作用在于将 dubbo 框架提供的服务治理能力提供一个开箱即用的平台。本文将介绍 dubbo-admin 所提供的性能,让大家疾速理解和应用 dubbo-admin并对 dubbo 所提供的服务治理能力有个初步的理解。 服务详情服务详情将以接口为维度展现 dubbo 服务所提供的服务信息,蕴含服务提供者、消费者信息和服务的元数据信息比方提供的办法名和参数列表。在最新版本反对了 dubbo 3.0 所提供的利用级发现模型,在注册起源用 利用级/接口级 进行辨别。 动静路由 Dubbo-Admin 提供了三种路由的反对,别离是条件路由、标签路由、Mesh路由,所提供的性能能够轻松实现黑白名单、集群隔离、金丝雀公布等服务治理的诉求。上面将举例一一展现这一部分的性能。 条件路由 条件路由能够编写一些自定义路由规定实现服务治理的需要比方黑白名单、读写拆散等。路由规定在发动一次RPC调用前起到过滤指标服务器地址的作用,过滤后的地址列表,将作为生产端最终发动RPC调用的备选地址。 下图为一个简略的黑名单性能的实现,该路由规定的含意为禁止 IP 为 172.22.3.91 消费者调用服务 HelloService,条件路由规定的格局为:[服务消费者匹配条件] => [服务提供者匹配条件]。 标签路由 标签路由通过将某一个或多个服务的提供者划分到同一个分组,束缚流量只在指定分组中流转,从而实现流量隔离的目标,能够作为蓝绿公布、灰度公布等场景的能力根底。在 provider 利用级别上创立规定,对应的动态打标为 dubbo.provider.tag=tag1 和 @DubboService(tag = "tag2")。 Mesh路由 Mesh路由是 dubbo 3.0 推出的全新的路由规定性能极其弱小,应用mesh路由可能笼罩上诉两种路由的性能场景,并且还能够组合出更加简单路由场景。 Mesh路由将整个流量治理分成 VirtualService 和 DestinationRule 两局部,VirtualService 匹配入口流量,DestinationRule 匹配进口流量。上面将实现一个案例,通过对服务 HelloService 的 hi 办法通过入参 number 进行路由,实现入参为偶数的申请路由到 label 为 v1 的服务,入参为奇数的服务路由到 label 为 v2 的服务的性能。 ...

March 25, 2022 · 2 min · jiezi

关于运维:如何写出好的产品帮助文档

现在,大多数软件产品通过互联网为用户提供服务,在线文档是最无效的客户服务渠道,咱们相熟的开源软件都装备了高质量的在线文档。 好的文档是优良产品的标准配置,它不仅能够帮忙你带来更多的用户,还能够帮忙你为更多的用户服务。作为一名互联网程序员,如果你不晓得如何写一份好的技术文档,你会不好意思向他人打招呼,更不用说制作好的产品了。 好文档的评估规范“不晓得从何开始,找不到好的角度写,写什么内容等等”,这都是咱们常常会遇到的状况,那么为什么会产生这种状况呢?通常没有找到写作的意义,如果它是为了替换差别,头很容易卡住,思维无奈扩大。 所以在敲击键盘之前,咱们必须弄清楚这个文档是谁写的,以及通过这个文档能够帮忙读者解决什么问题。写作是咱们输入影响力的一种能力,它的最终目标是扭转读者的信息、行为或信奉,否则它将是一个无用的垃圾。在明确了指标读者和意义之后,咱们的想法就会被关上。 在编写文档的过程中会遇到哪些常见问题?通常咱们习惯于具体介绍产品的特点,具体如何装置、配置和应用等,事实上,大多数潜在用户是第一次接触这些产品,他没有齐全理解咱们的产品,不晓得产品能帮忙他解决什么问题,对他有什么价值,深刻细节很容易让潜在用户。 说一个小故事,我记得研究生毕业后筹备进攻幻灯片。导师教咱们一些教训:进攻是向评委展现他们的研究成果,扭转评委对这个钻研我的项目的认知,并对本人的印象,以取得更高的分数。幻灯片最好从Why开始,通知评委这个钻研我的项目的背景和意义。有了这个根底,评委可能会对你的钻研感兴趣,并追随你理解以下What和How。 非性能个性依赖于性能个性。一个对用户毫无价值的产品,即便它的非性能个性十分优良,也不会引起用户的趣味。 文档的结尾必须通过介绍产品或计划的价值与用户建立联系,让他晓得产品或计划与他的工作密切相关,这能够帮忙他优化工作。接下来是让用户晓得什么是产品或计划,以及如何应用它。这实际上相似于软件研发的过程。从用户需要开始,首先剖析和梳理用户的痛点,而后设计产品来解决用户的痛点,最初进行开发和实现。 文档目录设计和用户思维当咱们明确了文档的指标读者和能够为读者解决的问题时,写作自身就有了方向和价值,这样咱们就能够调动咱们的身心和大脑,让咱们的文本思维涌动,这就是用户的思维。在此基础上,咱们能够开始思考文档应该蕴含什么,如何安顿和设计目录章节,以更合乎用户的学习规定。 文档是咱们的内部输入产品,做产品学习同理心,从用户的角度思考他们须要什么样的产品或计划,用户在技术抉择中也首先确认产品或计划是否有价值,等他意识到价值将进一步理解产品或计划的性能特点和应用办法。 如何帮忙用户取得管制感或安全感?全景视图全景视图,让用户有上帝的视角,从整体上把握产品或计划,这个视图不会蕴含太多的细节。就像穿过热带雨林达到一个中央,如果一端进入森林,那么咱们很容易迷路,最好爬上洼地或树冠,察看整个森林,包含河流方向和地标特色,把握这些信息后咱们会更平安,更确定走出森林。全景视图就像一个装载信息的框架。咱们应该首先帮忙用户建设这个框架,而后向用户介绍具体的信息。此时,用户能够将其存储在框架的不同地位,因而他不会轻易迷路。因而,文档的第一局部是产品概述,包含背景形容、功能定位和劣势比拟。 构建演示环境在对该产品有了全面的理解后,应用程序架构师的角色将构建一个演示环境,以便对该产品有更理性的理解。在这个阶段,他不须要对各种细节有特地全面或深刻的理解,只须要晓得如何以最简略、最快的形式配置它,他能够在这个环境的帮忙下向团队中的开发测试人员介绍该产品。因而,文档的第二局部是疾速介绍,次要是帮忙应用程序架构师将对概念实践的了解转化为一个实在的演示环境。 介绍产品个性的开发指南通过以上两局部,咱们让用户晓得该产品能够帮忙他解决什么问题,以及它是如何工作的。接下来,将染指用户的开发、测试工程师和其余角色。他们须要深刻理解产品的性能个性和应用办法,以领导具体的编码实现。因而,文档的第三局部是介绍产品个性的开发指南。不同角色的用户对文档有不同的需要,文档章节目录的设计应合乎上述程序。 监控微服务第四局部,除了晓得如何应用本产品外,用户还将关怀如何在日常应用过程中操作和保护,是否有一些配套工具或治理控制台,借助其监控微服务的运行,以及微服务的管制和治理。 梳理常见问题第五局部,如何解决应用过程中遇到的问题,特地是一些十分频繁的问题,这部分将梳理这些常见问题,不便用户在遇到问题时征询。 1.产品简介2.疾速入门 3.开发指南 4.操作指南 5.常见问题 6.经典案例 7.历史版本 8.下载阐明罕用的文档工具文末再举荐一款能够日常写作用的软件工具:Baklib是一款在线的文档编辑及内容分享工具,在操作习惯反对Word文档罕用全系编辑操作,任意插入表格、代码块、图片、本地音视频、在线多媒体、让常识创作更加轻松。 产品需要文档创作实现后,须要进行外部之间的查阅。应用Baklib在线制作的文档内容会主动转化成网站,通过设置的url链接就能进行拜访,拜访的过程中通过不同权限查阅的设置,能够无效的做到内部资料的爱护。 产品劣势简略易操作这款工具无需下载输出网址就能在线应用(零试错老本)。操作过程简略,不须要有代码根底,会根底的电脑错做就行。 反对Word文档罕用全系编辑操作,任意插入表格、代码块、图片、本地音视频、在线多媒体、使得帮忙核心/知识库搭建过程更为简略。 结构化文档提供了多级栏目和标签云的性能做到常识内容的分层梳理,通过文档纲要,主动生成文档要点,让多篇文档结构化,像书一样清晰,使需要文档功过结构化安排更容易被了解。 牢靠的数据提供数据手动备份性能,用户能够将线上数据保留到本地。凋谢api接口,通过接口的调用实现数据的疾速导出导入。在内容创作时具备历史数据主动缓存性能,防止了错误操作带来的数据失落。 团队协同这款工具提供来多人在线合作编辑文档性能,当有需要文档的内容须要多方操作合作实现时,能够通过内置团队协同性能实现。合作成员权限可控,在减少工作效率同时确保了数据安全。 实用的插件这款工具提供了很多实用的插件,例如站点拜访权限:能够自在管制,能够拜访帮忙站点的用户人群。独立域名:反对绑定独立域名、域名ssl加密。全局检索:采取与百度相似的搜寻机制。...心愿以上内容可能帮忙大家写出令人满意的产品文档。

March 23, 2022 · 1 min · jiezi

关于运维:企业在线产品宣传册应该如何设计

企业产品宣传册是不同的企业用于本身产品推广的宣传工具,近年来,国内的广告市场上对于各种不同品种的企业产品宣传册的需要始终都在一直的晋升,企业产品宣传册对于企业产品的宣传具备十分重要的意义,而企业产品宣传册设计则是影响企业产品宣传成果的重要因素。 那么,专业化的企业产品宣传册设计个别都有哪些特点呢?该选用什么工具软件制作产品宣传册呢?这就是本篇文章所要讲的内容。 企业产品宣传册设计个别都须要借助于专业化的设计伎俩来进步设计的表现力,从而实现更好的广告宣传成果。 企业产品宣传册设计与招贴广告同属视觉形象化的设计,都是通过形象的体现技巧,在广告作品中塑造出真实感人栩栩如生的产品艺术形象来吸引消费者,承受广告宣传的主题,以达到精确介绍商品,促成销售的目标。 企业产品宣传册设计所面对的目标群体是宽广的消费者,所以在进行企业产品宣传册设计的时候,肯定要从不同角度体现出消费者因素。不少的企业产品宣传册设计是以流动的消费者为次要诉求对象。因而谋求的是霎时的视觉感化作用,强调其瞩目率和强烈的视觉冲击力。 产品宣传册的价值产品宣传手册:又叫软件产品应用说明书,面向用户,提供产品的应用阐明。 考察发现,购买者当初应用公司网站上的自助式产品帮忙页面的频率,与通过电话/在线客服/邮件与产品方沟通的频率雷同。当初大多数人不喜爱间接与业务员分割,帮忙核心能够用于在整个购买过程中为购买者提供在线的反对帮忙。 打消客户购买前的担心和疑虑,从而进步销售额。通过缩小大量的客户服务申请来节省时间和人力老本。晋升客户满意度留存客户,施行踊跃的自助帮忙服务将使企业可能通过杰出的体验,在用户中建设忠诚度。如何欠缺产品宣传册作为一个采坑有数四年多的经营老人和大家一起分享,如何制作出一份无效的产品帮忙文档。具体实施点如下: 如何妙用工具轻松制作产品宣传册小编给大家举荐一个做需要文档和产品文档都实用的工具——Baklib。 这是一款在线的文档编辑及内容分享工具,不仅为企业提供了好用的常识整顿平台,还提供了优质的常识公布平台,将整理出来的产品文档通过Baklib,即可让所有客户都能在线观看,帮忙他们对产品的了解,为用户应用提供便当。 产品需要文档创作实现后,须要进行外部之间的查阅。应用这款在线制作的文档内容会主动转化成网站,通过设置的url链接就能进行拜访,拜访的过程中通过不同权限查阅的设置,能够无效的做到内部资料的爱护。 下图为实在的成果示意图,大家能够感触下。产品能够通过在线编辑形式,将内容存结构化寄存到Baklib中,通过网站的模式展现给用领有查看权限的人员。 用户手册/帮忙文档是针对所有的产品使用者凋谢的,须要清晰的展现构造、和易于查阅的外观。Baklib这款产品提供了数十款的精美的主题,且每个页面都是针对帮忙文档场景制作,便于用户观看。 Baklib制作案例: 产品手册在产品的宣传中起着十分重要的作用,它是一个产品的身份象征,间接影响到产品的销售,公司也越来越器重产品手册的制作。心愿本文中写到的内容可能为你起到帮忙。

March 22, 2022 · 1 min · jiezi

关于运维:产品帮助中心对SaaS行业的作用

帮忙核心是一款SaaS产品必不可少的一部分,为了帮忙用户更好的解决产品相干问题,进步新用户的应用体验,并且疏导其更好地应用产品。 所以明天咱们就来谈谈帮忙核心对SaaS行业的作用,以及制作帮忙核心的办法,每个产品帮忙核心都须要有本人的格调,依据产品的调性进行内容的编辑和页面的优化。 SaaS行业存在的痛点对于操作步骤多且迭代快的SaaS产品来说帮忙核心的重要性显而易见。作为SaaS产品的客服、运维、管理人员你是否会常常面临以下问题: 客服上班后,用户有问题也只能等第二天下班后处理,导致用户体验差产品口碑降落。解决售后问题的时候反复解答同一个问题,客户群内每天都有很多反复的问题,但咱们只能反复打字回复,工作效率低。当用户问到操作较为简单的问题时,咱们须要录制视频通过微信的模式发给用户,耗时且视频会被压缩观看成果不好。不足对业余的产品答疑知识库,使得客服的答复不够对立业余,对于品牌的形象多少有些侵害。为了维持高效的解决问题的速度,须要造就很多客服人员导致人力老本高。帮忙核心对SaaS行业的作用对于SaaS软件公司,其除了优良的产品之外,给予客户良好的服务也是重点,要做到不仅给用户提供优质的产品,还要让他们晓得如何应用产品。所以这里SaaS行业搭建帮忙核心或产品说明书就显得非常重要了! 搭建帮忙核心或产品说明书就相当于给客户提供了一个自助服务平台,顾客能够在售后自助式的、轻松地解决产品应用过程中的疑难杂症。 帮忙核心如何帮忙SaaS行业解决相干问题最简略无效的办法就是,搭建产品帮忙核心将用户在产品应用过程中可能遇到的所有问题,通过Q&A的模式展示给用户。为用户提供一个疾速的自助渠道,不仅能缩小客服工作量,还节俭用户寻找问题的工夫从而优化产品的客户服务性。 以下为产品帮忙核心对SaaS行业的作用 用户拜访帮忙核心本人寻找答案会大大加重客服售后压力,自主学习有助于进步用户学习的积极性同时加深对产品的理解。帮忙核心作为产品知识库,为新员工培训提供了素材,可减轻培训压力缩短培训周期。客服通过产品帮忙核心的学习,使答复更加对立业余。帮忙核心作为智能助手存在,能够达到24小时无差别服务。帮忙核心蕴含了产品的介绍、指南、上新等板块,便于产品品牌宣传。便于客服晋升集体能力,在遇到同一个问题的时候,帮忙核心能够搜到别人解决过的答案,不便疾速解决客户问题。说到了帮忙核心对SaaS行业的作用,那么接下来就给大家梳理下产品帮忙核心的制作方法: 传统的帮忙核心制作方法代码编辑(HTML):即通过代码的形式对帮忙核心内容进行编辑。保护不不便,帮忙核心的保护须要专门的技术人员,对人员配置要求较高。编辑不不便,若进行内容更新、更改错别字、插入图片等,须要程序员从新编写代码进行。智能挪动办公平台:只能在团队外部查看,不反对内部分享,不能检索,应用效率低。*在线文档制作平台:展示款式上十分简陋,文档检索不不便,不能绑定独立域名,长域名不好记忆。论坛软件:相似DZ、flarum程序搭建等前期保护麻烦,局部性能多余且不成熟,容易造成问题。以上这些做法既费时间,还对制作人员有较高的技术考验。所以想要打造好的SaaS帮忙核心页面,选好工具能力事倍功半,这里举荐大家应用Baklib。 Baklib:一款好用的产品帮忙核心制作工具Baklib是一款在线的文档编辑及内容分享工具,不仅为用户提供了好用的常识整顿平台,还提供了优质的常识公布平台,通过Baklib制作的文档内容会主动转化成网站,通过设置的url链接就能进行拜访,不便客户在线观看,帮忙他们对产品的了解,为用户应用提供便当。 Baklib会当时帮制作者布局帮忙页面的展现构造,用户只需将内容按要求编辑进去即可,内容都能间接在视图中预览查看,防止不必要的谬误麻烦。即使是初学者,也可能制作一个精美实用的帮忙核心&产品手册页面。 Baklib官网 产品劣势一款好的帮忙核心/手册制作工具,要让外部搭建员工用的简略,内部拜访的客户看着难受(对外的帮忙核心难看是重点)。产品劣势上我总结了以下4点: 操作上:Baklib在操作上无需构建文档框架(每个主题都有对应的展现框架当初的话有15个主题都是针对帮忙文档场景),关上浏览器就能够用,不懂编程和设计,会用Word就能轻松编辑文档,随时编辑、随时更新、随时公布,保护成本低,让客户点点鼠标就可轻松查看。内部展现上:Baklib提供了多种对外的展现主题反对手机端的适配,能够随便的切换变更色彩,反对页面页脚、独立域名的增加。细节:提供了很多实用的插件包含全局搜寻、用户反馈性能、文章导读、帮忙站点的拜访统计、站点导航。编辑器:丰盛的富文本+Markdown让编辑更加轻松(反对视频、图片、文件上传) 总的来说,要做好SaaS,你的产品得匹配用户的调性、需要,而帮忙核心就可能最好地为用户提供需要,解决问题。

March 22, 2022 · 1 min · jiezi

关于运维:FAQ常见问题页面的编写技巧

FAQ在整体客户体验中起着重要作用,正迅速成为每个公司的必备资源,那咱们明天就来谈谈FAQ页面该如何编辑以及如何制作FAQ页面,留神,以上蕴含两个问题,一个是常见问题解答页面的具体内容,另一个是制作工具。 FAQ是什么?FAQ是“常见问题解答”(英文Frequently Asked Questions的缩写)。FAQ是企业、网站、组织、或者页面性能等设计者提供在线帮忙的次要伎俩,通过当时设计好的一些可能的常问问答,公布在网页上为用户提供咨询服务,以便疾速找到答案信息。 什么问题属于常见问题解答页面?如何决定在你的FAQ页面答复哪些问题?给大家提点参考的倡议01 看看客户的问题第一个很显著:你的客户问你什么?查看您的电子邮件收件箱或社交媒体帐户,看看哪些问题一直呈现。他们在购买前都会询问那些问题?他们可能有什么疑难?您对这些问题的答复越自动化,就越容易让您的客户释怀购买。你也能够节俭本人的工夫。02 查看竞争对手的网站如果你是一家新企业或还没有很多客户查问,能够看看竞品网站是怎么设置的。如果您能比他们更好地答复问题,则加分。03 设置用户反馈收集栏能够用在线表单工具被动的收集用户的反馈,依据最间接的反馈设置FAQ常见问题。FAQ是什么以及他的作用大家都分明了,上面将为大家解读如何创立一个FAQ页面的技巧。 编写一个好的FAQ页面的技巧最重要的是,你的常见问题解答页面应该简单明了,并且十分易于客户应用。这些提醒将有助于确保你的页面遵循常见问题解答最佳实际。使常见问题解答更容易找到,能够创立本人的页面并将其放在网站导航菜单或网站页脚中,以便于查找。从客户的角度写问题,写出读者会问的问题。所以客户是“我”,而你,网站所有者,是“你”。保持这种格局对读者来说更有意义,缩小混同。放弃简短的答复,间接、疾速地答复你的问题是一种解脱。因而,如果能够,请将答案保留在一个短段落中,少于 100 字。残缺答复问题,不要只是链接到不同的页面。以“是”或“否”开始答复是/否问题。防止行话——像客户谈话一样写作,FAQ 运作良好的起因之一是因为它们与用户曾经在思考或询问的内容相匹配。为此,请确保您应用的是客户曾经晓得的词汇和短语。FAQ的正确创立过程:确定FAQ页面的观看人群(次要人群定位)梳理FAQ文章的构造 (个别分为产品介绍、产品劣势、产品性能、应用场景、版本更新)撰写FAQ文章,一问一答的模式(白话文不要讲专业术语)图文联合多用图片和视频更容易被了解提供好用的搜寻性能,提供反馈窗口给用户剖析和改善你的文章,及时更新知识库内容以上局部就是对于FAQ页面的具体内容该如何编辑,所以接下来咱们就谈谈如何制作FAQ页面这个最根本的问题。 FAQ页面制作流程其实FAQ页面的制作并不简单,有一款在线的FAQ制作工具——Baklib,仅仅须要四步一个简洁实用的帮忙界面就进去了。 产品劣势1.易于应用:关上浏览器就能够用,不懂编程技术会用Word就能轻松编辑文档,随时编辑、随时更新、随时公布,让客户点点鼠标就可轻松查看。2.便于搜寻:Baklib在用户每个看失去的FAQ页面都设置了搜寻框,采纳全局搜寻的模式,搜寻后果高亮展现。3.易于编辑:采纳块状的编辑器,所有的内容包含文本、图片、视频、表格、Markdown等内容皆为模块,能够自在拖拽重组,不再依赖传统的顶部工具栏,而是通过模块插入菜单、快捷编辑菜单、格局转换菜单等形式唤起,使得用户的编辑体验更专一。4.丰盛的展示款式:Baklib提供了15+可自定义页眉页脚的主题,让产品FAQ/用户手册更具观赏性。5.权限设定人性化:当须要对产品FAQ/用户手册进行合作和分享时,能够对编辑人员和观看人员进行权限设置,权限界线明显。6.数据安全:除了文件导入外,还反对整个站点的数据导出。

March 22, 2022 · 1 min · jiezi

关于运维:企业知识管理的措施

企业常识治理如何实现?我给出的答案是搭建企业常识管理系统。 企业常识管理系统可能无效地帮忙企业进行常识治理,进步常识治理能力。 以下是总结的对于企业常识治理的教训: 一、从业务流程中布局学习内容常识治理是企业常识发明、获取、加工、存储、流传和利用的治理。实质上,企业适应环境的业务过程自身就是学习。在这个学习过程中,必然会产生大量的常识,大量的常识以暗藏的形式存储在员工的脑海中。 常识治理的目标是使暗藏的常识显著,使其在各个部门之间自在流动。企业常识治理的外围性能是反对业务,使企业成员可能疾速精确地获取信息,利用现有的成功经验和案例为业务决策提供反对,进步业务和服务效率,加强创新能力。 因而,企业知识库的布局建设须要梳理现有的业务流程,从整体业务流程构造中找到要害节点和工作,布局定义相应的常识畛域,实现知识点与业务流动的有机联合。 二、从业务痛点更新知识库企业所处的市场环境动荡,策略、办法、制度、客户、技术、市场等常识都有环境前提。随着环境的疾速变动,常识内容的保存期缩短。为了实现企业知识库的推陈出新,须要从企业的业务问题中收集和发明常识,这是最好的线索。从问题中,咱们能够发现企业政策与环境事实的矛盾,以及最新的环境变动,如客户需要的变动、技术的最新利用、竞争对手的策略等。在此基础上,找出哪些常识曾经过期,哪些常识须要补充和发明。 三、留神要害岗位和工作企业常识简单,容易导致常识碎片化,不易利用。解决企业常识碎片化的办法是将学习内容制作成专题和专栏,并依据常识主题进行分类,不便业务部门的理论学习和利用。业务中的要害地位和工作能够确定为内容主题的根底。 例如,在连锁批发行业,数字学习内容的外围是建设一个以改善商店业务为外围的学习内容体系,以商店经理的要害工作为思维维度。 四、构建翻新常识的机制和气氛在企业外部流传已知常识的同时,员工也要充分发挥个体智慧,翻新常识企业学习部门在治理在线学习平台时,要盲目营造问题共建的机制和组织气氛,构建跨部门、跨组织的智能链接和共建生态,重视将独特发明的成绩倒退成课程等常识产品,为了及时流传和促成学习,造福组织。 五、常识的生产和流传数字学习内容的建设必须采纳自上而下+自下而上相结合的办法。 所谓自上而下,是指企业学习部门的职责是全面落实与专家独特设计的职责,如常识体系建设、业务痛点梳理、常识主题构思、共创生态设计等。在此基础上,调动业务部门一线员工的积极性,让他们积极参与学习内容的独特发明过程。 企业常识管理系统如何搭建?在知识经济时代,利用知识库软件创立常识管理体系成为了企业的不二之选。 Baklib可能作为一款常识管理软件,可能帮助企业进行常识治理,并且通过零碎的常识管理体系,缩小企业对员工的培训老本、劳动工夫老本,进步工作效率,从而加强企业的竞争能力。 十分钟轻松建设一个知识库界面1.首先注册账号,新建站点,填写站点(知识库)名称,域名以及抉择主题色彩,前期都能够在设置再次更改; 2.创立栏目和名称,依据须要创立知识库内容文章,进行分类; 3.设置知识库名称、logo、主题款式(官网提供20+主题收费应用),简略好看的知识库界面就做进去了。 以上就是集体对于企业常识治理的措施的经验总结,心愿你看完之后,能够开始实操起来。

March 21, 2022 · 1 min · jiezi

关于运维:如何实现24小时客户服务

许多企业都有着这样的欲望:在不减少客服人员的同时能实现24小时客户服务。 那么有没有什么办法能够实现这一想法呢?在想解决方案之前咱们能够先来谈谈客服的作用。 客服的作用次要为以下2点: 帮忙用户更快地理解产品(加重产品的上手难度 例如答复用户:xxx性能如何应用)需要的匹配(当初很多用户在产品选型时,都会先问分明产品是否满足需要才会去深度体验,此类情况在企业选型中最为显著)依据以上提到的客服的作用咱们能够想到一种解决方案——想要做好线上客服除了增强产品的应用与理解外,能够通过创立产品知识库帮忙企业实现24小时客户服务。 产品知识库是什么产品知识库是将产品操作、介绍...进行对立存储,是信息提取的柜员机。除了被存储,更重要的是被应用。快捷不便的查问、提取、帮忙客服实时查问、在线学习、推广应用、对立话术脚本等。产品知识库也是晋升效率和服务质量的工具,不仅能给外部客服看还能够提供给用户一个自助服务的好平台,同时为当前的机器智能客服上线提供无效的数据库,在管制人力老本方面几乎是一把好手。 产品知识库的劣势在知识库中创立常见问题,当有客户征询到此类问题时,客服能够将问题链接发给用户,节省时间。用户拜访产品知识库,自助学习产品常识,在加重在线客服压力的同时,能更快解决应用上的纳闷,晋升用户体验。客服通过产品知识库的学习能使答复更加对立,业余。在员工培训时,产品知识库是十分好的培训教材。如何创立无效的产品知识库良好的知识库能够帮忙员工进步工作效率:将问题通过Q&A查问模式转移到知识库中,让您的客户毫不费力地取得他们的问题的答案的同时,让工作人员腾出工夫解决真正重要的问题。在理解到知识库的重要性后,是不是想马上入手创立一个?但在此之前先让咱们理解下如何创立一个无效的知识库。 易于拜访东倒西歪,易于浏览能真正地解决常见问题节俭客户工夫内容放弃最新建设知识库的正确创立过程: 确定知识库的观看人群(对外还是对内?)梳理知识库文章的构造 (如果是对内的话须要老手指南、常见问题、操作难点、产品更新)撰写知识库文章,一问一答的模式(白话文不要讲专业术语)图文联合多用图片和视频更易被了解提供好用的搜寻性能提供反馈窗口给用户,剖析和改善您的文章及时更新知识库内容产品知识库的搭建工具这里举荐应用Baklib搭建产品知识库。 Baklib是一款在线的产品知识库搭建工具,它不仅为产品方提供了好用的常识整顿平台,还提供了优质的常识公布平台,通过Baklib制作的文档内容会主动转化成网站,通过设置的url链接就能进行拜访,不便外部员工和客户在线观看,帮忙他们对产品的了解。

March 21, 2022 · 1 min · jiezi

关于运维:产品手册怎么做用什么软件

仿佛在公众的眼中设计宣传单、海报、证书、手册等信息图时,除了须要可能非常纯熟的使用工具,还须要有好的创意和想法能力发明出好的设计作品。其实,在这个网络飞速发展的时代,只有你选对了工具,即便是老手小白,也能够简略、轻松地设计出别具格调的产品手册。 产品手册是企业市场部输入给用户介绍产品的材料,用户从产品手册中能够理解到产品的用处、性能、应用和保护办法等等,以增进用户对产品的意识,把握操作程序、应用和保护办法。 产品手册在产品创造者和用户之间起到桥梁作用,打造科学合理的产品手册对于产品的经营非常重要。科学合理的产品手册可能起到肯定水平的广告产品的作用,具备非凡的广告效用,从而为产品广开销路。此外,产品手册设计制作所介绍的产品具备很强的常识直观性,可能流传肯定的常识。 产品手册设计通常包含以下几方面的内容: 企业产品的品牌,着重从产品自身的特点登程,找到产品要体现的手法、模式和性质,采纳失当的体现版面模式;留神企业产品的整体形象。产品本身的优劣与广告宣传模式,都关系到产品的销售。企业产品手册的文案策动,以介绍产品个性为主的目录设计画册,再联合企业形象精力,通过企业文化和产品特点整体体现进去。产品手册设计还要重视产品的业余拍摄、产品图片润饰解决。产品手册设计外围:卖点企划产品卖点,是产品手册设计的外围,其次要包含以下内容: 卖点“翻译”:将产品经理或研发提供的“偏技术角度”的卖点,“翻译”成消费者能了解的语言,“翻译”过程中,要思考到用户心理,造成场景重建。将卖点串联起来,并分清主次,要进行有创意的组合,而非简略的列举。卖点的表现形式策动:表现形式,肯定要与设计师一起企划进去,要与设计师全面沟通,讲清了解。与设计部门配合,“实现”创意:要与设计师沟通《产品手册》大小、纸张材质、创意展现、色调使用等。产品卖点能够是多种形式的,比方产品的翻新点、非凡性能点、超高性价比、合乎平安规范等等,具体依据各款产品独自梳理。繁难的产品手册设计办法想要制作好产品手册,抉择好的制作工具软件是要害。明天给大家安利一款能够在线制作产品核心的工具——Baklib,帮忙产品人便捷高效地制作科学合理又好看的产品手册。 产品劣势:一、页面简洁好看展示给用户看的产品手册,有两点很重要,一是页面好看,难看的货色总是吸引人的,会给用户留下好的印象;另一点就是简洁慷慨,让用户理解产品时可能清晰明了。Baklib有多种款式的免费模板供使用者筛选,使用者能够抉择与本人的产品相符合的模板制作带有本人特点的页面,晋升用户的好感度。 二、编辑体验在这个“视觉时代”产品手册中的产品介绍内容出现形式不能繁多,图文、视频、音频等联合既能分明地阐释产品又绝对好看,显得没有那么死板。Baklib编辑器操作相似word,能够任意插入表格、代码块、图片、本地音视频、在线多媒体等,可能满足多种需要,也让常识创作更加轻松。 三、团队协同Baklib反对多人在线合作编辑文档,辞别邮件、传统office软件屡次传输文件的简约,多人协同作业,能够最大水平进步团队工作效力,高效实现制作。 四、数据备份与导出产品在线手册除了电子版本也须要纸质版本,Baklib领有多种格局的数据导出与备份机制,能够将制作的在线产品手册备份、导出,避免在线编辑的内容失落。 五、权限性能当产品手册须要只对局部用户凋谢时,利用Baklib的权限等级性能,能够对整个站点或者内容设置相应权限等级,轻松把控内部人员拜访内容 应用Baklib在线制作产品手册,让用户更全面地理解你的产品,成为产品专家,增强产品线上宣传力和用户留存率。

March 21, 2022 · 1 min · jiezi