-
如何才能不被Kubernetes按在地上摩擦?
所属栏目:[系统] 日期:2021-10-29 热度:54
Kubernetes已经成为行业标准,并且也成为了运维标配,现在出去面试,如果哪个公司没有注明需要Kubernetes技能(国企除外),那么这个公司你就不要考虑了(钱给的实在多除外^_^)。Kubernetes虽然成为了标准,但是不同的运维在实施的时候,或者说不同的公司在使[详细]
-
怎样在Azure DevOps中构建CI/CD管道
所属栏目:[系统] 日期:2021-10-29 热度:179
由Microsoft Azure提供的Azure DevOps是自动化CI/CD流程领域的领先工具。在自动化构建和代码项目中,开发人员可以使用Azure管道将持续集成(CI)和持续交付(CD)相结合,通过一致性的测试,将构建好的代码发送至目标环境。在本文中,我们将共同研究如何配置Azu[详细]
-
Kafka运维你是真的懂数据迁移吗?
所属栏目:[系统] 日期:2021-10-29 热度:185
kafka运维】副本扩缩容、数据迁移、副本重分配、副本跨路径迁移脚本参数参数 描述 例子 --zookeeper 连接zk --zookeeper localhost:2181, localhost:2182 --topics-to-move-json-file 指定json文件,文件内容为topic配置 --topics-to-move-json-file config/[详细]
-
报告大多数组织仍旧处于 CI/CD 之旅的早期阶段
所属栏目:[系统] 日期:2021-10-29 热度:195
当下,CI/CD 和 IaC 等 DevOps 流程对混合云的成功已越来越关键。但调查显示,大多数的开发团队实际上并没有在专家级别实践真正的 CI/CD。CloudBolt 最新发布的一份The Truth About DevOps in the Hybrid Cloud Journey行业洞察报告指出,只有 4% 的受访者[详细]
-
2021年完美的五大DevOps监控工具
所属栏目:[系统] 日期:2021-10-29 热度:116
DevOps集文化理念、技术实践与工具于一身,可以提高组织快速交付应用程序和服务的能力,提高产品的质量和成本效益,能够帮助企业更快速地发展和改进产品,同时DevOps使企业在激烈的市场竞争中能够取得优势。然而对于实施传统基础设施管理和软件开发流程的企[详细]
-
记一次 K8S HostPort 引起的服务故障排错指南
所属栏目:[系统] 日期:2021-10-29 热度:132
最近排查了一个 kubernetes 中使用了 hostport 后遇到比较坑的问题,奇怪的知识又增加了。问题背景集群环境为 K8s v1.15.9,cni 指定了 flannel-vxlan 跟 portmap, kube-proxy 使用 mode 为 ipvs,集群 3 台 master,同时也是 node,这里以 node-1,node-2,n[详细]
-
详解CentOS 7迅速安装Mongodb
所属栏目:[系统] 日期:2021-10-29 热度:57
简介MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统。环境介绍操作系统:CentOS 7CentOS 7 快速安装mongodb下载、安装在mongodb的官网可以直接下载到对应的rpm包,然后使用yum进行安装。CentOS 7 快速安装mongodbyum -y localinstal[详细]
-
2021年DevOps之终极转化
所属栏目:[系统] 日期:2021-10-29 热度:147
一、文档说明DevOps顾名思义,是让机器自动处理软件部署和运维生命周期中的重复性工作,以便操作员可以更快,更有效的实现代码更新和部署迭代,更可靠的运行他们的系统。自2009年创造DevOps一词以来,自动化已经从开发、集成和交付工作的自动化发展到当今运[详细]
-
CentOS 8.4来临,将会是绝唱吗?
所属栏目:[系统] 日期:2021-10-29 热度:160
此次CentOS发布8.4,代号为2105,和以往有区别的是此次不再发布Minimal版本了,取而代之的为boot版本,自去年红帽官方宣布CentOS 8的生命周期停留在2021年, 也就意味着8将是CentOS的绝唱,其实8.4并不陌生,早在5月底另外一款Redhat二进制分支系统AlmaLinu[详细]
-
采用 systemd 作为问题定位工具
所属栏目:[系统] 日期:2021-10-29 热度:101
虽然 systemd 并非真正的故障定位工具,但其输出中的信息为解决问题指明了方向。没有人会认为 systemd 是一个故障定位工具,但当我的 web 服务器遇到问题时,我对 systemd 和它的一些功能的不断了解帮助我找到并规避了问题。我遇到的问题是这样,我的服务器[详细]
-
用来调度任务的 systemd 定时器
所属栏目:[系统] 日期:2021-10-29 热度:72
cron 可以以几分钟到几个月或更长时间的粒度调度运行一个任务。设置起来相对简单,它只需要一个配置文件。虽然配置过程有些深奥,但一般用户也可以使用。然而,如果你的系统在需要执行的时间没有运行,那么 cron 会失败。anacron 克服了系统没有运行的问题[详细]
-
一篇带给你pika简介和安装
所属栏目:[系统] 日期:2021-10-29 热度:61
Pika是一个可持久化的大容量redis存储服务,兼容string、hash、list、zset、set的绝大部分接口。pika简介及安装解决redis由于存储数据量巨大而导致内存不够用的容量瓶颈,并且可以像redis一样,通过slaveof命令进行主从备份,支持全同步和部分同步,pika还[详细]
-
通过抓包来认知gRpc
所属栏目:[系统] 日期:2021-10-29 热度:98
gRpc是什么?gRPC是一个高性能、开源和通用的 RPC 框架,面向移动和 HTTP/2 设计。目前提供 C、Java 和 Go 语言版本,分别是:grpc, grpc-java, grpc-go. 其中 C 版本支持 C, C++, Node.js, Python, Ruby, Objective-C, PHP 和 C# 支持。gRPC基于 HTTP/2 标[详细]
-
运维必学:全局负载平衡与CDN内容分发
所属栏目:[系统] 日期:2021-10-29 热度:128
CDN的基本原理是广泛采用各种缓存服务器,将这些缓存服务器分布到用户访问相对集中的地区或网络中,在用户访问网站时,利用全局负载技术将用户的访问指向距离最近的工作正常的缓存服务器上,由缓存服务器直接响应用户请求。全局负载均衡主要用于在多个区域[详细]
-
远程写下prometheus存储
所属栏目:[系统] 日期:2021-10-29 热度:150
prometheus一般都是采用pull方式获取数据,但是有一些情况下,不方便配置exporter,就希望能通过push的方式上传指标数据。1、可以采用pushgateway的方式,推送到pushgateway,然后prometheus通过pushgateway拉取数据。2、在新版本中增加了一个参数:--enabl[详细]
-
Kubernetes中布局ELK Stack日志收集平台
所属栏目:[系统] 日期:2021-10-29 热度:146
准备环境一套正常运行的k8s集群,kubeadm安装部署或者二进制部署即可1 ELK概念ELK是Elasticsearch、Logstash、Kibana三大开源框架首字母大写简称。市面上也被称为Elastic Stack。其中Elasticsearch是一个基于Lucene、分布式、通过Restful方式进行交互的近实[详细]
-
运维不茫然,请收好这篇事件、故障排查处理思路
所属栏目:[系统] 日期:2021-10-29 热度:54
在讲解事件、故障处理思路前,先讲一个故障场景(以呼叫中心系统作为一例子):业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。运维人员开始忙活了,查资源使用情况、查服务是否正常、查日[详细]
-
DevOps 成功的最大阻碍:文化问题
所属栏目:[系统] 日期:2021-10-29 热度:133
Puppet 发布的 2021 年度 DevOps 状况调查报告指出,83% 的 IT 决策者表明他们的组织正在实施 DevOps 实践;但与此同时,绝大多数组织仍然停留在 DevOps 演变的中期阶段。其中,文化问题是 DevOps 取得成功的最大障碍。这是 Puppet 进行的第十份 DevOps 状况[详细]
-
IT 运维中的事件、故障排查处理思绪
所属栏目:[系统] 日期:2021-10-29 热度:89
在讲解事件、故障处理思路前,先讲一个故障场景(以呼叫中心系统作为一例子):业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。运维人员开始忙活了,查资源使用情况、查服务是否正常、查日[详细]
-
采用 logrotate 命令轮转和归档日志
所属栏目:[系统] 日期:2021-10-29 热度:166
日志非常适合找出应用程序在做什么或对可能的问题进行故障排除。几乎我们处理的每个应用程序都会生成日志,我们希望我们自己开发的应用程序也生成日志。日志越详细,我们拥有的信息就越多。但放任不管,日志可能会增长到无法管理的大小,反过来,它们可能会[详细]
-
在 systemd 中使用控制组管理来源
所属栏目:[系统] 日期:2021-10-29 热度:174
控制组可以按照应用管理资源,而不是按照组成应用的单个进程。作为一个系统管理员,没有事情比意外地耗尽计算资源让我更觉得沮丧。我曾不止一次填满了一个分区的所有可用磁盘空间、耗尽内存、以及没有足够的 CPU 时间在合理的时间内处理我的任务。资源管理[详细]
-
PromQL 查询之 Rate 函数的采用
所属栏目:[系统] 日期:2021-10-29 热度:142
通常来说直接绘制一个原始的 Counter 类型的指标数据用处不大,因为它们会一直增加,一般来说是不会去直接关心这个数值的,因为 Counter 一旦重置,总计数就没有意义了,比如我们直接执行下面的查询语句:demo_api_request_duration_seconds_count{job=demo[详细]
-
kubelet 配置资源预备的姿势
所属栏目:[系统] 日期:2021-10-29 热度:116
Kubernetes 的节点可以按照节点的资源容量进行调度,默认情况下 Pod 能够使用节点全部可用容量。这样就会造成一个问题,因为节点自己通常运行了不少驱动 OS 和 Kubernetes 的系统守护进程。除非为这些系统守护进程留出资源,否则它们将与 Pod 争夺资源并导[详细]
-
说说容器与pod中的僵尸进程
所属栏目:[系统] 日期:2021-10-29 热度:155
按进程在执行过程中的不同情况至少要定义三种状态:运行(running)态:进程占有处理器正在运行的状态。进程已获得CPU,其程序正在执行。在单处理机系统中,只有一个进程处于执行状态;在多处理机系统中,则有多个进程处于执行状态。 就绪(ready)态:进程具备[详细]
-
Below:一个时间旅游的资源监控器
所属栏目:[系统] 日期:2021-10-29 热度:137
内核的主要职责之一是调度对资源的访问。有时这可能意味着分配物理内存,使多个进程可以共享同一主机。其他时候,它可能意味着确保 CPU 时间的公平分配。在这些场景里,内核提供了机制,而将策略留给了别人。近来,这个别人通常是 systemd 或 dockerd 这样[详细]