您现在的位置是:课程
Prometheus+Grafana搭建全方位的监控告警系统
2023-11-06 21:57课程 人已围观
一、prometheus简介
Prometheus是一个开源的系统监控和告警系统,现在已经加入到CNCF基金会,成为继k8s之后第二个在CNCF维护管理的项目,在kubernetes容器管理系统中,通常会搭配prometheus进行监控,prometheus支持多种exporter采集数据,还支持通过pushgateway进行数据上报,Prometheus再性能上可支撑上万台规模的集群。
二、prometheus架构图
三、prometheus组件介绍
1.Prometheus Server: 用于收集和存储时间序列数据。
2.Client Library: 客户端库,检测应用程序代码,当Prometheus抓取实例的HTTP端点时,客户端库会将所有跟踪的metrics指标的当前状态发送到prometheus server端。
3.Exporters: prometheus支持多种exporter,通过exporter可以采集metrics数据,然后发送到prometheus server端
4.Alertmanager: 从 Prometheus server 端接收到 alerts 后,会进行去重,分组,并路由到相应的接收方,发出报警,常见的接收方式有:电子邮件,微信,钉钉, slack等。
5.Grafana:监控仪表盘
6.pushgateway: 各个目标主机可上报数据到pushgatewy,然后prometheus server统一从pushgateway拉取数据。
四、课程亮点
五、效果图展示
六、讲师简介
先超(lucky):高级运维工程师、资深DevOps工程师,在互联网上市公司拥有多年一线运维经验,主导过亿级pv项目的架构设计和运维工作
主要研究方向:
1.云计算方向:容器
(kubernetes、docker),虚拟化(kvm、Vmware vSphere),微服务(istio),PaaS(openshift),IaaS(openstack)等
2.系统/运维方向:linux系统下的常用组件(nginx,tomcat,elasticsearch,zookeeper,kafka等),DevOps(Jenkins+gitlab+sonarqube+nexus+k8s),CI/CD,监控(zabbix、prometheus、falcon)等
七、技术交流群
为了大家更快速的学习知识,掌握技术,随时沟通问题,特组建了技术交流群,大家在群里可以分享自己的技术栈,抛出日常问题,群里会有很多大佬及时解答,这样我们就会结识很多志同道合的人,长按下图可加我微信,备注运维或者k8s或者devops即可进群,让我们共同努力,向着美好的未来出发吧~~~
微信:luckylucky421302
八、课程大纲
第一章 自我介绍+课程大纲
1-1.自我介绍
1-2.课程大纲介绍
1-3.课程大纲介绍-补充微信报警
1-4.对您的承诺
1-5.课程课件使用说明
第二章 安装kubernetes(简称k8s)
2-1.准备安装k8s的实验环境
2-2.初始化k8s机器
2-3.安装k8s1.16.4高可用集群
2-4.安装k8s1.17.3高可用集群-视频在百度网盘,可按如下方式加我微信获取
第三章 node-exporter和cadvisor组件介绍
3-1.cadvisor组件介绍-监控容器
3-2.node-exporter组件介绍-监控node节点
第四章 prometheus安装+核心组件+架构介绍
4-1.prometheus简介
4-2.prometheus特点
4-3.prometheus组件介绍
4-4.prometheus架构图
4-5.部署prometheus-在k8s中部署
4-6.部署prometheus-在物理节点部署
4-7.Prometheus metrics类型介绍
第五章 prometheus基于k8s的服务发现-kubernetes_sd_configs
5-1.prometheus服务发现简介
5-2.prometheus重写标签relabel_configs介绍
5-3.prometheus配置endpoints模式的服务发现-监控k8s的apiserver组件
5-4.prometheus监控apiserver组件的各监控指标介绍
5-5.prometheus配置endpoints模式的服务发现-监控k8s所有的service服务
5-6.prometheus基于k8s服务发现总结
第六章 prometheus基于k8s的服务发现-kubernetes_sd_configs
6-1. prometheus配置node模式的服务发现-通过node-exporter监控node节点的cpu/内存/磁盘/网络等
6-2. node-exporter监控指标说明
6-3. prometheus配置node模式的服务发现-通过cadvisor监控容器的cpu/内存/磁盘/网络等
6-4.cadvisor采集容器的监控指标介绍
6-5.总结
第七章 promethues静态服务发现static_configs-监控k8s组件
7-1. prometheus监控kube-schedule组件
7-2. prometheus监控kube-controller-manager组件
7-3. prometheus监控kube-proxy组件
7-6. prometheus监控etcd组件
第八章 grafana介绍
8-1.grafana安装和配置
8-2.配置grafana的web界面-接入prometheus数据源
8-3.grafana导入node的dashboard
8-4.grafana导入容器的dashboard
8-5.grafana导入k8s的dashboard
第九章 容器监控之kube-state-metrics组件介绍
9-1.kube-state-metrics介绍
9-2.安装kube-state-metrics
9-3.kube-state-metrics的监控指标类型介绍
第十章 alertmanager安装+配置详细介绍
10-1.alertmanager安装+配置邮件告警
10-2.alertmanager用于发送告警的邮箱配置
10-3.alertmanager配置自定义告警规则
10-4.创建钉钉机器人
10-5.alertmanager配置钉钉告警
10-6.alertmanager配置钉钉和邮件同时告警
10-7.alertmanager全局配置说明-global
10-8.alertmanager基于标签的告警处理路由-match_re
10-9.alertmanager告警分组group和告警一直inhabit
10-10.alertmanager告警静默-临时静默silence
第十一章 promethues基于k8s的服务发现-Kubernetes_sd_configs
11-1.prometheus配置pod模式的服务发现-监控pod组件
第十二章 prometheus监控扩展
12-1.prometheus监控tomcat
12-2.prometheus监控redis
12-3.prometheus监控mysql
12-4.prometheus监控zookeeper
12-5.prometheus监控mongodb
第十三章 pushgateway
13-1.pushgateway简介
13-2.pushgateway优缺点
13-3.安装pushgateway
13-4.为prometheus添加pushgateway
13-5.上报到pushgateway的数据
13-6.自定义node节点的监控指标数据上报到pushgateway
13-7.honor_labels true 参数介绍
第十四章 在物理节点安装prometheus
14-1.准备实验环境
14-2.在物理节点安装prometheus
第十五章 prometheus联邦集群
15-1.prometheus联邦集群-安装和配置
第十六章 prometheus基于consul的服务发现
16-1.课前须知
16-2.consul简介
16-3.安装consul集群
16-4.在consul中注册node-exporter服务
16-5.配置prometheus基于consul的服务发现
16-6.在consul中注册master2节点的node-exporter
16-7.总结
第十七章 prometheus发送微信报警17-1.配置prometheus接入alertmanager
17-2.配置企业微信,创建接收告警群
17-3.登陆企业微信
17-4.在企业微信添加接收报警成员
17-5.配置prometheus发送微信报警
17-6.自定有prometheus发送报警的告警信息格式
17-7.总结