当前聚焦:应用性能监控系统SkyWalking

2023-01-09 14:26:36 来源:51CTO博客

1. 概念与架构

SkyWalking是一个开源监控平台,用于从服务和云原生基础设施收集、分析、聚合和可视化数据。SkyWalking提供了一种简单的方法来维护分布式系统的清晰视图,甚至可以跨云查看。它是一种现代APM,专门为云原生、基于容器的分布式系统设计。

SkyWalking从三个维度对应用进行监视:service(服务), service instance(实例), endpoint(端点)


【资料图】

服务和实例就不多说了,端点是服务中的某个路径或者说URI

SkyWalking allows users to understand the topology relationship between Services and Endpoints, to view the metrics of every Service/Service Instance/Endpoint and to set alarm rules.

SkyWalking允许用户了解服务和端点之间的拓扑关系,查看每个服务/服务实例/端点的度量,并设置警报规则。

1.1. 架构

SkyWalking逻辑上分为四个部分:Probes(探针), Platform backend(平台后端), Storage(存储), UI

这个结构就很清晰了,探针就是Agent负责采集数据并上报给服务端,服务端对数据进行处理和存储,UI负责展示

2. 下载与安装

SkyWalking有两中版本,ES版本和非ES版。如果我们决定采用ElasticSearch作为存储,那么就下载es版本。

​​https://skywalking.apache.org/downloads/​​

​​​https://archive.apache.org/dist/skywalking/​​​

agent目录将来要拷贝到各服务所在机器上用作探针bin目录是服务启动脚本config目录是配置文件oap-libs目录是oap服务运行所需的jar包webapp目录是web服务运行所需的jar包

接下来,要选择存储了,支持的存储有:

H2ElasticSearch 6, 7MySQLTiDBInfluxDB

作为监控系统,首先排除H2和MySQL,这里推荐InfluxDB,它本身就是时序数据库,非常适合这种场景

但是InfluxDB我不是很熟悉,所以这里先用ElasticSearch7

​​https://github.com/apache/skywalking/blob/master/docs/en/setup/backend/backend-storage.md​​

2.1. 安装ElasticSearch

​​​https://www.elastic.co/guide/en/elasticsearch/reference/7.10/targz.html​​​

​启动

./bin/elasticsearch-d-ppid

#停止

pkill-Fpid​

ElasticSearch7.x需要Java 11以上的版本,但是如果你设置了环境变量JAVA_HOME的话,它会用你自己的Java版本

通常,启动过程中会报以下三个错误:

[1]:maxfiledescriptors[4096]forelasticsearchprocessistoolow,increasetoatleast[65535]

[2]:maxvirtualmemoryareasvm.max_map_count[65530]istoolow,increasetoatleast[262144]

[3]:thedefaultdiscoverysettingsareunsuitableforproductionuse;atleastoneof[discovery.seed_hosts,discovery.seed_providers,cluster.initial_master_nodes]mustbeconfigured​

解决方法:

在 /etc/security/limits.conf 文件中追加以下内容:

在 /etc/security/limits.conf 文件中追加以下内容:

​*softnofile65536

*hardnofile65536

*softnproc4096

*hardnproc4096

可通过以下四个命令查看修改结果:

ulimit-Hn

ulimit-Sn

ulimit-Hu

ulimit-Su

修改/etc/sysctl.conf 文件,追加以下内容:

vm.max_map_count=262144

修改es配置文件 elasticsearch.yml 取消注释,保留一个节点

cluster.initial_master_nodes:["node-1"]

为了能够ip:port方式访问,还需修改网络配置

network.host:0.0.0.0​

修改完是这样的:

至此,ElasticSearch算是启动成功了

​接下来,在 config/application.yml 中配置es地址即可

storage:

selector:${SW_STORAGE:elasticsearch7}

elasticsearch7:

clusterNodes:${SW_STORAGE_ES_CLUSTER_NODES:192.168.100.19:9200}​

2.2. 安装Agent

​​https://github.com/apache/skywalking/blob/v8.2.0/docs/en/setup/service-agent/java-agent/README.md​​

将agent目录拷贝至各服务所在的机器上

scp-r./agentchengjs@192.168.100.12:~/​

这里,我将它拷贝至各个服务目录下:

​plugins是探针用到各种插件,SkyWalking插件都是即插即用的,可以把optional-plugins中的插件放到plugins中

修改 agent/config/agent.config 配置文件,也可以通过命令行参数指定

主要是配置服务名称和后端服务地址

agent.service_name=${SW_AGENT_NAME:user-center}

collector.backend_service=${SW_AGENT_COLLECTOR_BACKEND_SERVICES:192.168.100.17:11800}

当然,也可以通过环境变量或系统属性的方式来设置,例如:

exportSW_AGENT_COLLECTOR_BACKEND_SERVICES=127.0.0.1:11800

最后,在服务启动的时候用命令行参数 -javaagent 来指定探针

java-javaagent:/path/to/skywalking-agent/skywalking-agent.jar-jaryourApp.jar

例如:

java-javaagent:./agent/skywalking-agent.jar-Dspring.profiles.active=dev-Xms512m-Xmx1024m-jardemo-0.0.1-SNAPSHOT.jar​

3. 启动服务

修改 webapp/webapp.yml 文件,更改端口号及后端服务地址

​server:

port:8080

collector:

path:/graphql

ribbon:

ReadTimeout:10000

#Pointtoallbackend"srestHost:restPort,splitby,

listOfServers:127.0.0.1:12800

启动服务

bin/startup.sh

或者分别依次启动

bin/oapService.sh

bin/webappService.sh​

查看logs目录下的日志文件,看是否启动成功

​浏览器访问 ​​​​http://127.0.0.1:8080​​​

4 告警

编辑 alarm-settings.yml 设置告警规则和通知

​​https://github.com/apache/skywalking/blob/v8.2.0/docs/en/setup/backend/backend-alarm.md​​

重点说下告警通知

​为了使用钉钉机器人通知,接下来,新建一个项目

"1.0"encoding="UTF-8"?>

"http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://maven.apache.org/POM/4.0.0https://maven.apache.org/xsd/maven-4.0.0.xsd">

4.0.0

org.springframework.boot

spring-boot-starter-parent

2.4.0

com.wt.monitor

skywalking-alarm

1.0.0-SNAPSHOT

skywalking-alarm

1.8

org.springframework.boot

spring-boot-starter-web

com.aliyun

alibaba-dingtalk-service-sdk

1.0.1

commons-codec

commons-codec

1.15

com.alibaba

fastjson

1.2.75

org.projectlombok

lombok

true​

org.springframework.boot

spring-boot-maven-plugin

定义告警消息实体类

​packagecom.wt.monitor.skywalking.alarm.domain;importlombok.Data;importjava.io.Serializable;/***@authorChengJianSheng

*@date2020/12/1*/@DatapublicclassAlarmMessageDTOimplementsSerializable{privateintscopeId;privateStringscope;/***Targetscopeentityname*/

privateStringname;privateStringid0;privateStringid1;privateStringruleName;/***Alarmtextmessage*/

privateStringalarmMessage;/***Alarmtimemeasuredinmilliseconds*/

privatelongstartTime;

}​

发送钉钉机器人消息

​packagecom.wt.monitor.skywalking.alarm.service;importcom.dingtalk.api.DefaultDingTalkClient;importcom.dingtalk.api.DingTalkClient;importcom.dingtalk.api.request.OapiRobotSendRequest;importcom.taobao.api.ApiException;importlombok.extern.slf4j.Slf4j;importorg.apache.commons.codec.binary.Base64;importorg.springframework.beans.factory.annotation.Value;importorg.springframework.stereotype.Service;importjavax.crypto.Mac;importjavax.crypto.spec.SecretKeySpec;importjava.io.UnsupportedEncodingException;importjava.net.URLEncoder;importjava.security.InvalidKeyException;importjava.security.NoSuchAlgorithmException;/***https://ding-doc.dingtalk.com/doc#/serverapi2/qf2nxq

*@author

*@data

@ServicepublicclassDingTalkAlarmService{

@Value("${dingtalk.webhook}")privateStringwebhook;

@Value("${dingtalk.secret}")privateStringsecret;publicvoidsendMessage(Stringcontent){try{

Longtimestamp=System.currentTimeMillis();

StringstringToSign=timestamp+"\n"+secret;

​Macmac=Mac.getInstance("HmacSHA256");

mac.init(newSecretKeySpec(secret.getBytes("UTF-8"),"HmacSHA256"));byte[]signData=mac.doFinal(stringToSign.getBytes("UTF-8"));

Stringsign=URLEncoder.encode(newString(Base64.encodeBase64(signData)),"UTF-8");

StringserverUrl=webhook+"×tamp="+timestamp+"&sign="+sign;

DingTalkClientclient=newDefaultDingTalkClient(serverUrl);

OapiRobotSendRequestrequest=newOapiRobotSendRequest();

request.setMsgtype("text");

OapiRobotSendRequest.Texttext=newOapiRobotSendRequest.Text();

text.setContent(content);

request.setText(text);

client.execute(request);

}catch(ApiExceptione){

e.printStackTrace();

log.error(e.getMessage(),e);

}catch(NoSuchAlgorithmExceptione){

e.printStackTrace();

log.error(e.getMessage(),e);

}catch(UnsupportedEncodingExceptione){

e.printStackTrace();

log.error(e.getMessage(),e);

}catch(InvalidKeyExceptione){

e.printStackTrace();

log.error(e.getMessage(),e);

}

}

}

AlarmController.java

packagecom.wt.monitor.skywalking.alarm.controller;importcom.alibaba.fastjson.JSON;importcom.wt.monitor.skywalking.alarm.domain.AlarmMessageDTO;importcom.wt.monitor.skywalking.alarm.service.DingTalkAlarmService;importlombok.extern.slf4j.Slf4j;importorg.springframework.beans.factory.annotation.Autowired;importorg.springframework.web.bind.annotation.PostMapping;importorg.springframework.web.bind.annotation.RequestBody;importorg.springframework.web.bind.annotation.RequestMapping;importorg.springframework.web.bind.annotation.RestController;importjava.text.MessageFormat;importjava.util.List;/***@authorChengJianSheng

*@date

@RestController

@RequestMapping("/skywalking")publicclassAlarmController{

@AutowiredprivateDingTalkAlarmServicedingTalkAlarmService;

@PostMapping("/alarm")publicvoidalarm(@RequestBodyListalarmMessageDTOList){

log.info("收到告警信息:{}",JSON.toJSONString(alarmMessageDTOList));if(null!=alarmMessageDTOList){

alarmMessageDTOList.forEach(e->dingTalkAlarmService.sendMessage(MessageFormat.format("-----来自SkyWalking的告警-----\n【名称】:{0}\n【消息】:{1}\n",e.getName(),e.getAlarmMessage())));

}

}

}​

标签: 以下内容 配置文件 启动成功

上一篇:【XML】XML解析与校验
下一篇:lcd屏和oled屏的优缺点是什么(lcd屏和oled屏的区别是什么)