生产问题排查思路

2023-12-15 00:16:48

生产上有用户反映,登录之后页面信息加载不出来,请求响应时间慢等。
下图为生产上一个请求在网关上面的流程:
在这里插入图片描述
因为我们生产上,有一张异常信息记录表,第一时间查询了上面是否有最近的异常记录。发现了一点,是上图2中,接口公用的这里报错了,有一个null异常,发现出现异常的位置是请求的附件出现了问题。到这其实问题已经是发现的差不多了。

其实如果没有上面的异常记录,第一时间不熟悉网关的流程图,根本就不能这么快速的发送问题点出现在哪里,正常的思路是,按照网关的过滤流程,走一步排除是不是中间哪里的流程出现了问题,如果中间的流程没有问题,是否是请求转发到应用之后哪里出现了,这个就需要更加具体的分析了。
不过我们这里有一个重要的提示是,登录之后访问不了。我们登录和网关是分开的,登录之后生成的token可以供网关校验,但是在登录并没有走后续的token参数解析校验,所以这个问题肯定是出现在网关的流程中。要快速找到问题,对应这种网关的流程走向,应用中的服务间调用,要熟悉其流程,才能更快的找到问题所在。

文章来源:https://blog.csdn.net/weixin_47748878/article/details/134993043
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。