人性:不想遇到问题,不想处理问题,只想轻轻松松的过日子。

理性:当遇到问题时,如果不主动处理,不第一时间处理,问题的影响范围可能会扩大;

用户反馈问题给我  远不如 我主动反馈问题给用户,态度、体验、感受、性质是很不一样的。

该需要处理的问题,早晚得处理。

1、前端,增加各种静态判断,减少不正常的请求到后端

2、后端,必要的参数检查

3、后端,捕捉预期的异常错误,给用户返回提示

4、话术要友好

如果不差那点时间,给出准确的提示。

比如cas登录时ticket过期了,cas返回“ticket is out of date”,开发人员比较友好

5、避免出现“未知” 这种 不自信的话术

可以把“未知”改成 xxx,举例子。

友情说明:这里的未知错误话术提示,是可配置的。

6、sre增加错误监控

公司通用的“日志监控”,大概是配置error日志监控

7、手动监控

发送邮件和企业微信通知

潜在问题:报警邮件,可能发送的太多了。比如:1个配置错误,开发人员没看到,每次访问或者每次定时任务执行,都报错。

解决办法:业务系统 或者 基础服务cs,增加频次控制。比如:2分钟内,同样的通知,只发送1次。

8、收到错误消息,第一时间处理:自己处理、群里通知、告知上下游、主动联系用户

低优先级的技术问题:记录下来,修复

高优先级的技术问题:最近1个版本,尽快修复

影响到用户的问题或者业务类问题: 务必尽快告知 产品和测试,尽快在 项目群通知下

(如果产品和测试不嫌烦,可以加入到线上问题的收件人)

9、告知用户上下文信息,减少用户咨询量

复杂的业务逻辑,需要简化;

或者,在界面中体现出来,让用户秒懂;

用户如果不懂、有疑问,就会咨询产品和运营;产品和运营有疑问,就会让开发排查。