AI运维
AI运维
AI运维相关
能做哪些事情
日志分析
- 比人工快
- 不遗漏细节
- 跨时间窗口的日志关联分析上更有优势
异常监测
- 响应更即时
告警处理和分析
优势:
- 响应更即时
- 合并告警, 减少冗余告警
- 可以一并做根因分析
配置检查
- 检查速度快, 准确率高
安全合规
- 可以自动检查环境和配置是否符合相关合规要求
脚本编写
- 单次运行类的任务脚本
- 调度任务计划生成
运维工具开发
- 非常高效
接管线上日常运维
- 故障自愈
- 扩容/缩容
- 流量调度
知识库储备
- 根据历史任务要求, 生成相关规范限制
- 根据历史故障或事件, 生成相关故障报告, 改建计划,指导后续任务
当前阶段纯AI运维的不足
- 事件分析类任务, 容易走弯路, 耗费大量时间在错误路线上探索
- 权限控制不完善, AI 可能会执行一些不应该执行的操作, 例如分析过程中修改了错误的文件或执行了错误的命令
- 数据隐私问题, AI 可能会访问到敏感数据
- 轻重不均, 多个任务时, 可能会花费更多时间在一些不重要的事件上, 而延迟处置一些紧急的事件
- 技术栈陈旧, 某些最新的技术或工具, AI训练时还未掌握, 不能支持;
最后更新于