跳至内容
AI运维

AI运维

AI运维相关

能做哪些事情

日志分析

  • 比人工快
  • 不遗漏细节
  • 跨时间窗口的日志关联分析上更有优势

异常监测

  • 响应更即时

告警处理和分析

优势:

  • 响应更即时
  • 合并告警, 减少冗余告警
  • 可以一并做根因分析

配置检查

  • 检查速度快, 准确率高

安全合规

  • 可以自动检查环境和配置是否符合相关合规要求

脚本编写

  • 单次运行类的任务脚本
  • 调度任务计划生成

运维工具开发

  • 非常高效

接管线上日常运维

  1. 故障自愈
  2. 扩容/缩容
  3. 流量调度

知识库储备

  • 根据历史任务要求, 生成相关规范限制
  • 根据历史故障或事件, 生成相关故障报告, 改建计划,指导后续任务

当前阶段纯AI运维的不足

  1. 事件分析类任务, 容易走弯路, 耗费大量时间在错误路线上探索
  2. 权限控制不完善, AI 可能会执行一些不应该执行的操作, 例如分析过程中修改了错误的文件或执行了错误的命令
  3. 数据隐私问题, AI 可能会访问到敏感数据
  4. 轻重不均, 多个任务时, 可能会花费更多时间在一些不重要的事件上, 而延迟处置一些紧急的事件
  5. 技术栈陈旧, 某些最新的技术或工具, AI训练时还未掌握, 不能支持;
最后更新于