返回顶部

🚀 京峰教育 · Linux云计算 + AIOps大模型全套课程就业大纲

专注Linux云计算 | AIOPS人工智能 | 云原生架构 | 企业级实战

京峰教育 · Linux SRE 云计算高端架构师大纲

从零基础到云原生SRE专家 · AI赋能全栈运维实战课

第一阶段 基础能力 Linux核心+AI运维入门

模块一:Linux运维基石与AI运维认知

  • 1.学Linux意义:AI与云核心载体
  • 2.Linux简介内核与发行版架构
  • 3.Linux优势开源稳定可定制
  • 4.Linux发行版企业/社区版选型
  • 5.Red Hat企业标杆适配AWS/Azure
  • 6.OpenEuler国产开源融华为云
  • 7.Ubuntu云原生AI开发首选
  • 8.SUSE金融级稳定多云管理
  • 9.Fedora新技术AI工具适配
  • 10.Rocky Linux兼容Red Hat
  • 11.32/64位差异:影响AI与云处理
  • 12.Linux内核命名关联AIOps云兼容
  • 13.云计算核心Linux在IaaS/PaaS/SaaS角色
  • 14.Linux前景2026薪资趋势
  • 15.Windows与Linux AIOps分工
  • 16.AI运维定义技术栈价值
  • 17.AIvs传统运维从被动到主动
  • 18.AI运维前景大厂需求落地路径
  • 19.AIOps场景异常检测等案例
  • 20.实战云AIOps配置服务器初始化
  • 21.实战云Linux实例预装AI Agent

模块二:Linux系统部署与AI辅助运维初体验

  • 1.Linux安装准备物理机云服差异
  • 2.企业Linux安装云主机镜像制作
  • 3.学Linux技巧:AI辅助命令排错
  • 4.系统启动云环境流程优化
  • 5.BIOS/UEFI影响云AIOps部署兼容
  • 6.MBR局限GPT替代方案
  • 7.GPT分区表云服AIOps优势
  • 8.GRUB引导配置云故障修复
  • 9.Linux启动流程BIOS到login
  • 10.加载BIOS云虚拟化适配
  • 11.读MBR/GPT云存储挂载
  • 12.GRUB引导AI日志辅助排错
  • 13.加载Kernel云性能优化
  • 14.运行等级systemd管理
  • 15.加载rc.sysinit云监控启动
  • 16.加载内核模块AI加速卡配置
  • 17.启动程序AI Agent自启
  • 18.读rc.local云资源初始化
  • 19.执行login云安全合规
  • 20.NetworkManager对接云监控
  • 21.NMCLI批量配云服网络
  • 22.TCP/IP协议AIOps流量指标
  • 23.IP常识云VPC规划分配
  • 24.IP分类CIDR云网络应用
  • 25.网关/MAC云路由故障定位
  • 26.Linux配IP联动DHCP云服务
  • 27.Linux配DNS对接云解析优化
  • 28.网卡命名适配云资产管理
  • 29.Linux密码重置云服无控制台方案
  • 30.远程管理SSH配置AI批量登录
  • 31.实战DeepSeek辅助GRUB故障修复
  • 32.AI工具部署Ollama+DeepSeek本地化

模块三:Linux核心命令与AI增效工具实战

  • 1.Linux目录FHS标准云环境规划
  • 2.AIOps视角日志配置模型存储规范
  • 3.云存储挂载对象/块存储权限配置
  • 4.基础命令cd/ls/pwd核心操作
  • 5.文件命令mkdir/rm/cp/mv实战
  • 6.日志命令cat/head/tail AI提取异常
  • 7.压缩命令zip/gzip/tar云归档AI压缩
  • 8.系统命令df/du/free对接云监控
  • 9.磁盘命令fdisk/parted云硬盘操作
  • 10.网络命令ping/ssh多云管理
  • 11.diff命令云配置变更检测
  • 12.vim编辑器模式切换运维技巧
  • 13.vim进阶宏录制批量改配置
  • 14.Linux用户组云环境权限隔离
  • 15.用户命令useradd/userdel实战
  • 16.组命令groupadd/groupdel应用
  • 17.权限核心rwx与数字权限转换
  • 18.chown权限分配云安全合规
  • 19.chmod符号数字权限实战
  • 20.案例1授予用户jfedu.net rwx权限
  • 21.案例2授予组jfedu.net权限及撤销
  • 22.案例3jfedu.net权限批量管理AI审计
  • 23.特殊权限SUID/SGID云安全风险
  • 24.umask默认权限云服初始化配置
  • 25.find命令云服异常文件定位
  • 26.实战AnythingLLM构建命令知识库
  • 27.实战Ollama生成云服巡检脚本
  • 28.命令异常AI结合云监控根因分析

第二阶段 核心服务实战 数据库/中间件+AI智能运维

模块一:MySQL数据库运维与AI赋能

  • 1.MySQL简介云原生AI运维趋势
  • 2.数据库对比自建MySQLvs云RDS
  • 3.MySQL/MariaDB部署YUM/二进制
  • 4.MySQL源码部署5.7编译优化
  • 5.MySQL8二进制部署配置规划
  • 6.Mariadb11二进制部署云适配
  • 7.云MySQL部署安全组备份高可用
  • 8.MySQL核心命令增删改查事务
  • 9.字符集设置UTF8mb4编码解决
  • 10.密码管理修改重置云环境适配
  • 11.用户授权细粒度控制云安全
  • 12.my.cnf核心参数性能优化
  • 13.索引案例B+树查询优化
  • 14.慢查询日志开启分析优化
  • 15.命令行技巧批量操作云存储导出
  • 16.MySQL优化索引查询配置三维方案
  • 17.AIOps应用DeepSeek优化SQL索引
  • 18.实战AI监测MySQL慢查询生成方案
  • 19.主从复制原理二进制日志同步
  • 20.MySQL8主从配置云跨区部署
  • 21.主从故障AI辅助日志诊断
  • 22.主从修复忽略错误重新同步
  • 23.MySQL集群高可用对接云负载
  • 24.进阶LLM构建故障知识库智能问答
  • 25.实战AI预处理数据存MySQL支撑分析

模块二:Redis缓存与MyCAT中间件+AI管理

  • 1.Redis7简介内存数据库云缓存价值
  • 2.缓存对比自建Redisvs云缓存
  • 3.LAMP+Redis会话共享缓存案例
  • 4.PHP与Redis交互实战
  • 5.Redis配置核心参数内存优化
  • 6.持久化RDB/AOF结合云备份
  • 7.Redis主从集群数据冗余故障转移
  • 8.Redis Cluster三主三从部署验证
  • 9.Redis Cluster哈希槽通信机制
  • 10.备份恢复云存储方案实战
  • 11.LNMP读写分离Redis缓存加速
  • 12.MyCAT简介数据库中间件价值
  • 13.MyCAT多角色视角关注点
  • 14.MyCAT原理分库分表解决方案
  • 15.MyCAT核心逻辑库表分片表
  • 16.分片规则云数据库分表适配
  • 17.多租户方案独立/共享库隔离
  • 18.数据切分垂直水平优缺点
  • 19.数据切分原则数据源管理
  • 20.MyCAT2部署云主机基础配置
  • 21.MyCAT读写分离测试同步验证
  • 22.MyCAT管理命令版本库表心跳
  • 23.AIOps应用DeepSeek设计分片规则
  • 24.实战AI监控Redis内存生成策略
  • 25.实战MySQL数据AI分析输出建表

模块三:Web服务架构与AI防护优化

  • 1.Nginx简介工作原理事件驱动
  • 2.Web架构Nginx+云负载+CDN
  • 3.Nginx部署二进制源码云安装
  • 4.Nginx模块Access/Auth_basic等
  • 5.限流配置Limit_rate结合云限流
  • 6.Nginx配置性能安全云适配
  • 7.虚拟主机域名端口IP配置
  • 8.Location匹配规则优先级实战
  • 9.Rewrite规则URL重写跳转
  • 10.实战Nginx动静分离LNMP云部署
  • 11.LNMP配置MySQL/PHP/Nginx联动
  • 12.Nginx日志自定义切割转云存储
  • 13.防盗链Referer配置云资源保护
  • 14.HTTPS配置SSL对接云证书
  • 15.Tomcat10部署配置
  • 16.Tomcat配置Server.xml核心参数
  • 17.连接器BIO/NIO/APR性能对比
  • 18.JVM详解堆栈内存模型优化
  • 19.Tomcat优化JVM参数线程池
  • 20.HTTP协议请求响应头状态码
  • 21.HTTP1.1长连接对Nginx影响
  • 22.AIOps应用AI优化Nginx路由
  • 23.AI辅助Nginx防御DDOS异常拦截
  • 24.实战AI分析Nginx性能生成方案
  • 25.实战LLM生成LNMP云部署脚本

第三阶段 监控与日志 分布式监控+AI异常检测

模块一:Zabbix/Prometheus与AI整合

  • 1.监控体系云监控+开源监控协同
  • 2.Zabbix7简介核心组件流程
  • 3.Zabbix采集Agent/SNMP/JMX
  • 4.Zabbix部署Server/Proxy云跨区
  • 5.zabbix_server.conf核心参数
  • 6.Zabbix WEB初始化界面设置
  • 7.Zabbix Agent主动被动模式
  • 8.Zabbix Proxy分布式监控配置
  • 9.Zabbix对接云监控数据同步
  • 10.Zabbix自动发现云主机配置
  • 11.告警配置邮件微信云消息
  • 12.Zabbix监控MySQL主从触发器
  • 13.高级宏批量配置动态参数
  • 14.监控原型批量端口服务可用
  • 15.监控网站关键词业务可用
  • 16.Zabbix常见故障排查思路
  • 17.Zabbix触发脚本故障自动修复
  • 18.Prometheus+Grafana云原生部署
  • 19.Prometheus核心指标数据模型
  • 20.Prometheus对接云监控API聚合
  • 21.Grafana可视化仪表盘制作
  • 22.AIOps整合Zabbix异常AI分析
  • 23.AI异常检测阈值自适应
  • 24.实战ARIMA预测CPU联动云扩容
  • 25.智能告警Zabbix降噪合并
  • 26.实战Zabbix数据训练AI检测模型

模块二:ELFK日志分析与AI智能诊断

  • 1.ELK7架构组件协同数据流向
  • 2.ELK流程采集-过滤-存储-可视化
  • 3.Redis缓冲ELK高并发优化
  • 4.ELFK流程Filebeat轻量采集
  • 5.云ELK部署单节点vs集群伸缩
  • 6.ES7配置用户权限集群设置
  • 7.ES插件IK分词器监控插件
  • 8.ES对接云存储备份恢复
  • 9.ES故障集群脑裂恢复演练
  • 10.Kibana7中文设置访问控制
  • 11.Kibana可视化索引仪表盘
  • 12.Kibana对接云监控面板
  • 13.Kibana安全X-PACK认证
  • 14.Logstash7 JDK配置二进制部署
  • 15.Logstash插件Input/Filter/Output
  • 16.Grok语法日志结构化提取
  • 17.Logstash索引按时间分区管理
  • 18.Filebeat采集Nginx/Tomcat日志
  • 19.Filebeat多日志源自定义索引
  • 20.ELK收集系统MySQL等多类日志
  • 21.ELK分析访问量高峰期识别
  • 22.Redis加速ELK日志缓存削峰
  • 23.AIOps应用DeepSeek解析故障日志
  • 24.ARIMA预测ES数据趋势
  • 25.实战Kibana+AI流量预测报警
  • 26.实战AI绘制Kibana流量预测曲线

第四阶段 自动化与安全 Shell编程+AI运维开发

模块一:Shell编程进阶与AI辅助开发

  • 1.Shell入门脚本执行解释器
  • 2.Shell Hello World脚本权限
  • 3.Shell变量系统环境用户变量
  • 4.Shell符号引号括号重定向
  • 5.If条件整数字符串文件判断
  • 6.If多条件分数评级逻辑
  • 7.Case语句菜单交互分支
  • 8.Select语句交互式菜单
  • 9.For循环数字列表批量操作
  • 10.For循环云服文件传输命令
  • 11.For循环日志打包用户创建
  • 12.While循环条件无限逐行读取
  • 13.While循环文件监控登录监控
  • 14.Shell函数judge_ip封装
  • 15.Find按名称类型大小权限查找
  • 16.SED文本替换删除插入
  • 17.AWK字段处理内置变量
  • 18.GREP文本过滤正则匹配
  • 19.Shell数组定义访问替换删除
  • 20.云脚本Shell调用API启停服务器
  • 21.系统脚本备份信息收集
  • 22.部署脚本LAMP/LNMP一键配置
  • 23.数据库脚本MySQL主从备份
  • 24.监控脚本Nginx日志磁盘监控
  • 25.安全脚本拦截恶意IP
  • 26.AIOps辅助LLM生成巡检脚本
  • 27.Shell预处理AI训练数据
  • 28.实战AI预测驱动Shell云资源调整
  • 29.实战Shell部署管理AI模型

模块二:自动化工具+AI批量化处理

  • 1.云自动化工具选型架构设计
  • 2.工具对比Puppet/Saltstack/Ansible
  • 3.Ansible原理无Agent SSH通信
  • 4.Ansible安装YUM配置详解
  • 5.Inventory主机清单云动态更新
  • 6.Ansible核心模块ping/copy等
  • 7.命令模块command/shell/script
  • 8.文件模块copy/file/synchronize
  • 9.包管理yum/pkg安装升级
  • 10.用户模块user/group管理
  • 11.计划任务模块cron配置
  • 12.Playbook YAML语法组件
  • 13.Playbook变量模板批量部署
  • 14.Ansible调用API批量建云服
  • 15.Ansible优化SSH并发云适配
  • 16.Ansible加速关闭密钥检测
  • 17.Saltstack简介C/S ZeroMQ通信
  • 18.Saltstack部署Master/Minion
  • 19.Salt节点Hosts防火墙配置
  • 20.Salt核心模块ping/cmd等
  • 21.Salt State SLS语法案例
  • 22.SLS案例Nginx/Tomcat部署
  • 23.AIOps应用DeepSeek写Ansible剧本
  • 24.AI+Ansible故障预测自动修复

模块三:Linux安全攻防与AI防护实战

  • 1.云安全体系云主机网络防护
  • 2.TCP/IP报文头部AIOps流量分析
  • 3.TCP握手挥手连接机制
  • 4.DDOS攻击SYN Flood/CC等
  • 5.SYN Flood防御内核优化云联动
  • 6.CC攻击原理防御策略
  • 7.HTTP Flood防御Nginx限流云WAF
  • 9.Hydra暴力破解SSH/MySQL防御
  • 10.Libssh安装源码YUM方式
  • 11.Hydra案例防御日志审计
  • 12.Metasploit渗透组件部署
  • 13.Msfconsole渗透MySQL/Tomcat
  • 14.DenyHosts防暴力破解邮件报警
  • 15.DenyHosts管理IP删除云适配
  • 16.IPtables表链Filter/NAT等
  • 17.IPtables流程转发规则顺序
  • 18.IPtables命令增删改查保存
  • 19.IPtables案例Web数据库防护
  • 20.Firewalld区域管理命令实战
  • 21.Firewalld配置永久规则
  • 22.Linux安全密码Sudo端口管控
  • 23.云主机基线AI自动化审计
  • 24.Shell脚本拦截异常IP
  • 25.AIOps应用DeepSeek生成防御规则
  • 26.实战AI驱动DenyHosts联动云安全组

第五阶段 虚拟化与云原生 Docker/K8s+AI智能调度

模块一:Docker虚拟化与AI管理平台

  • 1.虚拟化概述VMware/KVM/Docker云关系
  • 2.虚拟化技术种类实现对比
  • 3.Docker优势云原生适配性
  • 4.Docker架构Client/daemon/containerd
  • 5.核心概念镜像容器仓库生命周期
  • 6.云Docker部署安装国内源配置
  • 7.企业Docker安全配置资源限制
  • 8.核心命令search/pull/run/exec
  • 9.容器管理stop/start/restart/rm
  • 10.网络模式Bridge/Host/Container
  • 11.Bridge模式容器通信云适配
  • 12.数据卷本地卷云存储挂载
  • 13.Dockerfile FROM/RUN/COPY等命令
  • 14.Dockerfile规范分层优化
  • 15.Dockerfile案例Nginx/MySQL镜像
  • 16.仓库管理Docker Hub/Registry/Harbor
  • 17.Harbor部署云环境镜像管理
  • 18.Docker监控stats对接云监控
  • 19.资源限制磁盘内存CPU配置
  • 20.Docker AI模型快速部署环境一致
  • 21.AI驱动Docker资源动态分配
  • 22.AIOps应用DeepSeek检测镜像漏洞
  • 23.实战AI驱动Docker云弹性伸缩
  • 24.进阶Docker部署LLM服务云适配

模块二:Kubernetes云原生与AI运维实战

  • 1.云计算与K8s核心价值云原生基石
  • 2.云原生微服务与K8s协同
  • 3.K8s组件控制平面节点组件
  • 4.云K8s部署自建vs托管EKS/ACK
  • 5.核心资源Pod/Label/Replication Controller
  • 6.核心资源Service/Node/Volume
  • 7.Volume类型本地云存储对接
  • 8.K8s部署Kubeadm建Master/Node
  • 9.K8s节点Hosts防火墙配置
  • 10.内核参数K8s节点性能优化
  • 11.K8s网络Flannel/Calico云VPC适配
  • 12.私有仓库镜像拉取配置
  • 13.Service方式ClusterIP/NodePort
  • 14.Service案例内部通信外部访问
  • 15.Dashboard部署权限配置
  • 16.K8s故障Etcd/POD/Docker问题
  • 17.托管K8s ACK/EKS集群应用部署
  • 18.AI驱动K8s资源负载感知调度
  • 19.AI助力K8s故障预测自愈
  • 20.AIOps应用AI驱动K8s资源调度
  • 21.实战AI监测K8s Pod故障恢复方案
  • 22.进阶K8s性能监控AI优化

第六阶段 AI运维高阶 大模型开发与企业实战

模块一:LLM知识库与模型微调实战

  • 1.AIOps核心LLM云运维落地场景
  • 2.大模型部署GPU云主机资源配置
  • 3.AnythingLLM部署运维云知识库
  • 4.Ollama管理DeepSeek/LLaMA云适配
  • 5.模型微调运维云监控数据准备
  • 6.Linux包管理RPM/Tar/YUM/源码
  • 7.RPM管理安装查询卸载
  • 8.Tar命令参数系统备份
  • 9.YUM原理本地网络云源配置
  • 10.YUM案例优先级ISO本地源
  • 11.同步外网YUM源扩展
  • 12.硬盘简介Block与Inode
  • 13.软硬链接区别企业应用
  • 14.硬盘故障AI辅助诊断修复
  • 15.实战AI自动配置YUM源
  • 16.实战AI硬盘检测生成报告
  • 17.实战AI收集高频Linux命令优化学习
  • 18.LLM API开发对接运维云平台
  • 19.实战云LLM高可用Docker+K8s部署

模块二:AI运维Agent开发与企业落地

  • 1.AI Agent原理云运维场景设计
  • 2.Agent开发环境云主机配置
  • 3.CI/CD概念传统vs持续集成差异
  • 4.Jenkins简介核心组件价值
  • 5.Jenkins部署WAR包Docker方式
  • 6.Jenkins概念构建/JOB/插件
  • 7.编译工具对比Make/Ant/Maven
  • 8.Jenkins JOB源码拉取构建
  • 9.Jenkins自动化插件脚本集成
  • 10.Jenkins邮件多实例配置
  • 11.Jenkins+Ansible高并发部署
  • 12.版本控制SVN与Git区别选型
  • 13.SVN部署YUM/源码+Apache
  • 14.SVN客户端检出提交分支
  • 15.Git部署YUM/源码配置
  • 16.Git仓库本地远程交互
  • 17.Git命令add/commit/push/pull
  • 18.实战1云资源巡检Agent开发
  • 19.实战2数据库智能运维Agent开发
  • 20.AI预测Jenkins构建失败
  • 21.AI分析Jenkins数据优化流程
  • 22.AIOps整合Agent对接Zabbix/ELK
  • 23.实战AI预测驱动Shell云资源调整

第七阶段 职业进阶 高薪面试与企业项目实战

模块一:企业级综合项目实战

  • 1.高可用集群Keepalived VRRP原理
  • 2.Nginx+Keepalived主从双主架构
  • 3.Redis+Keepalived数据一致性
  • 4.MySQL+Keepalived主从切换
  • 5.Haproxy简介负载算法场景
  • 6.Haproxy+Keepalived配置测试
  • 7.LVS简介工作模式原理
  • 8.LVS+Keepalived DR模式配置排错
  • 9.项目1亿级PV云架构AIOps监控
  • 10.架构设计云负载+Nginx+K8s+云数据库
  • 11.实施Nginx+K8s云部署
  • 12.实施Redis Cluster+MySQL主从跨区
  • 13.实施ELK+Zabbix云监控联动
  • 14.优化AI驱动云资源弹性伸缩
  • 15.项目2企业AIOps平台构建
  • 16.项目3云原生应用AI运维
  • 17.项目4跨平台自动化Ansible+Jenkins
  • 18.项目4优化AI预测构建风险成本

模块二:高薪求职与面试通关

  • 1.AI运维能力模型Linux+AI+云
  • 2.岗位需求解析大厂JD分析
  • 3.选公司发展前景岗位匹配
  • 4.公司规模大厂vs小厂优劣
  • 5.城市选择一线vs新一线机会
  • 6.无经验求职项目包装能力展示
  • 7.年龄性别运维求职技巧
  • 8.简历优化突出Linux+AI+云项目
  • 9.简历常识HR筛选逻辑避坑
  • 10.工作经验STAR法则成果量化
  • 11.项目包装技术深度业务价值
  • 12.个人作品匹配招聘需求
  • 13.面试必问核心知识点3000+题库
  • 14.面试真题云原生AI运维方案
  • 15.面试技巧自我介绍项目讲解
  • 16.技术面试高效沟通技巧
  • 17.职业规划发展路径CKA/AWS认证
  • 18.模拟面试高频问题应答
  • 19.offer谈判入职准备

京峰教育 · AIOPS人工智能大模型架构师大纲

从零基础到企业级专家 · 真正能落地的实战课程

第一章:大模型基础与Ollama实战

  • 1.1 大模型核心概念与价值
  • 1.2 大模型参数与技术本质
  • 1.3 Transformer架构底层原理
  • 1.4 大模型数据训练与算力逻辑
  • 1.5 大模型为什么必须依赖GPU
  • 1.6 Ollama命令行基础操作
  • 1.7 Ollama模型启动与停止全流程
  • 1.8 Ollama交互对话与功能测试
  • 1.9 Ollama模型下载与版本管理
  • 1.10 Ollama离线部署:依赖与安装步骤
  • 1.11 Ollama在线部署:网络与版本配置
  • 1.12 Ollama部署验证与服务状态检查
  • 1.13 Ollama常见部署问题与解决方案
  • 1.14 Ollama配置文件与自定义运行规则
  • 1.15 Ollama CPU/GPU资源限制与管控
  • 1.16 Ollama日志分析与问题排查
  • 1.17 Ollama API接口实战调用
  • 1.18 Ollama高可用部署方案
  • 1.19 Ollama与AIOps场景适配优势

第二章:模型选型与DeepSeek实战

  • 2.1 开源大模型生态与特点
  • 2.2 闭源大模型生态与特点
  • 2.3 企业级大模型选型核心维度
  • 2.4 不同行业场景模型选型策略
  • 2.5 DeepSeek模型部署与验证步骤
  • 2.6 DeepSeek问答功能实战测试
  • 2.7 DeepSeek服务状态查看与监控
  • 2.8 DeepSeek资源不足应对方案
  • 2.9 DeepSeek启动参数与性能调优
  • 2.10 DeepSeek API接口实战集成
  • 2.11 DeepSeek与企业知识库对接实战
  • 2.12 Docker容器化部署DeepSeek方案
  • 2.13 Ollama部署DeepSeek完整流程
  • 2.14 模型一体化部署在AIOps中的应用

第三章:企业级大模型私有实战与硬件架构设计

  • 3.1 硬件配置估算
    • 硬件核心配置逻辑
    • 量化技术与显存优化
    • 典型预算方案
    • 显存估算公式
  • 3.2 硬件选型策略
    • 需求驱动决策
    • 典型企业场景案例
  • 3.3 开源大模型部署实战
    • 部署思路以及方案
    • 阿里云 PAI 一键部署
    • 腾讯云 HAI 体验
    • ollama 方式部署
    • VLLM 方式部署
    • 集群模式部署

第四章:大模型精调优化与企业专属模型定制

  • 4.1 搞懂大模型微调
    • 为什么需要微调
    • 微调技术分类
    • 技术选项指南
    • 微调策略
  • 4.2 大模型微调工具
    • 开源微调工具
    • 商业微调/精调平台
  • 4.3 大模型微调数据集
    • 微调数据集分类
    • 数据集格式
    • 获取公共数据集
    • 制作自己的数据集
  • 4.4 微调超参数
  • 4.5 大模型微调实战
    • 讯飞星火微调实战
    • LLaMA-Factory 微调 Qwen3 大模型
    • Unsloth 微调 Qwen3 大模型

第五章:智能Agent体系构建与自动化运维实战

  • 5.1 智能体理论基础
  • 5.2 Coze 智能体平台
    • 5.2.1 快速体验 Coze 智能体
    • 5.2.2 工作流实战
    • 5.2.3 对话流实战
    • 5.2.4 知识库实战
    • 5.2.5 数据库实战
  • 5.3 基于 Coze 智能体平台实战落地
    • 5.3.1 创建工作流
    • 5.3.2 创建智能体
  • 5.4 基于开源平台 Dify 搭建智能体
    • 5.4.1 认识 Dify
    • 5.4.2 本地部署 Dify
    • 5.4.3 在 Dify 配置模型
    • 5.4.4 在 Dify 配置插件
    • 5.4.5 创建 Chatfow 应用
    • 5.4.6 创建工作流
    • 5.4.7 创建知识库
    • 5.4.8 Dify 智能体实战
  • 5.5 基于 MCP(阿里云百炼)的智能体实战
    • 5.5.1 MCP 基础
    • 5.5.2 快速体验阿里云百炼 MCP
    • 5.5.3 基于阿里云百炼 MCP 做一个旅游规划
  • 5.6 私有部署开源版 Coze
    • 5.6.1 准备 Linux 机器
    • 5.6.2 安装 Docker 和 Docker-compose
    • 5.6.3 克隆源码
    • 5.6.4 运行 coze
    • 5.6.5 使用 coze
  • 5.7 基于 n8n 的智能体实战
    • 5.7.1 N8n 介绍
    • 5.7.2 N8n 部署
    • 5.7.2.1 准备工作
    • 5.7.2.2 安装 n8n
    • 5.7.3 体验 n8n
    • 5.7.3.1 基于模板创建工作流
    • 5.7.3.2 自定义工作流
    • 5.7.3.3 n8n 节点介绍
    • 5.7.3.3.1 触发器节点
    • 5.7.3.3.2 文件操作节点
    • 5.7.3.3.3 控制节点
    • 5.7.3.3.4 循环与迭代
    • 5.7.3.3.5 合并
    • 5.7.3.3.6 流程控制
    • 5.7.3.3.7 code 节点
    • 5.7.3.3.8 数据节点
    • 5.7.3.3.9 存储节点
    • 5.7.3.3.10 三方存储
    • 5.7.4 用 n8n 搭建智能体

第六章:RAG检索增强与企业知识库落地建设

  • 6.1 RAG 基础
  • 6.2 向量数据库 Milvus
    • 6.2.1 了解向量数据库
    • 6.2.2 快速入门 Milvus
  • 6.3 基于 FastGPT 实现 RAG 落地
    • 6.3.1 FastGPT 介绍与安装
    • 6.3.2 快速上手 FastGPT
    • 6.3.3 项目实战
  • 6.4 基于 RAGFlow 实现 RAG 落地
    • 6.4.1 认识 RAGFlow
    • 6.4.2 在 Linux 机器上部署 RAGFlow
    • 6.4.3 快速体验 RAGFlow
    • 6.4.4 项目实战

第七章:大模型运维监控、性能调优与安全治理

  • 7.1 大模型平台监控
    • 7.1.1 基础命令行工具
    • 7.1.2 专业监控工具 Prometheus+Grafana
  • 7.2 大模型优化
    • 7.2.1 优化策略
    • 7.2.2 大模型量化
    • 7.2.3 大模型知识蒸馏
    • 7.2.3.1 知识蒸馏的核心机制
    • 7.2.3.2 知识蒸馏的技术方法分类
    • 7.2.3.3 百度智能云千帆大模型平台做大模型蒸馏
    • 7.2.3.4 用 DistillKit 做大模型蒸馏
  • 7.3 大模型压测
    • 7.3.1 压测指标
    • 7.3.2 压测工具
    • 7.3.2.1 阿里云 PAI 模型在线服务(EAS)
    • 7.3.2.2 百度智能云千帆 ModelBuilder
    • 7.3.2.3 EvalScope
    • 7.3.2.4 Locust
    • 7.3.3 压测实战
  • 7.4 大模型安全运维

第八章:AIOps智能运维平台与企业级AI中枢实战

🔥 AIOps 是本课程重点章节,占篇幅最多,未完,更新中

  • 8.1 AI 辅助编程
    • 8.1.1 GLM4.6 全栈开发
    • 8.1.2 通义零码
    • 8.1.3 Trae
    • 8.1.4 claude code
  • 8.2 产品需求文档设计
  • 8.3 项目开发
    • 8.3.1 用通义灵码落地需求
    • 8.3.2 用 Codex/Claude Code 落地需求
    • 8.3.3 用 AI 克隆一个网站
  • 8.4 项目测试和部署上线
    • 8.4.1 注册账号
    • 8.4.2 将代码推送到 github
    • 8.4.3 在 Vercel 部署项目
    • 8.4.4 绑定域名
  • 8.5 基于 Coze 做运维智能体
    • 8.5.1 Coze 自定义插件
    • 8.5.1.1 基于 API 创建插件
    • 8.5.1.2 基于 IDE 创建自定义插件
    • 8.5.2 自定义 coze 插件管理阿里云机器
    • 8.5.2.1 准备工作
    • 8.5.2.2 创建 Coze 插件
    • 8.5.3 设计 Coze 工作流
    • 8.5.4 设计 aiops 智能体
  • 8.6 用 Coze+Ansible 做自动化运维智能体
    • 8.6.1 准备工作
    • 8.6.1.1 准备 Ansible 环境
    • 8.6.1.2 编写 ansible api 服务脚本并开启 API
    • 8.6.1.3 编写 playbook
    • 8.6.2 创建 coze 插件
    • 8.6.3 创建 coze 工作流
    • 8.6.4 配置 coze 智能体
  • 8.7 用 Dify+jumpserver 做运维智能体
    • 8.7.1 部署 Jumpserver
    • 8.7.1.1 部署 jumpserver
    • 8.7.1.2 快速体验 Jumpserver
    • 8.7.2 部署 Jumpserver MCP
    • 8.7.2.1 获取用户 Token
    • 8.7.2.2 部署 jumpserver MCP
    • 8.7.2.3 到 Dify 上添加 Jumpserver MCP
    • 8.7.3 实现一个简单的需求
    • 8.7.3.1 创建 Dify 应用
    • 8.7.3.2 测试 Dify 应用
    • 8.7.4 做一个综合性应用智能体
  • 8.8 用 Dify+k8s 做运维智能体
  • 8.9 用 Dify+Prometheus+Alertmanager 做运维智能体
  • 8.10 用 n8n+Prometheus+Alertmanager 做运维智能体
  • 8.11 用 Dify+Ansible 的 MCP 做运维智能体
  • 8.12 用 n8n+Jenkins 做 Devops+AIOps 智能体
  • 8.13 AI智能体企业级运维中枢实战
    • OpenClaw 介绍
    • OpenClaw 部署
    • OpenClaw 接入聊天工具
    • OpenClaw 多 Agent 协作
    • OpenClaw 实战
    • OpenClaw 与 AIOps 全场景应用
    • Hermes Agent概念剖析
    • Hermes实战
    • Hermes接入聊天工具
    • Hermes Agent 协作
    • Hermes故障排错实战
    • Hermes Agent与AIOps全场景应用

持续更新中……