OpenStack的幕后英雄-运维与支撑系统专场
Hosted by China OpenStack User Group
Details
OpenStack平台囊括了计算、存储、网络、消息队列、数据库、HA等技术,而且天然分布式,比一般软件复杂度更高。 再加上常态化的硬件软件故障,使得OpenStack平台的稳定性成为重中之重。
广大OpenStack的DevOps在OpenStack的架构设计、部署、运维、监控、报警、问题排查上发挥各自的聪明才智,解决一个又一个的故障, 并逐步构建完善的OpenStack支撑系统,提高OpenStack的稳定性和可用性,最大发挥OpenStack的价值。
我们这次MeetUp邀请了国内一线的OpenStack专家来讲讲“那些年我们排查过的故障”,相信会有精彩的分享并引起共鸣。具体日常安排如下:
14:00 ~ 14:40 《Neutron运维》
摘要:UnitedStack长期运维着数量众多的公有云和托管云,在Neutron运维上有丰富的实践经验。本次分享将会例数在长期运维中Neutron暴露的各种问题, 包括资源泄漏、Agent服务重启业务中断等等。这些填坑经验对于其他OpenStack网络工程师来说极具参考价值。
嘉宾:马啸,UnitedStack网络负责人,深入理解软件研发和网络架构的资深全栈工程师。
14:40 ~ 15:20 《OpenStack的日志、监控、报警系统》
摘要:Mirantis从2011年开始涉及OpenStack企业级市场,已为200+的企业大客户构建并交付生产级别的开发云平台。在长期的企业级实践中,Mirantis不断 积累相关的部署、运维经验,并把这些经验转化为工具添加到Mirantis OpenStack发行版上。在本次演讲中,将会介绍在最新的MOS 6.1中集成的LMA套件(Logging,Monitoring,Alerting): (1) 应该收集和处理哪些关键metrics,提高运维可视化,使得运维人员可以实时监控OpenStack平台的整个状态 (2) 应该检查哪些健康指标,用于侦测故障,并报警 (3) 应该如何对logs进行索引和搜索,便于进行故障排查。这些内容对于对于如何构建自己的监控系统和解决方案具有极大的参考价值。
嘉宾:唐亚光,Mirantis架构师,OpenStack专家
15:20 ~ 15:35 茶歇
15:35 ~ 16:15 《Ceph的部署、运维》
摘要:分享两年多来分布式存储Ceph的架构设计到部署、监控、运维经验。
嘉宾:朱荣泽,Mirantis架构师,OpenStack/Ceph专家
16:15 ~ 17:00 Q&A
