▲触控科技运维总监萧田国
数据库运维专场的第三位演讲嘉宾,来自触控科技运维总监萧田国就《天灾还是人祸?Oracle连环严重故障及引发的思考》进行了主题演讲。萧田国对于自己接手Oracle数据库之后发生的连环故障进行了分析,并与现场参会者进行了互动讨论。
分享的四个故障案例:
1、Oracle软件bug导致的故障及解决(各种数据块恢复均失败)
2、服务器系统假死导致的故障及解决(不完全恢复)
3、服务器更换RAID卡后数据文件头部损坏导致的故障及解决
4、Oracle无法正常关闭的原因分析及解决
最后,萧田国表示,对于oracle来说有两个最大的故障,一个是起不来,一个是关不掉,经过这些故障之后,对于DBA而言技术才是专业最大的障碍。
随后赶集网DBA董泽润分享了《赶集网SQL自动上线》,其中董泽润表示,“对于DBA而言、要有工匠精神,对于提升数据库单机性能,要软硬同时进行优化;优化架构,应对海量数据,分库分表中间件,服务化,各模块解耦; 自动化运维,提高工作效率,减少重复工作, 高可用,做到N个9。”
来自某互联网DBA黄华亮,分享了《MySQL高可用之MHA的实现及大规模运维实践》,其中黄华亮对MHA的优缺点进行了阐述,优点包括了切换时间短、前后数据强一致性、无脑裂、支持多种切换方式、支持GTID,缺点是只对Master做了高可用,slave没有,依赖SSH及互信,接口参数多,配置维护困难 。