网络通信 频道

571亿背后:DRC助阿里实现异地双活

   571亿背后:DRC助阿里实现异地双活

▲触控科技运维总监萧田国

  数据库运维专场的第三位演讲嘉宾,来自触控科技运维总监萧田国就《天灾还是人祸?Oracle连环严重故障及引发的思考》进行了主题演讲。萧田国对于自己接手Oracle数据库之后发生的连环故障进行了分析,并与现场参会者进行了互动讨论。

  分享的四个故障案例:

  1、Oracle软件bug导致的故障及解决(各种数据块恢复均失败)

  2、服务器系统假死导致的故障及解决(不完全恢复)

  3、服务器更换RAID卡后数据文件头部损坏导致的故障及解决

  4、Oracle无法正常关闭的原因分析及解决

  最后,萧田国表示,对于oracle来说有两个最大的故障,一个是起不来,一个是关不掉,经过这些故障之后,对于DBA而言技术才是专业最大的障碍。

  随后赶集网DBA董泽润分享了《赶集网SQL自动上线》,其中董泽润表示,“对于DBA而言、要有工匠精神,对于提升数据库单机性能,要软硬同时进行优化;优化架构,应对海量数据,分库分表中间件,服务化,各模块解耦; 自动化运维,提高工作效率,减少重复工作, 高可用,做到N个9。”

  来自某互联网DBA黄华亮,分享了《MySQL高可用之MHA的实现及大规模运维实践》,其中黄华亮对MHA的优缺点进行了阐述,优点包括了切换时间短、前后数据强一致性、无脑裂、支持多种切换方式、支持GTID,缺点是只对Master做了高可用,slave没有,依赖SSH及互信,接口参数多,配置维护困难 。


▲大会报道专题
 

1
相关文章