网络通信 频道

滴滴、魅族分享快速成长背后IT架构变更

  在第三天下午专场15中IT架构新思维演讲中,魅族系统架构师何伟带来了主题为《魅族多机房部署方案》的演讲,多机房容灾是规模互联网企业的必经之路,魅族经过2014-2015年的转型以及销量大爆发后,对互联网业务的可靠性要求有了新的诉求,再加上近期的光纤被挖断事故、某大爆炸对某机房的影响等等,都要求我们尽快实施多机房容灾方案,本次演讲主要介绍魅族在多机房容灾的方案以及实施过程中碰到的问题和对策,以及魅族核心机房的迁移方案和问题的解决方案。


魅族系统架构师 何伟

   对于魅族多机房部署,何伟表示,我将从为什么做多机房部署、多机房部署面临的挑战、魅族的多机房部署以及踩到的坑、多机房流量调度,希望分享大家的主要就是这些方面。

   为什么要做多机房部署?

   对于阿里投资魅族大家都知道了,魅族也放开了手机从原来的小而美,真正走向大众需求,屏幕也从15:9走向了16:9,这也带来了业务的高速增长,用户量暴增,应用商店日PV达到了2.5亿、在线音乐达到了2.3亿、同步数据量也达到了300亿条记录。

   面对关键业务量的暴增,单机房扩展困难,同时还面临着单机房无法容灾的问题,所谓技术再强,扛不住挖掘机,因此多机房部署迫在眉睫。

   多机房面临的挑战

  想要部署多机房,面临着数据一致性难以保障、跨机房专线昂贵、无保障、流量怎么精准调度、业务依赖关系复杂、跨机房网络延迟等等问题。

  对此何伟表示,我们把大部分业务映射为两大类,一类是读多写少的业务;一类是按用户维度划分的业务,其中魅族的应用商店特点,就是榜单展示、数据变化少、一致性要求并不是很高,就是对于每一个业务进行认真分析。

   机房流量调度

  谈到机房流量调度,何伟表示,我们主要采用了智能DNS和GSLB这两种方式,具体如图所示:


智能DNS


GSLB

    通过这两种方式,基本上实现了在广域网上不同地域的服务器建的流量调配,保证使用非常好的的服务器离自己最近的用户,通俗讲就是上海用户访问上海服务,北京用户访问北京服务器,从而确保访问质量。

  遇到的哪些“坑”

  在实施过程中存在的问题是两个方面,首先是VPN设备CPU占用率过高,其次是异地机房Slave Mysql跟不上Master,经过认真的观察、抓包分析,最终我们采取的措施,首先针对电信和联通做了两个VPN相互备份;其次核心数据采取QoS保障,最后采用了专门的VPN设备。

  当然何伟在演讲中还分享了非常多的具体技术细节,想要了解更多内容,可以查看大会报到专题,寻找何伟的PPT,这样就可以找到他的联系方式了! 


0
相关文章