网络通信 频道

滴滴、魅族分享快速成长背后IT架构变更

  【IT168 现场报道】2015年10月22日-24日,2015 中国系统架构师大会(SACC 2015)在北京新云南皇冠假日酒店盛大开幕。作为中国规模最大的架构师豪门盛会,本届大会以“互联网+重塑IT架构”为主题,站在互联网+的风口浪尖,与大家共同打造一场助力互联网+,助力企业IT架构转型,助力架构师们腾飞的技术盛会。

  中国系统架构师大会有超过200家知名企业的架构师作为大会的主讲嘉宾,累计有超过10000多名CIO/CTO、IT架构师、技术总监、运维经理与主管、IT系统及网络管理人员参会,累计沉淀了获百万次下载的技术演讲干货素材。本次大会依旧延续了“高人气、高水准、高质量”的属性,汇聚了近百位业界技术领袖,在总计17场TOPIC和Session议题下,与超过2500名IT精英济济一堂,共话互联网+下如何重塑IT架构。

滴滴总监分享烧钱背后IT架构变更辛酸史
滴滴出行首席架构师兼架构部技术总监李令辉

  在第三天下午专场15中IT架构新思维演讲中,滴滴出行首席架构师兼架构部技术总监李令辉带来了主题为《用灵活的架构去适应变化的业务》的演讲,1. 移动互联网遇到的问题,2. 滴滴遇到的问题,3. 如何在战火中重建,4.如何通过架构去解决业务和工作中遇到的问题。

滴滴总监分享烧钱背后IT架构变更辛酸史
▲在战火中修建城市

  李令辉表示,滴滴是一个年轻的公司,刚刚成立三年,技术不是一蹴而就的问题,罗马不是一天建成的,但我们是在战火中修建城市,一直面临着挑战。以下是主要话题分享:

  你是否有过类似的经历?

  1、 刚刚创业的时候找初哥把服务快速上线。

  2、 在没有足够流量考验的时候,架构根本不能适应大流量增长和高并发访问。

  3、 等你花费大量人力时间等成本,开法完毕一个系统,发现需求变化了。

  第一个例子,滴滴支付系统

  *之前的痛点:多份代码,和业务耦合度高,在业务变化中容易出问题。

  *业务快速变化的时候,总要排期很久。政府部门可能三个月正常,但互联网公司一个月排期就很长。

  *支付是个特殊的领域,不能牺牲稳定性,也不能牺牲一致性,而且其实核心业务从未发生改变。

  分析痛点:

  *业务和支付完全分离,更加方便两个团队的效率。

  *业务真的变化那么快吗?,畅享未来三年的发展场景。

  *如何保证业务的伸缩性

滴滴总监分享烧钱背后IT架构变更辛酸史
▲采取的措施

  第二个案例 滴滴架构改造

滴滴总监分享烧钱背后IT架构变更辛酸史

  我们还有野心重新梳理整体业务架构,中国架构师比较不自信,当设计一个新架构的时候,你的领导和同事就会问是否有大公司这么做过,大公司包括了BAT3M。  

滴滴总监分享烧钱背后IT架构变更辛酸史
▲亟需解决的问题

  在这过程中,李令辉还分享了他们对于写代码过程中,多个团队合作问题.....说起来都是一部辛酸史,对于从几十台服务器成长到几百台服务器绝不是大家想想那样仅仅是数量的增加,对于网络架构的不断扩充,整体设计思想越来越重要,只有看的更远,才能更好地满足需求。


  在第三天下午专场15中IT架构新思维演讲中,魅族系统架构师何伟带来了主题为《魅族多机房部署方案》的演讲,多机房容灾是规模互联网企业的必经之路,魅族经过2014-2015年的转型以及销量大爆发后,对互联网业务的可靠性要求有了新的诉求,再加上近期的光纤被挖断事故、某大爆炸对某机房的影响等等,都要求我们尽快实施多机房容灾方案,本次演讲主要介绍魅族在多机房容灾的方案以及实施过程中碰到的问题和对策,以及魅族核心机房的迁移方案和问题的解决方案。


魅族系统架构师 何伟

   对于魅族多机房部署,何伟表示,我将从为什么做多机房部署、多机房部署面临的挑战、魅族的多机房部署以及踩到的坑、多机房流量调度,希望分享大家的主要就是这些方面。

   为什么要做多机房部署?

   对于阿里投资魅族大家都知道了,魅族也放开了手机从原来的小而美,真正走向大众需求,屏幕也从15:9走向了16:9,这也带来了业务的高速增长,用户量暴增,应用商店日PV达到了2.5亿、在线音乐达到了2.3亿、同步数据量也达到了300亿条记录。

   面对关键业务量的暴增,单机房扩展困难,同时还面临着单机房无法容灾的问题,所谓技术再强,扛不住挖掘机,因此多机房部署迫在眉睫。

   多机房面临的挑战

  想要部署多机房,面临着数据一致性难以保障、跨机房专线昂贵、无保障、流量怎么精准调度、业务依赖关系复杂、跨机房网络延迟等等问题。

  对此何伟表示,我们把大部分业务映射为两大类,一类是读多写少的业务;一类是按用户维度划分的业务,其中魅族的应用商店特点,就是榜单展示、数据变化少、一致性要求并不是很高,就是对于每一个业务进行认真分析。

   机房流量调度

  谈到机房流量调度,何伟表示,我们主要采用了智能DNS和GSLB这两种方式,具体如图所示:


智能DNS


GSLB

    通过这两种方式,基本上实现了在广域网上不同地域的服务器建的流量调配,保证使用非常好的的服务器离自己最近的用户,通俗讲就是上海用户访问上海服务,北京用户访问北京服务器,从而确保访问质量。

  遇到的哪些“坑”

  在实施过程中存在的问题是两个方面,首先是VPN设备CPU占用率过高,其次是异地机房Slave Mysql跟不上Master,经过认真的观察、抓包分析,最终我们采取的措施,首先针对电信和联通做了两个VPN相互备份;其次核心数据采取QoS保障,最后采用了专门的VPN设备。

  当然何伟在演讲中还分享了非常多的具体技术细节,想要了解更多内容,可以查看大会报到专题,寻找何伟的PPT,这样就可以找到他的联系方式了! 


0
相关文章