网络通信 频道

运维2.0时代究竟是运维春天还是冬天?

  【IT168 现场报道】2015年10月22日-24日,2015 中国系统架构师大会(SACC 2015)在北京新云南皇冠假日酒店盛大开幕。作为中国规模最大的架构师豪门盛会,本届大会以“互联网+重塑IT架构”为主题,站在互联网+的风口浪尖,与大家共同打造一场助力互联网+,助力企业IT架构转型,助力架构师们腾飞的技术盛会。

  中国系统架构师大会有超过200家知名企业的架构师作为大会的主讲嘉宾,累计有超过10000多名CIO/CTO、IT架构师、技术总监、运维经理与主管、IT系统及网络管理人员参会,累计沉淀了获百万次下载的技术演讲干货素材。本次大会依旧延续了“高人气、高水准、高质量”的属性,汇聚了近百位业界技术领袖,在总计17场TOPIC和Session议题下,与超过2500名IT精英济济一堂,共话互联网+下如何重塑IT架构。

运维2.0时代究竟是运维春天还是冬天?
阿里巴巴高级系统工程师架构师曹世军

  在第一天下午专场3运维2.0演讲中,阿里巴巴高级系统工程师架构师曹世军带来了主题为《阿里巴巴NTP架构及闰秒的保障》的演讲,介绍阿里巴巴基于NTP的时钟基础设施,包括如何利用这些基础设施保障阿里自身和外售的产品及设备的时钟稳定的度过2015闰秒。1. NTP介绍;2. 时间基础设施架构介绍 (基于GPS、北斗卫星授时,配备原子钟守时的多层级时间服务器架构);3. 阿里集团如何无感知度过2015年闰秒。

  NTP那些事

  NTP网络世界协议,主要有三个工作模式,Broadcast/Multicast、Symmetric、Client/Server,然后并不是可以简单配置,首先我们要了解NTP校时原理(C/S模式)。

运维2.0时代究竟是运维春天还是冬天?

  详细分享了校对原理,随后也分享了实际校对过程截图分享。对于NTPdate 和 ntpd相比,ntpdate容易出现运行中系统时间不连续(跳跃、回滚),校时精度较低,但不需要启动系统服务。ntpd运行中不会出现时钟跳跃或回滚,校时精度较高,由于以系统服务的方式后台运行,需要正确配置及安全加固。

  对于采用NTP架构需要注意的问题,原则:three group of three(时钟源、网络路径),ntp two-server problem,最小可工作的上层数目:3台,考虑到冗余的上层数目:4台以上,local clock,prefer,maxpoll,minipoll。

  阿里集团的NTP架构分享

  阿里在2012年是两台时间服务器,现在我们不仅有GPS、北斗两套卫星信号,而且还拥有铷原子频标守时,同时在在一级时间服务器多地域多机房分布,各机房二级时间服务器提供机房内授时等详细操作过程。

  闰秒产生的原因:

  世界时依靠天文观测因此误差较大(每日数毫秒),而原子时依靠原子的物理特性,相对精度较高(每日 误差几个纳秒),UTC 是以原子秒长为基础,在时刻上尽量接近于世界时的一种时间计量系统。

  为了确保 UTC(协调世界时)与 UT(世界时)尽量接近(误差小于 0.9 秒),当通过原子钟计数的 UTC 和 UT 时间误差超过 0.6 秒时,国际地球自转服务组织(IERS)就会决定在最快到来的闰秒调整日期(目前基 本都是 6 月 30 日或 12 月 31 日)的最后一分钟,对 UTC 增加或减少一秒(这一分钟将变为 61 秒或 59 秒), 这个增加或减少的一秒即为闰秒。

  闰秒如何操作:

  如果增加一秒,称为正闰秒,会在调整日的 23:59:59 后额外插入一个 23:59:60,然后再到次日的 00:00:00,这样当日最后一分钟就有 61 秒。

  如果减少一秒,则为负闰秒,会在调整日的 23:59:58 秒后跳过 23:59:59 这一秒,直接到达次日 00:00:00, 这样当日最后一分钟就只有 59 秒。

  当前为止所有的闰秒调整都是正闰秒(说明地球转的越来越慢了)。  

运维2.0时代究竟是运维春天还是冬天?

  对于闰秒很多人还不是很了解,但对于IT部分非常重要,由于闰秒导致每分钟不是固定的60秒,闰秒处理不当,Linux内核处理闰秒有多个BUG(操作系统崩溃),甚至基础应用软件处理不当(JAVA、MYSQL CPU 100%),闰秒是每三年出现一次,阿里在闰秒处理上阿里超过谷歌技术,与AWS采取的技术理念相同。  

    在第一天下午专场3运维2.0演讲中,云智慧 资深技术顾问肖澍带来了主题为《云时代的真实客户体验和应用性能管理》的演讲,云时代的应用前端用户入口层面多样化,各种不同的应用分发渠道让用户和应用的交互更复杂,利用SasS云计算和大数据分析技术,实现更加主动的业务运维,全面监控移动App/在线网站/API服务/应用交易/基础架构性能,提升客户体验,促进应用交付质量。

云智慧应用性能演讲
云智慧 资深技术顾问肖澍

  互联网+时代,越来越多的是通过应用实现,对于日益复杂的业务和IT环境,新的应用交付模式,频繁的迭代更新,都会带来性能影响;多渠道多设备互联,对应用都会有影响;对于多种基础框架和开发技术,都给运维带来影响;很多企业都在采用大规模分布式组合型应用。

  今天看企业IT发展趋势,传统企业IT正逐渐转换到双模式管理形态,传统企业遵循自建自主、稳定性和可用性,但是全新的敏捷IT将会以客户体验为驱动力,速度为王,通过云方式交付。

  现有的监控架构方法存在不足,更多的针对不同的基础架构监控,但最终会在应用服务上展示出来,因此企业不仅需要基础监控,。从IT和应用大数据中进行分析,保障应用性能。

云智慧应用性能演讲

  云智慧将可以提供六大类服务,包含了发现、用户体验、交易追踪、深入诊断、基础设施监控、智能分析,实现提升运维质量,简化故障步骤,降低故障定位耗时、故障修复时长、降低业务损失。

    在第一天下午专场3运维2.0演讲中,安华金和CEO 刘晓韬带来了主题为《数据库Security运维》的演讲,分析当前数据库运维的Security误区与挑战,从从大型集团企业、国有企业、私有云、阿里云看公有云等错多方面分享DB Security运维需求和解决方案,如何突破传统安全,利用数据库安全技术如何帮助DBA实现Security运维。

数据库Security运维
安华金和CEO 刘晓韬

  刘晓韬表示,只所以在运维专场分享,希望将安全的种子种进运维人心中,数据安全问题非常重要。从近两年verizon全球数据泄露调查报告数据显示,数据库中泄露的数据是数据泄漏事件发生的主要来源。对于数据库本身而言,其应用环境相队其他系统要复杂得多,B/S架构使数据库间接暴露到互联网;各种运维人员和IT外包人员直接访问数据库;应用方式的变更使数据库访问形式多样化这种境遇下,迫使我们对数据库的运维安全升级。从运维人员的意识形态上,分享几组数据,根据Oracle对全球430为独立用户成员进行数据库安全调查,结果显示:

  3/4 的成员不清楚特权用户对数据库进行过何种操作

  2/3 的成员不能有效防止特权用户对数据库的非授权访问

  85% 的成员将真实数据不加防范地交与开发人员或第三方人员

  50% 的成员对其非特权用户访问敏感数据毫无措施

  对于数据安全而言,即使上云也无法保证百分百安全,用户在私有云、公有云、行业云、政府专有云上,逐渐接受和使用。我们不得不接受一个现实,对于DBA而言,云环境下,IaaS干掉了基础运维,公司不再需要人各地出差服务器上架了,机房值班更加不需要了;PaaS部分干掉了应用运维,甚至技术含量高的DBA,需求量都将锐减。SaaS甚至干掉连研发都干掉了,使得公有云的使用更加傻瓜化。但是由于云环境下数据集中化存储与共享,加剧了数据泄密的风险,用户对于Security,即安全运维的意识和要求,只会越来越高。

数据库Security运维

  首先,用户需要确认数据在云上是安全的,云环境的维护者无法看到这些数据,即使进入数据库也无法看到敏感的真实数据,其次,只有掌握密钥的应用系统或企业用户才能得到真实数据;系统中的敏感数据的保护需要按照企业用户来区分,钥匙需要掌握在企业用户的手中,不能是一个公共的钥匙;最后,安全要“衔接线下”,将“秘钥”做O2O包装,一定要能够以线下Key、证卡等实物形式来体现,这样能够大幅改善Online完全不受控的感受,让用户能够心里踏实。

0
相关文章