网络通信 频道

运维2.0时代究竟是运维春天还是冬天?

  【IT168 现场报道】2015年10月22日-24日,2015 中国系统架构师大会(SACC 2015)在北京新云南皇冠假日酒店盛大开幕。作为中国规模最大的架构师豪门盛会,本届大会以“互联网+重塑IT架构”为主题,站在互联网+的风口浪尖,与大家共同打造一场助力互联网+,助力企业IT架构转型,助力架构师们腾飞的技术盛会。

  中国系统架构师大会有超过200家知名企业的架构师作为大会的主讲嘉宾,累计有超过10000多名CIO/CTO、IT架构师、技术总监、运维经理与主管、IT系统及网络管理人员参会,累计沉淀了获百万次下载的技术演讲干货素材。本次大会依旧延续了“高人气、高水准、高质量”的属性,汇聚了近百位业界技术领袖,在总计17场TOPIC和Session议题下,与超过2500名IT精英济济一堂,共话互联网+下如何重塑IT架构。

运维2.0时代究竟是运维春天还是冬天?
阿里巴巴高级系统工程师架构师曹世军

  在第一天下午专场3运维2.0演讲中,阿里巴巴高级系统工程师架构师曹世军带来了主题为《阿里巴巴NTP架构及闰秒的保障》的演讲,介绍阿里巴巴基于NTP的时钟基础设施,包括如何利用这些基础设施保障阿里自身和外售的产品及设备的时钟稳定的度过2015闰秒。1. NTP介绍;2. 时间基础设施架构介绍 (基于GPS、北斗卫星授时,配备原子钟守时的多层级时间服务器架构);3. 阿里集团如何无感知度过2015年闰秒。

  NTP那些事

  NTP网络世界协议,主要有三个工作模式,Broadcast/Multicast、Symmetric、Client/Server,然后并不是可以简单配置,首先我们要了解NTP校时原理(C/S模式)。

运维2.0时代究竟是运维春天还是冬天?

  详细分享了校对原理,随后也分享了实际校对过程截图分享。对于NTPdate 和 ntpd相比,ntpdate容易出现运行中系统时间不连续(跳跃、回滚),校时精度较低,但不需要启动系统服务。ntpd运行中不会出现时钟跳跃或回滚,校时精度较高,由于以系统服务的方式后台运行,需要正确配置及安全加固。

  对于采用NTP架构需要注意的问题,原则:three group of three(时钟源、网络路径),ntp two-server problem,最小可工作的上层数目:3台,考虑到冗余的上层数目:4台以上,local clock,prefer,maxpoll,minipoll。

  阿里集团的NTP架构分享

  阿里在2012年是两台时间服务器,现在我们不仅有GPS、北斗两套卫星信号,而且还拥有铷原子频标守时,同时在在一级时间服务器多地域多机房分布,各机房二级时间服务器提供机房内授时等详细操作过程。

  闰秒产生的原因:

  世界时依靠天文观测因此误差较大(每日数毫秒),而原子时依靠原子的物理特性,相对精度较高(每日 误差几个纳秒),UTC 是以原子秒长为基础,在时刻上尽量接近于世界时的一种时间计量系统。

  为了确保 UTC(协调世界时)与 UT(世界时)尽量接近(误差小于 0.9 秒),当通过原子钟计数的 UTC 和 UT 时间误差超过 0.6 秒时,国际地球自转服务组织(IERS)就会决定在最快到来的闰秒调整日期(目前基 本都是 6 月 30 日或 12 月 31 日)的最后一分钟,对 UTC 增加或减少一秒(这一分钟将变为 61 秒或 59 秒), 这个增加或减少的一秒即为闰秒。

  闰秒如何操作:

  如果增加一秒,称为正闰秒,会在调整日的 23:59:59 后额外插入一个 23:59:60,然后再到次日的 00:00:00,这样当日最后一分钟就有 61 秒。

  如果减少一秒,则为负闰秒,会在调整日的 23:59:58 秒后跳过 23:59:59 这一秒,直接到达次日 00:00:00, 这样当日最后一分钟就只有 59 秒。

  当前为止所有的闰秒调整都是正闰秒(说明地球转的越来越慢了)。  

运维2.0时代究竟是运维春天还是冬天?

  对于闰秒很多人还不是很了解,但对于IT部分非常重要,由于闰秒导致每分钟不是固定的60秒,闰秒处理不当,Linux内核处理闰秒有多个BUG(操作系统崩溃),甚至基础应用软件处理不当(JAVA、MYSQL CPU 100%),闰秒是每三年出现一次,阿里在闰秒处理上阿里超过谷歌技术,与AWS采取的技术理念相同。  

0
相关文章