网络通信 频道

一个平台两朵云 看百度如何开放云平台

  【IT168 专稿】2015年4月16日,第六届中国数据库技术大会(DTCC)开幕,大会云集了国内水平最高的数据架构师、数据库管理和运维工程师、数据库开发工程师、研发总监和IT经理等技术人群,继续秉承分享IT非常好的应用实践的宗旨,围绕传统数据库和大数据两条技术主线,在目前IT技术和管理快速的大背景下,更加深入地探讨数据库技术的现状和未来的发展方向。

  本期大会历时3天,在第一天下午的“成就直达号的大数据引擎技术专场”中,来自百度的4位技术专家分别就百度开放云、多媒体数据流业务等话题与参会朋友展开对话。本专场的议题方向是全面解读百度在云、大数据实现上的通用技术,之所以被冠以“成就百度直达号”,是为了与参会者从更直接的从应用角度达成契合,因为直达号本身就是基于百度开放云(BCE)服务生态上的重要服务之一。所以要全面了解百度开放云是什么,就要弄清楚它的前世今生。

  百度开放云的前身

  基于百度整体技术体系和平台,百度绽放了两朵云,一朵是百度私有云,一朵是百度开放云,从时间上看,一个是哥哥一个是弟弟。百度开放云的许多技术实现就是构建在百度私有云的基础之上。

百度开放云的前身
▲一个平台两朵云

  过往,百度私有云架构支撑了百度社区平台和企业平台的发展,支撑20+用户过亿的产品,同时支撑上百万企业客户的不同业务需求。目前百度私有云技术支撑了百度总计近千PB的容量,而且还在以每日800TB的速度增长,时效性方面峰值实时处理能力达到50GB/S,并对内容(网页、广告、日志、UGC)、类型(文本、图片、视频)、形式(结构化、非结构化数据)的支撑。

百度开放云的前身
▲百度私有云架构

  百度私有云架构涉及数据中心IDC、基础设施即服务IaaS,平台即服务PaaS、软件即服务SaaS和客户端。百度基础架构部高级技术经理郑建强主要介绍了百度私有云基础架构,即IaaS与IDC方面情况。

百度开放云的前身
▲百度基础架构部高级技术经理郑建强

  数据中心IDC方面,百度私有云建成了数十个IDC,满足近50万服务器大规模集群部署,并构建了遍布全国的CDN分发网络。同时在整机柜、自研万兆交换机与SSD、高温耐腐服务器等方面不断进行创新。

  郑建强介绍到,“百度的阳泉云数据中心是目前国内最大非常先进的IDC,总容量达16万台服务器,年均PUE低于1.28,建设了国内互联网行业距离最长、容量最大的阳泉-北京-内蒙自建传输系统,实现单波100G、最大容量16T。国内首次批量部署整机柜,达到日交付1万台的能力,部署效率提升20倍。在数据中心的绿色技术创新上,预制化集装箱在国内互联网公司中首次将PUE值降到1.05,高温&耐腐服务器PUE降低0.1。”

  在基础设施即服务IaaS方面,郑建强详细阐述了目前百度在集群操作系统、大规模分布式计算、云存储、云数据库、CDN、负载均衡多个方面的情况。

百度开放云的前身
▲图:百度的集群操作系统架构,通过资源快速调度有效地支撑了百度大规模业务需求。

百度开放云的前身
▲图:大规模分布式计算主要处理百度内部用户数据、财务数据,主要完成高吞吐离线计算平台、大规模机器学习平台、实时流式计算平台三个方面的工作。

百度开放云的前身
▲图:百度在云存储方面的主要进展,主要是在分布式文件系统、分布式表格系统和分布式对象存储系统。

  还有,如云数据库涉及到百度交易和广告相关的应用,达到SQL请求量800亿/日,可用性99.999%:CDN技术进展,分层Cache技术及热迁移技术可承载日均2000亿访问,全局负载均衡FlowOS技术实现各CDN节点流量根据质量成本自动调度,以及故障1分钟内自动切换。负载均衡方面支持四、七层的负载均衡,提供单集群160G的接入能力和四层攻击防御能力,业务根据需求自行在平台接口进行配置,操作无人工干预。

  百度开放云如何演进

  百度开放云从2014年初开始计划实施,依托百度私有云的能力着手进行云产品的规划,并依托基础产品向生态云和行业云演进,直达号就是百度生态云的案例之一。

  郑建强提到,“百度开放云的产品规划包括开放基础设施IaaS的能力,扩展PaaS平台能力,并以引入第三方应用软件为主,自有软件服务为辅,与合作伙伴共建SaaS生态。”

  据悉在百度生态建设方面,有如建站云、广告云、直达号、支付云、移动云、团购云等等等;行业云有教育云、政府云、金融云等,教育云方面提供IaaS、视频转码、在线白板和阅读空间等能力和服务,如政府云提供IaaS、第三方应用和大数据增值等服务。

  郑建强强调,“目前百度开放云已经开放了在计算、存储、数据库、分析、BAE、云安全、云监控等服务。具有安全可靠高性能和高可扩展性的特性。”

百度开放云如何演进
▲图:百度开放云已经开放的服务。

  云服务器(BCC):提供安全可靠、处理能力可弹性伸缩的计算服务,整合高性能服务器和优质网络带宽。

  内容分发网络(CDN):依托百度资源,将源站内容分发至全国所有节点,提高目标用户访问网站的响应速度。与百度搜索,百度网盘,百度地图等产品使用同一套服务。

  对象存储(BOS):提供稳定、安全、高性价比的网络存储服务,支持进行安全分享及灵活的资源访问权限管理。做到存储容量无限扩展,最大支持5TB单文件;数据多备份,可靠性达99.999999999%。

  云磁盘(CDS):为云服务器提供原始的块级存储设备,具有高可靠性和高可用性,支持在线备份和回滚。实现万量级IOPS的高性能。

  关系型数据库(RDS):提供云端集群上的高性能云数据库服务,具有专业的备份、监控及安全管理等功能 ,保障数据的可靠性。sql server的支持后续会上线。

  简单缓存服务(SCS):提供高性能、高可用的分布式内存缓存服务,兼容Redis/Memcache协议。

  百度MapReduce(BMR):提供按需部署Hadoop开源社区生态组件集群的服务,稳定可靠,助力客户快速具备海量数据分析和挖掘能力。已经提供社区版本,,后续还要做计算诊断等增值功能。

  云监控(BCM):提供涵盖监控数据采集、存储、展示、计算、汇聚、报警、统计和智能分析完整流程的监控框架,为客户的业务和资源运维提供一体化解决方案,可实现自定义。

  百度应用引擎(BAE):供弹性、分布式的Web应用和网站托管服务,让您一站式轻松部署Web应用或网站。适合小站点,应用单一,流量小的客户使用。

  云安全(BSS):基于百度安全部门多年的技术和经验积累,提供DDOS防护,主机防护,漏洞扫描,WAF防护等安全功能,保障客户业务系统稳定运行。

  应用服务(SES/SMS):提供丰富的应用层服务,辅助用户更多的增值服务。SMS为简单消息服务,SES为简单邮件服务。

  开放云典型应用-多媒体数据流服务

  随着在线教育,MOOC学院的发展,多媒体数据流服务成为该领域最为典型的应用场景之一,那么百度开放云如何在如此垂直的领域提供服务和技术支持?

  在线教育平台的多媒体数据流服务流程从数据的采集上传、物料审核、物料编辑、课程的版权保护到播放,涉及一系列的特殊服务,为了保证客户的体验、安全可靠,并节省成本。百度开放云提供了开放云对象存储系统(BOS)、开放云多媒体计算系统(BMC)、开放云CDN分发。

开放云典型应用-多媒体数据流服务
▲图:百度开放云给在线教育多媒体流服务提供的端到端能力

  百度基础架构部研发经理李旭表示,“开放云对象存储系统(BOS)从低成本海量存储、多维度数据安全保证、数据可靠性保障方面解决多媒体数据存储面临的挑战。”

开放云典型应用-多媒体数据流服务
▲百度基础架构部研发经理李旭

开放云典型应用-多媒体数据流服务
▲图:BOS系统特性-低成本海量存储

开放云典型应用-多媒体数据流服务
▲图:BOS系统特性-数据可靠性保障

  开放云多媒体计算系统(BMC)克服了海量媒体文件的处理、保证音视频的质量、保护媒体内容的版权等方面的挑战。

  李旭特别介绍了BMC的系统特性高性能音视频转码的优势,“在BMC分时转码框架下做到了转码的全面性,支持对主流视频格式进行转码,同步输出11种码流5种音视频格式等;转码效率上做到了分布式12倍速高效编解码(360fps);转码质量上做到了千级别计算集群使得视频能够高保真转码。”

开放云典型应用-多媒体数据流服务
▲图:BMC分布式转码框架

  在多媒体分发服务方面,开放云CDN分发克服了提升多媒体分发性能和播放体验,控制多媒体分发的成本,保证数据安全方面的挑战。在大规模节点资源提供60+节点,支持电信、联通、移动、铁通、教育网、鹏博士等主流运营线及BGP接入,提供2Tbps的带宽;优质的CDN节点,如PB级存储,视频分发百G带宽,SSD读写,毫秒级响应,节点故障自动切换;多媒体分发优化提供灵活的计费策略,有效控制成本,分发安全防护自带WAF防护。

开放云典型应用-多媒体数据流服务
▲图:百度开放云多媒体数据流服务架构是全流程的解决方案,做到了一站式服务,便捷接入,高稳定性/性能+低成本,全流程的数据安全保护和全流程的加速。

  李旭指出,“未来百度的视频云还要实现视频直播服务,图片转码服务,以及硬件加速等功能。”

0
相关文章