你认为996是最终的互联网用户吗?
有这样一种神秘的工作类型,7×24全天候随时随地待命,所以它成了他们的专属假期——这就是操作和维护。
作为一家服务于数十亿用户的互联网公司,腾讯运营着亚洲最大的网络、服务器集群和数据中心,为数十亿用户提供云计费服务和安全性。操作和维护集成到每个环节中,以确保系统的持续运行和产品的稳定可用性。
为了向运营商致敬,营造开放的运维技术生态,腾讯科技工程和CODING近日在深圳联合举办了首届腾讯运维开放日。腾讯和CODING的运维专家与500多名运维爱好者分享和交流了云计算时代腾讯运维的技术沉淀和实践经验。
从内部组件到云来源,充分保证云上的自主研究业务
2018年9月,腾讯推出了一项重大技术创新,包括成立技术委员会、开源协作,以及在自主研究业务中推广公共云的所有努力。腾讯自主研究云项目负责人周晓军是开放日的发言人之一。他生动地将腾讯庞大的业务云描述为“向云移动大象”他介绍说,业务从私有云转移到公共云的过程分为五个阶段:规划、方案、验证、迁移和运营。其中,最大的困难是使业务适应云的起源,并将大量数据移动到云中。
"和QQ一样,它使用从私有组件到公有云的迁移方法."周晓军表示,2017年,所有的QQ用户仍将使用私有云,到2019年6月,将有1亿名QQ在线用户使用公共云。“我们的计划是到2019年底,在中国南部、东部和北部三个主要地区将100%的QQ用户转移到云环境中。”
「在商业层面,R&D效率更高,资源运用效率更高;在工程师级别,他们可以离开封闭的开发环境和组件,使用业界最标准化的云服务。在客户层面,他们可以将优秀的内部工具和服务导出到云,并将行业在业务迁移到云方面的经验导出到云。”周晓军总结了“云自学”带来的许多好处。
云原生设备帮助企业实现云计算
编码创始人张海龙指出,在云起源的时代,研发团队的组织和工作效率将发生巨大变化。
在张海龙看来,除了服务器上的云之外,还需要更多的结构性变化来充分享受云带来的功能,如扩展能力、监控能力、云的数据库能力、云的缓存能力等。“我们还在与腾讯合作,制作许多DevOps产品,并帮助一些企业走向云计算。我们希望它真的去了云,它是云的起源。”
云厂商提供的PaaS和SaaS服务的广泛使用以及工具而非人肉操作和维护的使用,将大大提高研发团队的发布速度,实现每天发布数十次,从而快速响应市场需求,持续交付高标准产品。从当前的客户案例来看,CODING和滕循云通过其DevOps+云功能为客户带来了至少200%的效率增长。
腾讯云韵功能,小程序云开发的幕后助手
滕旭云在2017年推出了FaaS产品腾讯和其他功能SCF。滕振云中间件产品经理张远喆表示,无服务器是一个相对较新的概念,但使用无服务器对用户有多种好处。“首先,它将减少服务器集群的数量,从而降低开发和操作的复杂性。其次,它可以缩短服务交付周期,提高用户的开发效率。第三,它使开发人员能够专注于业务逻辑的开发,操作和维护人员能够专注于业务的操作和维护,从而增强竞争力。”
以腾讯相册小程序为例,这是一个在四周内开发的可以支持数千万用户的小程序。“根据传统的IaaS模型,如果至少需要八周时间,这仍然是最乐观的估计。”张远喆说。然而,随着无服务器(Serverless)的应用,这个小程序只能在很短的开发周期和少量人力投资后才能上线。据统计,截至2018年12月,其累计用户数已超过1亿,月寿命为1200万。
在运营和维护方面,张远喆认为无服务器可以从业务运营和维护的精细化、运营和维护系统稳定性的提高以及集团业务稳定性的保证三个方面给用户带来实质性的改善。
2018年9月,腾迅云和微信以FaaS和BaA的形式为小程序开发者提供了小程序云开发。在张远喆看来,这一举措极大地推动了无服务器架构在全国开发者心中的流行。
数据中心人机合作、智能运维实践
数据中心是云计算最重要的基础设施。随着滕循云的快速发展,腾讯数据中心的运营和管理面临着更大的挑战。
根据数据中心的智能运维管理水平,行业将数据中心的运维分为三个阶段:S1手动阶段、S2半自动阶段、S3人机合作阶段、自动化阶段和智能阶段。"腾讯目前正处于S2向S3进化的阶段."腾讯数据中心研发主任岳在会上表示。
尚月认为,智能运维的技术方法论是通过运维活动的标准化和流程化,从以传统纸质形式和对讲机为代表的传统数据中心积累大量运维数据,并以数据、场景和平台为出发点,通过数据挖掘、数据分析和数据洞察,构建智能、自动化、现代化和数字化的数据中心。
回顾过去三年腾讯数据中心的数字化转型过程,尚月认为挑战主要来自三个方面:硬件、不同的协议标准、严重的网络区域差异以及难以统一分析的数据。
对此,腾讯的数据中心团队从四个角度逐一突破。“首先,我们与行业领导者联手,牵头制定和推广行业标准“互联网数据中心-基础设施监控指标规范”和“互联网数据中心-基础设施监控系统北接口规范”。其次,我们开发了一系列自动验收工具来检查制造商数据的准确性和有效性。第三,我们建立了一个特殊的控制网络网络,以消除每个数据中心的不同网络差异。第四,通过我们的智能管控平台,将各数据中心的数据统一升级为智能管控平台,依托腾讯强大的研发实力进行统一分析。"
据尚月介绍,腾讯数据中心迄今已管理了80多家国际数据中心和100多万台服务器,现场收集了600多万个硬件测量点和237吨存储数据。“特别重要的是要指出,这一数据仍在以每年40%的速度增长。我们还在不断进行技术创新,以应对快速增长。