去年,腾讯在华南清远养“机”(计算机),开了一个百万级的数据中心。
管理这么多“机”,不是一件容易事。
需要一套成熟的系统,能及时响应又能解放双手
昨天,第九届数据中心标准峰会上,这套腾讯智维数据中心自动化运营管理产品体系升级了!
关键词是:自动化。
以前管理数据中心,时不时会遇到人力难保障、很依赖技术人员经验、操作易失误、效率较低和难以集中管理等问题。这套系统,能帮助数据中心自动定位故障问题,及时同步可能出现的隐患,减少人工运营成本,提升整体运维效率等。
它有多自动化?
比如:
电力出故障了,它能快速自动定位原因;
环境温度异常,它能实时自动告警;
发现能耗过高,它可以自己分析处理;
家里来访客了,也能自动精准识别核实;
设备老旧了,它能自动智能分析,早发现早治疗;
甚至数据中心利用率低,它也能自动给出建议和规划等等
秒采、秒存、秒算
在日常运营里,最怕遇到的就是告警信息。
数据中心出现某些异常(比如市电异常),会在短时间内产生几千甚至上万次的告警。
运维人员,就得跟时间赛跑。
他们要从大量告警中,快速定位原因并处理,一旦慢了,就很容易造成业务中断卡顿或者恢复时间长等严重问题。
升级的腾讯智维动环平台,就可以帮助解决这些问题。
它专门服务于数据中心的动力环境监测,能解决告警策略繁杂不精准、系统部署周期长、效率低等问题,强项就是一个字:快。
动环平台能实现监测数据的秒采、秒存、秒算,3秒以内将底层告警上传平台呈现。
无人养“机”
要实现无人养“机”,安防很关键。
以往数据中心得配合很多安防人力,来辨别来访者的身份信息等。
现在这事,交给AI做。
腾讯觅踪的智能安防管理系统,结合了AI、自研的高性能视频分发服务、高精度物联网定位技术、针对数据中心场景特别优化的H5图形渲染引擎等核心技术能力。可以实现7*24小时不间断的主动式安防管理,可以快速精准地识别来访者身份,形成完整的踪迹,减少安防压力。
腾讯还在数据中心里设置了巡检巡逻和上下架机器人,可以大幅简化运维流程,减少人员操作失误的风险。
这样,数据中心的运营人员,不用到现场,也能实现远程养“机”。
帮助进行碳管理
数据中心也在不断节能减排。腾讯新推出的碳管理平台,提供了碳排查、负荷预测、可再生能源利用情况分析等能力。
有了这些能力,运维人员就能清晰地知道,数据中心排了多少碳,哪些地方能更地减排,一起助力实现碳中和。
现在,这一整套系统,已经支持了腾讯全球近百个数据中心、超20万机架规模的自动化管理运营,也服务了电信运营商、互联网、金融等行业的大批客户。