按关键词阅读: 开发者 Microsoft WSAtools
更直观地说,假设每一个比特都是一枚硬币,大约3毫米厚。由一摞硬币组成的1ZB将有2550光年高,可以到达最近的恒星系统半人马座阿尔法星600次。目前,我们每年产生的数据量是这个数字的59倍,复合增长率估计在61%左右。
为满足日益增长的数字数据存储需求,每两年就会有约100个新的超大规模数据中心建成。根据工信部印发的《新型数据中心发展三年行动计划(2021-2023年)》,到2023年底,全国数据中心机架规模年均增速保持在20%左右,总算力超过200EFLOPS,高端算力占比达到10%。
大量数据吞吐和运算,不可避免地增加用电量,这将排放大量二氧化碳,以及二氧化硫、氮氧化物等主要环境污染物。2018年,中国数据中心总用电量为1608亿千瓦时,占全社会用电量2.35%,用电相关排放量为9855万吨二氧化碳,成为名副其实的“耗能大户”。按照当前速度发展,预计到2023年,数据中心能耗将相当于2.6个三峡电站的发电量,碳排放量将达1.63亿吨。
面对不可忽视的能耗问题,建设一体化大数据中心、破解高能耗难题,找准破局关键点尤为重要。然而,事实是,由于不同主体对信息化的不同需求,各类数据依然被封存在不同的系统中,孤岛林立,不可避免地造成了资源的浪费。
数字信息通常存储在三种地方:一是全球各地的终端,包括所有物联网设备、个人电脑、智能手机和所有其他信息存储设备。二是边缘位置,包括基础设施如手机发射塔和机构服务器,以及服务处如大学、政府办公室、银行和工厂。三是存储大部分数据的核心位置——传统数据服务器和云数据中心。
然而,在设计信息系统架构时,由于没有一套参照的标准。因此,不同的主体的不同的选择,使得各类数据依然被封存在不同的系统中。以政府为例,根据政府采购网的采购公告,仅过去半年就有11431条相关采购,各省的各种单位都有,采购金额从几十万到几百万不等,比如:
【 数据存储|陈根:数据存储,如何解决能耗问题和孤岛现状?】中国教育图书进出口有限公司私有云存储扩容采购项目230万;重庆大学全闪存储及服务器采购项目243万;中央广播电视总台私有云存储设备全包代维项目150万;广州中山大学第一附属医院数据中心服务器与存储扩容升级项目601万;广东工贸职业技术学院存储容量扩容项目 30万等等。
这带来的后果,首先是每个单位都有自己的机房、服务器和管理员,造成管理成本上的浪费;再就是当每个单位都使用自己的存储格式、数据库设计、操作软件,将不利于数据通用和对外开放,而大量数据吞吐和运算,又不可避免地增加用电量,侧面带来能耗上的浪费。
政府尚且如此,更不用说以商业为目的企业。因为企业在不同发展时段对信息化有着不同需求,在搭建基础设施与软件系统时本就有侧重。再加上有限的预算与部署难度,使得很多企业信息化系统之间都互不相通。
往往每个事业部都有各自存储、各自定义的数据。各部门数据就像一个个孤岛一样无法和企业内部其他数据进行连接互动。存在数据孤岛的企业,所有数据被封存在各系统中,让完整的业务链上孤岛林立,信息的共享、反馈难。数据之间缺乏关联性,数据库彼此无法兼容。
合理规划打破孤岛如何解决能耗问题和数据孤岛,更好地存储、管理和使用数据是数据存储的当务之急。
显然,社会对数据存储和使用的认识有待提高。当前,随着全球云计算产业的深刻变化,其产生了越来越多的新型数据库,这些数据库一方面依靠存储技术来存储海量数据,另一方面又给存储服务提出了新的诉求,影响着它的发展。但是,全社会对数据存储的认识并未及时更新。比如,现阶段政府部门虽然大力倡导大数据发展战略,但是许多数据存储仍然沿袭传统分析流程和方法。
一方面,从能耗角度来看,数据存储需要合理规划布局,统筹集群发展。供需失衡、能源布局失配,是我国数据中心的突出问题。这需要全国大数据中心的一体化布局,合理应用我国能源分布特点,结合当地能源条件。目前,我国数据中心存量机柜数量机柜总数约360余万架,其中热数据集聚在京津冀、长三角、珠三角三大经济区,冷数据集聚于西部资源富足地区。
此外,还应进一步挖掘数据中心的节能减排潜力,提升能源利用效率、降低能耗;加大对基础设施的整合调度,推动老旧基础设施转型升级,灵活运用高密度集成高效电子信息设备、液冷等节能技术,及可再生能源。
稿源:(钛媒体APP)
【傻大方】网址:/c/1122a034H021.html
标题:数据存储|陈根:数据存储,如何解决能耗问题和孤岛现状?( 二 )