近日,北京易华录信息技术股份有限公司与泰州成功签约中国华录华东数据湖产业园项目。项目建成后,将是全球容量最大的大数据基础设施。
数据湖产业项目位于泰州姜堰高新区,总投资30亿元,规划占地200亩,一期工程2018年投入使用,二期工程计划2020年建成。
什么是数据湖?
所谓数据湖,其实是大型数据存储库和处理引擎,能够存储大量的各种类型数据,拥有强大的信息处理能力和处理几乎无限的并发任务或工作的能力。
数据湖有什么特点?
数据湖,顾名思义,首先是存储量大。中国华录华东数据湖产业园项目,一期工程的数据存储量达2000PB,二期工程的数据存储量将达5000PB。
"PB"是个什么概念?举个例子,一部高清电影占用的存储空间为2G左右,1个PB的存储空间,大约能存25万部高清电影。目前,阿里云的总体数据量也就1500个PB左右。
数据湖的第二个特点是安全。中国华录华东数据湖采用蓝光储存技术,可抗电磁攻击,数据可保存50年。
存储分为光存储、磁存储和电存储。易华录是国内唯一具备蓝光存储核心技术的企业。蓝光存储具有存储容量大、保存时间长、能耗低、安全性高、存储空间扩展灵活等众多优势,被公认为新一代的存储方案。
数据湖有什么用?
当下,承载信息的越来越成为经济社会转型发展重要驱动力。
北京易华录信息技术股份有限公司总裁、总工程师、首席专家林拥军表示,数据是信息产业的命脉,个人、企业、政府的决策将不断由经验驱动转换数据驱动,数据是一切的基础,这是一场革命。
目前,不少政府机关和企事业单位,都有自己的数据中心,但这些中心的数据仅来自于本单位,是孤立的;而数据湖的数据来自方方面面,既可资源共享,也可对这些数据进行分析形成大数据,供政府机关、企事业单位决策参考。
北京易华录信息技术股份有限公司中央研究院副院长詹志强举例说,自来水公司有住户日常用水的数据,如果有一户家庭正常每月用水是几吨,突然有几个月用水达几百吨,这样的数据对于自来水公司来说,仅是用水量有异常,但对于执法部门来说,通过数据可分析出该用户或许在进行非法生产。
对数据湖进行分析形成的大数据,会对社会方方面面产生影响。比如教育方面,每个学生的基本学习情况都可录入数据湖,数据湖可分析出每人的薄弱环节,有针对性地提出建议;比如健康方面,医疗大数据作为可对个人诊断以及政府决策的重要依据。
中国华录华东数据湖服务范围将覆盖整个华东地区。对泰州来说,数据湖将为“智慧城市”建设打下基础。
数据湖效果图