中国大数据进入“挖掘”时代:一片蓝海 潜力巨大
中新网北京3月3日电 (夏宾)近日,一场围绕数据挖掘的全球赛事——2017中国国际大数据挖掘大赛在我国首个大数据试验区贵州宣布启动。
一堆毫无交集的数据,经过一番交融荟萃,催生出全新的应用,激发出全新的商业模式,孕育出新的产业,培育出新的经济增长点,数据挖掘显现的这一系列价值,正将中国推向一个以数据挖掘为核心的大数据价值输出新时代。
“真正的大数据就体现在大数据的深度挖掘应用。”中科院院士、北京理工大学副校长梅宏在一次大数据论坛上表示。
上述大赛组委会的一位负责人则告诉记者,相对于采集、储存,数据挖掘是大数据走向应用创造价值的关键。贵州在开放数据的同时,也在全力进行数据挖掘,就是要尽快逼出大数据的价值,让大数据战略释放出大红利。
正如该负责人所言,数据开放和挖掘是“两手都要抓”,因为丰富的数据源是进行大数据挖掘的前提。
德勤最新发布报告《2017德勤技术趋势》指出,数据资源正在指数级的增长,到2020年,全球的数字预计将达到44泽字节(zettabytes)。
尽管数据资源在全球呈指数级增长,但是数据资源的开放和共享程度却亟待提升。“从国际上看,政府数据开放还处于初期阶段,主要通过制定战略或政策文件形式指导开放。”中国信息通信研究院互联网法律研究中心主任工程师杨筱敏说。
杨筱敏指出,2015年中国密集发布了多个相关文件,其中最主要的是国务院《促进大数据发展行动纲要》。该文件对相关政策进行了梳理,提出在开放前提下加强安全和隐私保护,在数据开放的思路上增量先行,提出在2018年底前建成国家统一的数据开放平台。
记者梳理发现,北京、上海、浙江、青岛、武汉地已建立了专门的政府数据开放平台。最近,河北省和安徽省均表示要在2018年底前初步建成政府数据开放平台。
在此次大赛启动会上,来自贵阳、北京、上海、深圳、广州、杭州等17个国内政府数据开放先行城市的代表,共同发布了《共同促进数据开放及应用行动宣言》,呼吁共同努力促进政府数据开放。
数据挖掘行业的前景如何?移动信息化研究中心2月10日发布的《2016中国大数据市场研究报告》显示,国内大数据企业此前主要聚焦在技术壁垒较低的应用、可视化等环节,而在存储和挖掘等环节,极少有企业切入。
但到了2016年,情况发生变化。该报告显示,从2013年到2016年,数据挖掘在大数据产业链中的分布情况从4.1%上升到9.2%。
该报告还显示,从大数据主要产业链市场份额占上看,数据存储约占12.5%,存储14.7%,应用7.9%,挖掘占比最高,为17.3%。报告认为产业链纵向各环节均属蓝海市场,而挖掘高风险与高收益并存。
麦肯锡更是对数据挖掘大唱赞歌。麦肯锡全球研究所一份报告指出,到2025年,物联网11.1万亿美元的年产值中60%将来自于对数据的整合和挖掘。
事实上,国内资本看好大数据挖掘这片市场,多数大数据创新企业在A轮或A轮以前可以融到数千万的启动资金,极大程度的催熟创新企业的成长。
资本的热捧下,人工智能(AI)、深度学习等大数据挖掘技术和工具的概念也烈焰高涨。时代呼唤新的“矿工”,寻找新的挖掘技术和工具,成为抢占大数据风口的制高点,关于数据挖掘的赛事也成为外界观察大数据脉动的风向标。
此次作为大数据挖掘大赛的东道主贵州只是全球大数据浪潮的缩影。无论中国的西部,还是美国的硅谷,“挖掘”的声音在全球同步响起,汹涌澎湃。数据资源的开放,挖掘工具的进步,商业前景的清晰,数据挖掘行业未来潜力巨大。(完)