什么是大数据
“大数据”是指以多元形式,自许多来源搜集而来的庞大数据组,往往具有实时性。在企业对企业销售的情况下,这些数据可能得自社交网络、电子商务网站、顾客来访纪录,还有许多其他来源。这些数据,并非公司顾客关系管理数据库的常态数据组。
名家推荐
大数据定将改变地质
——向读者推荐《地球科学大数据挖掘与机器学习》
翟明国
(地质学家、中国科学院院士、中国科学院大学教授)
地质学是一门典型数据密集型学科,在大数据时代,它正面临着前所未有的挑战与机遇。地质学家需要改变传统思维模式,拥抱大数据时代的到来。
近期由周永章教授和广州泰迪智能科技有限公司共同撰著的《地球科学大数据挖掘与机器学习》由中山大学出版社出版了,这是顺应大数据时代而生的一部力作。该书建立了地球科学大数据挖掘与机器学习的基本框架,重点分析高维数据降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例.
2007年,图灵奖得主吉姆格瑞发表演讲时指出:大数据已经成为科学研究的第四范式。人类在科学研究的道路上,从经验科学,到理论科学,再到计算科 学,如今到大数据科学,大数据成为第四范式也是必然之路。
在大数据时代,人类的思维方式必然会产生革命性的变革。大数据挖掘特别适合于窥探具有多维性和全面性的现实世界。它可以从很多看似支离破碎的信息中复原一个事物的全貌,并进而能够预测或判断出尚未观察到的事物的现象。
大数据分析是今后各学科和经济社会领域不可回避的重大课题。美国政府认为大数据是“未来的新石油”,一个国家拥有数据的规模和运用数据的能力将成为综合国力的重要组成部分,对数据的占有和控制将成为国家间和企业间新的争夺焦点。中国政府于2015年9月印发《促进大数据发展行动纲要》,明确推动大数据发展和应用。中国科学院、复旦大学、中山大学、中国航空航天大学等单位相继成立了从事数据科学研究的专门机构。
地球科学领域广泛存在大数据。地质调查是地球科学研究获得数据的主要渠道之一。同其他行业和领域一样,地球科学大数据正在以指数形式增长。在这一背景下,地球科学大数据挖掘,日益获得越来越多地球科学家的重视。超级计算硬件、软件的发展,为地球科学家研究大数据提供了比任何时候都更方便的平台条件。各国长期地质调查和探测取得的海量地质基础调查数据,正在成为超级计算机服务的重点对象之一。
机器学习是应对大数据超常增长、开展大数据信息挖掘的重要选项。它被认为是人工智能的核心,是使计算机具有智能的根本途径,而深度学习恰是一种炙手可热的实现机器学习的技术。因而,它们一起成为当前大数据与数学地球科学研究的重点和热点。尽管依托大数据的人工智能地质学还远不够成 熟但所幸运的是,具有历史使命感的科学家在严肃、认真地探索。《地球科学大数据挖掘与机器学习》的作者周永章教授就是其中的一位。
该书是地质大数据领域同类研究的第一本系统性专 著,对运用大数据挖掘技术与机器学习算法解决地球科学问题大有裨益,适合地球科学领域研究生和高年级本科生学习,亦可供科研人员做研究时参考。笔者期望,《地球科学大数据挖掘与机器学习》惠及一代新人,引领读者更多关注和投身地质大数据研究。
未来,大数据定将改变地质。
图书信息 | |
《地球科学大数据挖掘与机器学习》 周永章 张良均 张奥多 王俊 著 中山大学出版社 2019年1月 |
内容简介
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国第一部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。