大数据：从基础理论到最佳实践_祁伟、刘冰、常志军、赵廷涛、高俊秀_9787302457435

大数据：从基础理论到最佳实践

定价：¥59.8

中教价：¥29.90 (5.00折）

库存数： 0

购买数量：

本书侧重于大数据的实践性技术，系统地介绍了主流大数据平台及工具的安装部署、管理维护和应用开发。平台和工具的选择均为当前业界主流的开源产品，因此，对于读者来说，有很强的可操作性。

本书涉及的开源技术包括：HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介绍一般性的背景知识、安装部署、管理维护和应用开发技术外，还特别注重案例实践，重要的技术点以实际工作场景或案例为依托，使读者能快速入门，参考案例动手实践，通过具体深入的实践，体会大数据的技术本质特征，领略大数据技术带来的创新理念，更好地理解和把握信息技术的发展趋势。

本书主要内容包括以下几大部分。

大数据存储篇：以HDFS为基础，介绍分布式文件系统的原理、安装、fs命令的使用、编程，介绍如何用HDFS实现，并通过HTTP调用。

大数据计算篇：以MapReduce、YARN为基础，介绍分布式计算的原理、部署，以及编程案例。

非关系型数据库篇：以HBase为基础，重点介绍非关系型数据库的优势、原理、部署，以及命令行使用，编程案例，与Sqoop配合使用等。

大数据仓库篇：以Hive、数据仓库等为基础，重点介绍数据的抽取、原理、部署、分析与编程。

大数据实时计算篇：以Storm、Kafka为基础，介绍实时计算的架构、组成、使用与开发。

本书非常适合从事大数据技术开发与使用的初学者，以及从事大数据技术研发的企事业单位工程师学习和参考，也适合高校计算机相关专业的专科生、本科生和研究生学习使用。

前言

　　技术革命的浪潮推动着人类文明的发展。

　　第一次浪潮造就了农业革命，它在数千年前出现并持续了数千年；第二次浪潮造就了工业革命，它在数百年前出现并持续了数百年；我们今天正在经历着信息技术第三次浪潮，发端于数十年前，目前也只是处在初级阶段。

　　农业技术革命释放了"物之力"；工业技术革命释放了"能之力"，而今天的信息技术革命释放的是"智之力"。

　　距今400年前，培根在《伟大的复兴》中预言：知识就是力量。今天，人类终于迎来"知识经济时代"，它是人类社会经济增长方式与经济发展的全新模式。

　　人类认识物质世界、人类社会和精神世界的最高境界是智慧，而要达智慧的境界，必然要跨越数据、信息、知识三个层级。

　　数据作为基础，是信息之母、知识之初、智慧之源。正是今天的大数据技术，引燃了人们实现智慧城市、智慧医疗、智慧教育等有关人工智慧的激情。人们真切地认识到，对于人工智能，只要让数据发生质变，即使是简单的数据，也比复杂的算法更有效。

　　今天，移动互联网的发展，使我们在获取数据上有了质的飞跃，人类的各种社会活动都与互联网这个虚拟世界相联系，使全样本、全过程地有效测量和记录成为可能，构建了生成大数据生态的土壤，同时，人们还在期待和憧憬物联网带来更大的冲击。

　　另一方面，云计算发展到今天，不论从技术到产业都开始进入成熟期，这也是大数据发展的基石和推进器。

　　在今天这个时代中，运用大数据洞见事物蕴藏的"智慧"成为人们的渴望。大数据更新了人们对数据的认识。在技术层面，小数据时代的很多数据处理方法和工具已不再有效，需要一系列新的方法和工具。所幸，有大量平民化的开源软件可用，它们不需要特殊的硬件系统，也更适用于云计算环境。

　　本书正是一本介绍主流的大数据开源软件平台和工具的技术专著，侧重于大数据的实践性技术，帮助读者快速入门，通过具体深入的实践，体会大数据的技术本质特征，领略大数据技术带来的创新理念，更好地理解和把握信息技术的发展趋势。

本书定位

　　(1) 信息发展已步入大数据时代，当前对于大数据还缺乏面向公众的技术实践手册。

　　(2) 本书的创作团队有丰富的大数据规划、开发、运营等经验，多位作者成功地架构了教育部、科技部、互联网等大数据架构与分析项目。

　　(3) 本书的参与者均是部委信息一线工程师、著名外企架构师、国内企业资深高级工程师，所做的理论分析易于学习，实践具有可操作性。

　　(4) 本书重点介绍大数据的基础理论、关键技术，以及编程实践。利用本书，就可以完全搭建并能有效地管理好大数据平台。

本书特色

　　(1) 理念先进：均是国内外最新的大数据理念；方便读者全面了解国内外大数据研究与发展的情况。

　　(2) 技术领先：参与者均是国内IT人士；采用的平台均是业界主流开源平台，涉及大数据常用的HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka等技术的介绍与编程使用。

　　(3) 案例丰富：提供翔实的实例与解决方法，供项目中参考。

　　(4) 资源齐备：本书涉及的配套下载资源可以从清华大学出版社的网站中下载。

全书关键字

　　大数据、分布式计算、数据仓库、数据分析、HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka。

　　由于编者的水平有限，书中难免有疏漏和错误，希望业内专家和广大读者指正。

　　编者

你还可能感兴趣

我要评论

您的姓名	验证码：
留言内容

目 录

目录