本书重点介绍大数据计算分析主要算法及主流计算框架,强调“理实一体”的教学模式和方法。在讲解各种计算分析技术的同时,本书对于核心技术都配以相应的实训项目/案例,真正训练学生解决大数据问题的实践能力。本书内容包括:大数据计算分析技术概述、大数据计算分析常用算法及场景、大数据离线计算分析技术、大数据流式计算分析技术、机器学习在计算分析中的应用,最后还以出入境管理风险评估大数据平台的设计与实现为例,设置了综合前述知识的实战项目。
本书以数字经济发展为背景,围绕数据要素估值,从数据要素概念界定入手,介绍数据要素经济价值、数据要素市场发展及管理、相关研究前沿知识等。本书以数字经济发展为背景,围绕数据要素估值,结合实务界探索成果与理论界研究成果,构建了数据资产评估框架和数据要素定价知识体系。本书内容编排体现关于数据要素市场改革的重点:数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护。 本书适合金融学、投资学等财经类专业的学生作为教材使用,也适合从事人工智能、工程管理、大数据管理与应用、工业智能等交叉
《Spark 3 x综合项目实战》分为基础篇、案例篇两部分。在基础篇(第1-2章)中首先介绍了Spark运行环境的搭建、Spark的生态体系、编程模型、Scala基本语法、高阶函数、集合等方面的基础知识;在案例篇(第3-7章)中的5个综合案例详实的介绍了如何使用Spark实现音乐、房地产、气象、电商等领域大数据分析与挖掘的技巧。主要目的是通过Spark综合应用项目,帮助读者食味知髓,领悟Spark项目的精妙而步步渐悟,修炼成Spark高手。同时,本书还提供了详细的实训指导、数据源和程序代码等配套
随着社交网络等新型应用的兴起和云计算等新技术的快速发展,人类获取数据的规模正以前所未有的速度增长,数据中包含了大量有价值的信息,能够有效助力社会、经济、科技的发展,因此数据管理与分析方面的研究工作倍受关注。本书针对该领域的研究热点和前沿技术进行了深入浅出的介绍,包括图数据、云数据库系统、时空数据、数据质量、数据库智能化等,帮助读者构建宏观视野,把握领域前沿。本书适合数据管理与分析等相关领域的科研人员、年轻教师、研究生,以及从事相关工作的人员阅读。
这是一部从企业架构视角系统讲解企业级数据架构的著作,包含数据架构的原理、方法和实践。本书拟分为四个部分共17个章节来系统性的阐述数据架构相关内容;第1部分 架构基础主要包含1个章节1.数据架构与企业架构 其主要从宏观的角度阐述企业架构与数据架构的关系以及重要性使读者明白数据架构并不是孤立存在的且与企业架构息息相关第2部分 数据架构基础主要包含5个章节从理论以及工具层面阐述数据架构的构成2.数据架构构成 介绍数据架构的主要组成以及框架3.数据存储 数据架构落地中常见的存储选型以及实用场景4.数据调
这是一本能为数字化转型企业的数据治理提供全面指导的著作。它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面而深入地展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可以作为数据治理的实操手册。从数据治理的战略规划到落地实施,本书将各环节的核心内容凝练为“3个战略机制、8项关键举措、7种技术能力、7个治理工具”。数据治理之道——3个战略机制高屋建瓴地介绍了数据治理的数据战略、组织机制和数据文化。这
本书以 BI 负责人的视角介绍 BI 分析师的核心工作和应具备的核心技能,并分析 BI 创造价值的专题,理论和实例并重。全书分为四部分: 第一部分(第 1、2 章)为 BI 概述与团队组建,从介绍 BI 分析的基本概念说起,包含BI 职责与数据驱动的概述,以及组建团队时需要考虑的能力模 型、团队选型、团队管理。第二部分(第 3、4 章)为 BI 体系搭建基础知识,包括数据获取与管理,指标体系的概念、设计模型与使用场景。第三部分(第 5 ~ 9 章)为 BI 创造价值专题
《数据分析与挖掘技术》主要介绍数据分析与挖掘的相关理论和技术方法,重点介绍数据挖掘的相关技术,书中采取理论知识与具体实现任务相结合的方法,系统讲解了数据分析与挖掘的实用技术。全书共分为9章,主要内容包括数据分析与数据挖掘概论、数据仓库与联机分析处理、数据预处理、关联规则挖掘、聚类分析、回归分析、决策树分析、SPSS数据挖掘基础、SPSS数据挖掘统计分析方法。为了使学习者能轻松掌握数据分析与挖掘相关的概念、算法和应用,《数据分析与挖掘技术》通过典型的应用实例以任务驱动的方式让学习者理解数据挖掘有关
本书是第一本兼顾编程和统计学基础技能的书籍,涵盖了整个数据科学生命周期。它面向那些希望成为数据科学家或与数据科学家合作的读者,以及希望跨越“技术/非技术”界限的数据分析师。如果具备基本的Python编程知识,你将学到如何使用像pandas这样的行业标准工具来处理数据。
数据挖掘已经广泛应用于各行各业,并推动了商务数据分析的兴起。本书结合项目实践,首先对数据挖掘的核心问题进行总结,讨论数据挖掘过程的主要步骤。在此基础上,使用Python语言详细地分析数据可视化、随机森林、GBDT、XGBoost、AdaCostBoost、逻辑回归等在医疗保险稽核、淡水质量预测、弹幕情感分析、机器学习书籍市场分析、慢性肾脏病状态预测、行车记录仪销量分析、商务酒店竞争分析等典型领域的应用。全书内容深入浅出,案例生动形象