《Spark 3 x综合项目实战》分为基础篇、案例篇两部分。在基础篇(第1-2章)中首先介绍了Spark运行环境的搭建、Spark的生态体系、编程模型、Scala基本语法、高阶函数、集合等方面的基础知识;在案例篇(第3-7章)中的5个综合案例详实的介绍了如何使用Spark实现音乐、房地产、气象、电商等领域大数据分析与挖掘的技巧。主要目的是通过Spark综合应用项目,帮助读者食味知髓,领悟Spark项目的精妙而步步渐悟,修炼成Spark高手。同时,本书还提供了详细的实训指导、数据源和程序代码等配套
随着社交网络等新型应用的兴起和云计算等新技术的快速发展,人类获取数据的规模正以前所未有的速度增长,数据中包含了大量有价值的信息,能够有效助力社会、经济、科技的发展,因此数据管理与分析方面的研究工作倍受关注。本书针对该领域的研究热点和前沿技术进行了深入浅出的介绍,包括图数据、云数据库系统、时空数据、数据质量、数据库智能化等,帮助读者构建宏观视野,把握领域前沿。本书适合数据管理与分析等相关领域的科研人员、年轻教师、研究生,以及从事相关工作的人员阅读。
这是一部从企业架构视角系统讲解企业级数据架构的著作,包含数据架构的原理、方法和实践。本书拟分为四个部分共17个章节来系统性的阐述数据架构相关内容;第1部分 架构基础主要包含1个章节1.数据架构与企业架构 其主要从宏观的角度阐述企业架构与数据架构的关系以及重要性使读者明白数据架构并不是孤立存在的且与企业架构息息相关第2部分 数据架构基础主要包含5个章节从理论以及工具层面阐述数据架构的构成2.数据架构构成 介绍数据架构的主要组成以及框架3.数据存储 数据架构落地中常见的存储选型以及实用场景4.数据调
这是一本能为数字化转型企业的数据治理提供全面指导的著作。它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面而深入地展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可以作为数据治理的实操手册。从数据治理的战略规划到落地实施,本书将各环节的核心内容凝练为“3个战略机制、8项关键举措、7种技术能力、7个治理工具”。数据治理之道——3个战略机制高屋建瓴地介绍了数据治理的数据战略、组织机制和数据文化。这
作为人工智能的核心技术,机器学习在数据分析中具有举足轻重的地位。本书在介绍机器学习相关知识的基础上,主要介绍了如何对有噪声的数据进行鲁棒回归分析。全书共6章,除第1章外,各章对异常点或重尾分布数据中的具体问题进行了详细分析与建模,所涉及的问题包括权值选择问题、变量相关性问题以及网络数据问题等。本书对于构建具有鲁棒性的机器学习模型具有很好的参考性,适用于含噪声的数据分析与应用,可供数据分析、人工智能等相关专业师生及行业技术人员参考阅读。
本书以 BI 负责人的视角介绍 BI 分析师的核心工作和应具备的核心技能,并分析 BI 创造价值的专题,理论和实例并重。全书分为四部分: 第一部分(第 1、2 章)为 BI 概述与团队组建,从介绍 BI 分析的基本概念说起,包含BI 职责与数据驱动的概述,以及组建团队时需要考虑的能力模 型、团队选型、团队管理。第二部分(第 3、4 章)为 BI 体系搭建基础知识,包括数据获取与管理,指标体系的概念、设计模型与使用场景。第三部分(第 5 ~ 9 章)为 BI 创造价值专题
本书汇总了数据科学中经常使用的数学知识,包括矩阵基础、微积分、概率论和优化等,以矩阵和向量形式统一了几个内容的符号体系,系统全面地介绍了数据科学的数学基础。全书共7章,内容包括线性代数、向量空间、内积空间、矩阵分解、向量微积分、概率与分布和优化方法。本书兼顾数学表达的严谨性和知识描述的直观性,减少了枯燥的证明过程,增加了易懂的几何绘图和运用示例,有助于读者快速理解数据科学中必要的数学知识。本书适用于从事数据科学学术和应用研究,以及工程建设的教师、研究生和科技人员教学
本书介绍了代数结构、几何结构、Lie群和Lie代数等基本理论,运用Lie对称方法研究了光纤通信等领域中五个非线性系统的一些对称性质和解析解。研究了GDNLS方程、DEGM系统、DR系统和Maccari系统的Lie点对称、Lie对称约化、对称变换、非线性自伴性和守恒律。运用Painlevé截断展开方法导出了GBK系统的非局部对称,研究了CRE可积性,得到了单孤波解,双共振孤波解和孤波-椭圆波相互作用解。
首席数据官(Chief Data Officer,CDO)是数字时代的产物,它在数字化转型的过程中,以及在转型成功后的数字经济中,都会起到关键作用。本书旨在建立一套相对完整的关于首席数据官的知识体系,帮助读者更好地参与数字时代的发展。本书分为5篇。第一篇 CDO概论介绍CDO产生的背景、发展趋势、主要职责、技能和工作路径等。第二篇 管好数据讲解CDO如何管理好数据,涉及数据战略、数据治理、数据制度、数据标准、数据架构、数据质量、数据安全、数据合规、数据建模、数据集成、数据存储、
本书旨在尽可能系统而全面地向读者展示多智能体协同控制相关的内容。首先简要且清晰地介绍了学习多智能体协同控制必备的知识,包含图论、矩阵理论和Lyapunov稳定性理论等,从第3章开始直至第17章,分别介绍了经典或热门的多智能体系统协同控制问题,其中第3~13章所介绍的控制方案适用范围较广,而第14~17章则分别以具体的实际系统为例,介绍了常见多智能体系统协同控制方法。本书在编写时尽量避免章节之间的交叉,因此读者可根据兴趣或需求阅读部分章节,但并不会影响其对相关控制思想的学习和理解。本书可供