本书系统介绍数据科学的核心概念、基本方法和关键技术,内容涵盖数据科学的导向目标,涉及科学计算、数据处理和分析、数据可视化等关键知识环节。本书基于 Python 技术框架实现,内容注重理论和实践的有机融合,克服单调、晦涩的知识累积之苦,以问题为导向,学以致用,提供了大量的案例代码和样本数据集,可以为学习者平添几分学习的乐趣。本书既适用于高等院校“数据科学与大数据技术”专业人才的基础培养,也适用于信息处理相关专业人才的能力提升,能够为数据科学从业者和相关学科的科研工作者提供必要的技术支撑。
文本挖掘与信息检索是近年来人工智能领域的热点研究方向。本书共分8章, 包括信息检索概述、信息检索模型、信息检索的评价、文本分类技术、文本聚类技术、自动摘要技术、文本推荐技术和网页链接分析, 融合了统计学、机器学习、数据库等知识, 具有多学科交叉的特点。
本书沿着时间的轨迹,讲述了物理世界中宇宙和地球的诞生与演变,探讨了生物世界中生命和人类的诞生与进化,讨论了数字世界中科学技术的产生与进步。数据与物质和能量并驾齐驱,构成了人类宇宙的三个基本要素,并以此为基础建立了物理、生物和数字三个各有千秋却密切相连的世界。“三个世界”的概念和框架构成了本书讨论数据智能的基础,为认识、理解数据和智能的起源与发展提供了一个宏观的问题视角和理论平台。介绍和讨论数据、信息和知识的概念定义、运作法则与实际应用,全面系统地描述和讨论了从原始数据到主观信息,最终到抽象知识的
本书以历届全国高职院校技能大赛自动化生产线安装与调试赛项所指定的竞赛平台为载体,按照项目引领的模式编写,将实施自动化生产线安装与调试相关的知识点和实操技能分解到不同项目中。书中主要内容包括:自动化生产线核心技术应用,自动化生产线各工作单元安装与调试,系统安装与调试,以及人机界面组态与调试等。本书结构紧凑、图文并茂、层次分明、配套资源丰富,具有很好的可读性、实用性和先进性。本书适合作为高职高专机电类专业相关课程的教材,也可作为应用型本科、职业技能竞赛的相关培训教材,还可作为相关工程技术
本书以满足视频监控系统的教学实训需求,培养工程设计、施工安装和运维人员的岗位技能为目的,依据最新国家标准的具体要求编写而成,介绍了GB50314《智能建筑设计标准》、GB50606《智能建筑工程施工规范》、GB50339《智能建筑工程质量验收规范》、GB50395《视频安防监控系统工程设计规范》和GB50348《安全防范工程技术标准》等现行国家标准与规范。
本书从计算机控制系统的信号转换开始,详细阐述了计算机控制系统的建模、性能分析、控制器设计及控制系统仿真与实现的理论、方法和实用技术。
本书以Scala作为开发Flink应用程序的编程语言,系统地介绍了Flink编程的基础知识。全书共8章,内容包括大数据技术概述、Scala语言基础、Flink的设计与运行原理、Flink环境搭建和使用方法、DataStream API、DataSet API、Table API&SQL、FlinkCEP。本书主要章节都安排了入门级的编程实践操作,以便读者更好地学习和掌握Flink编程方法。本书官网免费提供了全套的在线教学资源,包括讲义PPT、习题、源代码、软件、数据集、授课视频、上机实验指
本书关注大数据分析师所需掌握的重要的基础能力。首先,本书阐述了大数据分析师的职业特点。其次,根据数据分析经常涉及的技术要求,按顺序介绍了什么是数据库,如何使用数据库,大数据环境下的分布式数据库Hadoop、阿里云MaxCompute,以及相对应的数据库查询语言SQL、MapReduce、Hive、Pig等基本的编程技术。为了提高数据分析工作的质量与效率,本书还详细介绍了数据项目质量控制的理论和实践,其中涉及了数据预处理、数据脱敏和脏数据处理的技能知识,同时介绍了在数据项目中SQL编程的优秀
大数据分析涉及数据存储、数据处理、统计分析、数据可视化等技术问题。本书通过Hadoop和阿里云的MaxCompute架构介绍了大数据的数据存储、数据处理的原理。因为Hadoop等大数据存储和处理平台大多基于Linux操作系统,所以本书也介绍了Linux操作系统的基本使用方法。另外,本书还介绍了关系型数据库的重要原理、SQL语言及数据仓库的概念。统计学是数据分析的基础理论,本书概括了常用的统计学理论。数据可视化也是数据分析的重要工具,本书介绍了常用的图表、可视化的原则及可视化的工具。本书适合作为
大数据已深深渗透于人们工作和生活的方方面面。然而,大数据从来都不是以“技术”为其**底色,基于数据科学的创新应用,同样需要其他领域深度融合。本书阐述了培养具有大数据素养的综合型人才所需要的相关知识储备。本书不仅介绍大数据处理流程中的技术图谱,而且更侧重地讨论了与数据科学相关的历史、哲学及伦理学,以便于读者拓展跨领域的数据思维。为了增强图书的可读性,图书描述形式力图新颖,内容深入浅出、文笔流畅、图文并茂,大幅降低非计算机类相关专业读者的学习曲线。作为通识类课程教材,本书服务于具有数据素养的