回归分析是一本统计学类、数据科学类专业的核心专业课程,主要为统计学及其相关专业的本科生介绍回归分析的建模思想、基本原理和基本方法。本教材的编写逻辑和思路:首先,通过介绍变量之间的关系引入回归的思想,从最简单的一元线性回归模型开始,扩展到多元线性回归模型,进一步再扩展到广义线性模型,针对不同的问题,建立不同的模型,从简单到复杂,深入浅出的讲解回归模型的建模思想。其次,针对不同的模型,通过理论讲解与实例分析介绍如何建立回归模型,如何实现回归模型的估计,并针对模型的种种假设进行检验,以及数据违背假设的
本书采用先理论方法后实践应用的方式进行撰写,系统介绍了投影寻踪基本原理、统计学习方法及其多场景应用案例,为多方法耦合提供新思路,为复杂数据挖掘提供新方法,为数据科学问题解决提供新应用。全书内容包括投影寻踪研究进展综述、投影寻踪耦合学习原理、投影寻踪耦合学习算法、投影寻踪聚类耦合学习、投影寻踪回归耦合学习、投影寻踪函数型耦合学习、投影寻踪耦合学习评价、投影寻踪耦合学习预测和投影寻踪耦合学习决策。本书可作为统计学习、数据科学和工程应用方向的研究及实践工作者的学习参考书。
真实世界中的序列数据随时间推移呈爆炸式增长,如何设计面向序列数据的知识发现方法是当前研究的热点之一。本书以深度学习和多视图学习为理论基础,以序列数据为研究对象,为面向序列数据分析提供多视图的学习方法与技术,同时为典型场景下的序列数据分析提供多视图深度学习解决方案,以期为序列数据分析、多视图学习领域的研究及应用提供参考。本书针对序列数据的动态性、突变性、不确定性和时空关联性等特点,探讨多视图学习理论,构建面向序列数据的多视图方法,概述基础理论与传统方法,并系统地介绍多视图序列数据应用领域的研究理论
本书教你如何从基于时间的数据(如日志、客户分析和其他事件流)中获得即时、有意义的预测。在这本通俗易懂的书中,作者通过带有注释的Python代码全面演示了用于时间序列预测的统计和深度学习方法。全书分为四部分:第一部分介绍时间序列预测的概念;第二部分介绍使用统计模型进行预测;第三部分介绍使用深度学习进行大规模预测;第四部分介绍使用自动化预测库进行大规模预测。
这是一本写给对概率统计及应用有兴趣的非专业读者的书,目的是帮助他们理解高科技发展中概率统计等概念的意义。本书写作中以悖论、谬误、以及一些饶有趣味的数学案例作先导,引起读者的兴趣和思考,在解答问题的过程中讲述概率论中的基本知识和原理,及其在物理学、信息论、网络、人工智能等技术中的应用。书中介绍的著名趣味概率问题包括高尔顿钉板、几何概型悖论、博士相亲、中国餐馆过程等。通过讨论这些简单有趣的例子,让读者了解概率统计中的重要概念,诸如随机变量、期望值、贝叶斯定理、大数定律、中心极限定理、马尔可
1、概率论基础知识;2、基础理论:随机过程的引入(定义的引入、分类、平稳过程)、离散时间的Markov链(定义的引入、分类、不变测度、极限定理)、最优停时与鞅、连续时间的Markov链(定义的引入、Poisson过程、Renew 过程、应用案例)、连续时间的随机过程(布朗运动)、随机分析及随机微分方程;3、应用案例分析:随机过程在金融中的应用、随机过程在流行病传播中的应用、随机过程在社会学中的应用
本书从信息流个性化推荐算法从业者的角度,阐述在资讯内容类App中,如何搭建健壮、完善的个性化推荐算法体系,如何融合产品运营的专家模型和端到端的深度学习,如何平衡短期的商业化目标和长期的用户体验,以及我们在多个行业头部平台实践的过程中遇到的典型业务问题和解决方案,对比理论推导为主的机器学习书籍,本身更偏向基于行业问题的深度思考及落地实践。
敏感性试验设计是试验设计研究领域的主要研究方向之一,其应用背景主要是针对燃爆产品试验和药剂试验,通过设计若干刺激水平和观测对应的二元响应数据,估计感兴趣的特殊刺激水平,如成功响应概率p对应的刺激水平,称其为感度分布的p分位数。 传统的敏感性试验设计没有优化准则,而且希望估计的主要是0.5分位数。随着对研究对象更高质量的要求,在中小样本下估计极端p分位数的需求越来越强烈。本专著主要给出估计该类极端p分位数的优化试验设计方法,并在三元响应和混合响应情形下给出广义敏感性试验设计的概念、统计模型和广义p
本书分为8 章,内容包括时间序列分析的基础知识、时间序列预测的常用方法,以及神经网络在时间序列预测中的应用;时间序列异常检测算法的技术与框架,如何识别异常的时间点及多种异常检测方法;时间序列的相似性度量方法、聚类算法;多维时间序列在广告分析和业务运维领域的应用,利用OLAP 技术对多维时间序列进行有效处理,通过根因分析技术获得导致故障的维度和元素;智能运维领域(AIOps)和金融领域的两个应用场景。
本书以近邻思想、同步聚类模型及快速同步聚类算法为研究课题,重点研究了基于近邻图与单元网格图的聚类算法、基于近邻势与单元网格近邻势的聚类算法、快速同步聚类算法、基于Vicsek模型线性版本的同步聚类算法、基于线性加权Vicsek模型的收缩同步聚类算法、基于分而治之框架与收缩同步聚类算法的多层同步聚类方法和基于ESynC算法与微聚类合并判断过程的组合聚类算法等。本书可作为聚类分析领域研究生的教学和科研参考教材,也可作为智能数据分析与处理技术人员的自学研究参考教材。