本书先介绍经典的概率模型、随机变量和数字特征工具, 之后引入概率论的精华--大数定律和中心极限定理, 正是它们揭示了随机现象背后隐藏的确定性规律。在此基础上, 结合概率、统计、信息论、数据科学的前沿理论发展方向, 引入新近的非特征函数方法 (随机耦合的想法和斯泰因方法) 处理大数定律和中心极限定理, 给出逼近的误差界。本书还介绍了非常有用的概率不等式, 这为非渐近概率结果提供了基础工具。从比较严格的意义上来说, 数据科学是通过计算和推断, 从数据集或数据流中提取出来有价值的、真实的信息来辅助决策的一门科学。数据科学是从数据到信息再到决策的一个过程。