流计算系统尽可能地优化了接收处理事件数据的间隔时间,因此能实时地提供响应。对于金融、安全和物联网领域的应用来说,几毫秒都很关键,因此流计算系统是必要组件。而且,流计算是热门技术!具有 Spark、Heron 和Kafka 经验的工程师供不应求。
《流计算系统图解》以浅显易懂的语言介绍了实时事件流应用。这本引人入胜的书阐明了数据并行化、事件窗口和反压等核心概念,让你不会被框架的具体细节所困扰。在学习过程中,你将从头开始构建一个简单的流计算工具,以确保深入领会各种理念和技术。当你读到实时信用卡欺诈检测和 IoT 监控服务等示例时,实用且有趣的插图使流计算系统显得更加生动。
主要内容
实现流计算系统以及故障排除
为复杂功能设计流计算系统
定位网络瓶颈并解决反压问题
为高性能系统对数据进行分组
你手中的这本《流计算系统图解》正是一本带你进入流计算世界的指南。它从开发者的角度出发,带你一步一步从无到有地搭建一 套流计算框架,并基于此开发了信用卡欺诈检测、汽车排放量分析、系统负载分析等应用程序,深入浅出而不失严谨性。而且,本书配有大量插图,能帮你更快速地阅读和理解那些概念。
更可贵的一点是,本书没有局限于任何特定的框架或系统,而是聚焦于流计算的本质。一方面,这足以帮助你理解其原理,无论之后要使用哪个流系统,都能快速上手:另一方面,这可确保你不会陷入枯燥而繁杂的细节中,让阅读成为一种享受。
Josh Fischer 目前是 1904labs 的团队负责人,他曾为其他组织 ( 如孟山都和拜耳 )构建大规模实时数据应用。他是 Apache 委员会成员,也是 Apache Heron 分布式流处理引擎项目管理委员会的成员。
王宁现在是 Amplitude 的软件工程师,负责实时数据管道的构建。他是 Twitter 实时计算团队中 Apache Heron 的关键贡献者。