图分析与图机器学习:原理、算法与实践 [美]维克多·李 [荷]阮福坚 [美]亚历山大·托马斯
定 价:¥89
中 教 价:¥53.40 (6.00折)
库 存 数: 37
本书的目标是向你介绍图数据结构、图分析和图机器学习的概念、技术和工具。每章的开头都列出了目标,大致分为三个方面:学习图分析和机器学习的概念;用图分析解决特定问题;了解如何使用GSQL查询语言和TigerGraph图平台。首先介绍图数据的基本概念,然后通过连接、分析、学习三大部分深入讲解一些图算法和机器学习技术。
随着图形数据库的迅速崛起,企业正在实施高级分析和机器学习解决方案,以帮助推动业务成果。本实用指南向数据科学家、数据工程师、架构师和业务分析师展示了如何使用领先的图形数据库模型TigerGraph开始使用图形数据库。你将探索从互联数据中获取价值的三阶段方法:连接、分析和学习。三位作者介绍了涵盖多种当代业务需求的真实使用案例。通过使用TigerGraph Cloud进行实践练习,你将很快熟练掌握为企业设计和管理高级分析和机器学习解决方案的方法。
前言
目标本书的目标是向你介绍图数据结构、图分析和图机器学习的概念、技术和工具。当你读 完这本书时,我们希望你能理解如何使用图分析来解决一系列现实世界的问题。我们希 望你能够回答以下问题:图是否适合任务?应该使用哪些工具和技术?数据中有哪些有 意义的关系,应该如何根据关系分析来制定任务?根据经验,我们发现许多人能够快速掌握图的一般概念和结构,但要思考图,要培 养如何最佳地将数据建模为图的直觉,然后将分析型任务制定为图查询,则需要更多 的努力和经验。几乎每章的开头都列出了对应的目标,它们大致分为三个方面:学习 图分析和机器学习的概念;用图分析解决特定问题;了解如何使用 GSQL 查询语言和 TigerGraph 图平台。目标读者和前提条件本书的目标读者是对数据分析感兴趣并想学习图分析的人。你不必是一位严肃的程序员 或数据科学家,但了解一些数据库和编程的概念肯定有助于你理解本书内容。当我们深 入讲解一些图算法和机器学习技术时,我们会给出一些涉及集合、求和与极限的数学方 程式。这些方程式只是本书文字和图像的补充。在本书的案例部分,我们将在 TigerGraph Cloud 平台上运行预先编写好的 GSQL 代码。 你只需要一台可以访问互联网的计算机即可。如果你熟悉 SQL 数据库查询语言和任意主 流编程语言,那么你将能够理解大部分的 GSQL 代码。如果你不熟悉它们,也可以简单 地按照说明并跟随书中的注释来运行预先编写的案例示例。
阅读方法和路线我们旨在以实际的数据分析需求(而不是理论原理)为导向来呈现内容。我们会尝试使 用最简单的术语来解释事情,并尽量使用日常概念而不是难懂的技术术语。本书通过完整的示例来介绍 GSQL 语言。在本书开头,我们逐行描述了每行示例代码的 目的和功能。我们还对特别重要的语言结构、语法和语义进行了强调。若要获得更全面 的 GSQL 教程,可以参阅本书之外的其他资源。
Victor Lee是TigerGraph机器学习和人工智能副总裁。他的博士论文是关于基于图的相似性和排序的。Lee博士与他人合作撰写了关于决策树和密集子图发现的书籍章节。 教学和培训也是他职业生涯的核心工作,从开发芯片设计培训材料到撰写TigerGraph的第1版技术文档,从担任12年课堂讲师到主持大量网络研讨会和现场研讨会,他都参与其中。Phuc Kien Nguyen是荷兰银行反洗钱和恐怖主义融资领域的数据科学家。他拥有代尔夫特理工大学的信息架构硕士学位。Alexander Thomas是前TigerGraph技术作家,拥有语言学和教育背景。
黄凯,硕士研究生,毕业于北京理工大学,现任北京速通科技有限公司软件研发中心总工程师,主要从事于高可用、高性能、高并发的后台服务系统开发,对微服务架构、容器技术有一定的研究,对底层应用开发具有较深的了解,主导研发了多个ETC相关系统。
目录前言1第1章 连接就是一切71.1 连接改变一切81.1.1 什么是图81.1.2 图的重要性91.1.3 边连接优于表连接101.2 图分析和机器学习131.3 本章小结14第一部分 连接第2章 连接并探索数据192.1 图的结构202.1.1 图的术语202.1.2 图的模式242.2 图的遍历262.2.1 跳数和距离262.2.2 广度和深度272.3 图的建模272.3.1 图模式选项和权衡272.3.2 表格转换为图312.3.3 模型演进332.4 图的能力332.4.1 连接点342.4.2 360度视图342.4.3 深入洞察352.4.4 寻找并发现模式372.4.5 匹配和合并382.4.6 加权和预测392.5 本章小结40第3章 更好地了解客户和业务:360图423.1 案例1:跟踪和分析客户旅程423.2 解决方案:Customer 360 旅程图433.3 实现C360 旅程图:一个GraphStudio教程453.3.1 创建TigerGraph Cloud账户453.3.2 获取并安装Customer 360入门套件463.3.3 GraphStudio概述483.3.4 设计图模式483.3.5 加载数据503.3.6 查询和分析503.4 案例2:药物不良反应分析603.5 解决方案:药物相互作用360图603.6 实现613.6.1 图模式613.6.2 查询和分析623.7 本章小结69第4章 研究创业投资704.1 目标:找到有前途的创业公司704.2 解决方案:创业投资图714.3 实现创业投资图以及查询724.3.1 Crunchbase入门套件724.3.2 图模式724.3.3 查询和分析744.4 本章小结88第5章 检测欺诈和洗钱模式905.1 目标:检测金融犯罪905.2 解决方案:将金融犯罪建模为网络模式915.3 实施金融犯罪模式搜索925.3.1 欺诈和洗钱检测入门套件925.3.2 图模式925.3.3 查询和分析935.4 本章小结102第二部分 分析第6章 深入洞察:分析连接的重要性1056.1 了解图分析1056.1.1 分析要求1066.1.2 图遍历方法1066.1.3 并行处理1076.1.4 聚合1076.2 使用图算法进行分析1096.2.1 将图算法作为工具1096.2.2 图算法分类1106.3 本章小结127第7章 更好的推荐和建议1287.1 案例1:改善医疗转诊1287.2 解决方案:构建和分析转诊图1297.3 实现医疗专家转诊网络1297.3.1 医疗转诊网络入门套件1297.3.2 图模式1307.3.3 查询和分析1317.4 案例2:个性化推荐1397.5 解决方案:使用图进行基于多关系的推荐1407.6 实现多关系推荐引擎1407.6.1 推荐引擎2.0入门套件1407.6.2 图模式1407.6.3 查询和分析1427.7 本章小结150第8章 加强网络安全1518.1 网络攻击的代价1518.2 挑战1528.3 解决方案1528.4 实现网络安全图1538.4.1 网络安全威胁检测入门套件1538.4.2 图模式1538.4.3 查询和分析1548.5 本章小结163第9章 航空公司航线分析1649.1 目标:分析航空公司航线1649.2 解决方案:航线网络的图算法1659.3 实现机场和航线分析器1659.3.1 图算法入门套件1659.3.2 图模式和数据集1659.3.3 安装GDS库中的算法1669.3.4 查询和分析1679.4 本章小结178第三部分 学习第10章 图驱动的机器学习算法18110.1 基于图算法的无监督学习18210.1.1 通过相似性和社区结构来学习18210.1.2 寻找频繁模式18310.2 提取图特征18410.2.1 领域无关特征18510.2.2 领域相关特征18810.2.3 图嵌入:一个全新的世界19110.3 图神经网络19910.3.1 图卷积网络19910.3.2 GraphSAGE20310.4 图机器学习方法的比较20510.4.1 机器学习任务的用例20510.4.2 模式发现与特征提取方法20610.4.3 图神经网络:总结与应用20710.5 本章小结207第11章 重新审视实体解析20811.1 问题描述:识别现实世界的用户及其品味20811.2 解决方案:基于图的实体解析20911.2.1 确实哪些实体是相同的20911.2.2 实体解析21011.3 实现基于图的实体解析21111.3.1 数据库内实体解析入门套件21111.3.2 图模式21111.3.3 查询和分析21211.3.4 方法1:Jaccard 相似度21311.3.5 合并21911.3.6 方法2:评分精确和近似匹配22211.4 本章小结229第12章 改进欺诈检测23012.1 目标:改进欺诈检测23012.2 解决方案:使用关系创建更智能的模型23112.3 使用TigerGraph ML Workbench23212.3.1 设置ML Workbench23212.3.2 使用ML Workbench 和 Jupyter Notes23312.3.3 图模式和数据集23412.3.4 图特征工程23612.3.5 用图特征训练传统模型23712.3.6 使用图神经网络23912.4 本章小结24212.5 与你联系242