Python机器学习实战:基于Scikit-learn与PyTorch的神经网络解决方案
定 价:¥99
中 教 价:¥58.41 (5.90折)促销
库 存 数: 10
《Python机器学习实战:基于Scikit-learn与PyTorch的神经网络解决方案》基于作者多年的积累,通过概念及其解释、Python代码示例及其解释和代码输出,特别针对零基础读者精心设计了这本机器学习进阶指南。全书包含3部分16章的内容,在介绍完编程和数据处理基础之后,探讨了监督学习(如线性回归、逻辑回归及决策树、朴素贝叶斯和支持向量机)、集成学习以及无监督学习(如降维和聚类等)。值得一提的是,书的最后讲到了神经网络和深度学习的基本思想,探讨了人工神经网络、卷积神经网络和递归神经网络。 《Python机器学习实战:基于Scikit-learn与PyTorch的神经网络解决方案》适合零基础且希望了解和掌握机器学习的读者阅读与参考。
NumPy、Pandas、Matplotlib、Scikit-learn以及Pytorch,一应俱全 涵括常见应用场景,可作为初学者入门指南以及从业者中长期参考手册 深度阐述机器学习环境搭建、数据加载、数值处理、数据分析和可视化 结合理论和实践来解释监督学习、无监督学习、回归算法以及集成学习 通过一个端到端解决方案来解释复杂的卷积神经网络架构、原理和实现
本书分为三个部分。第一部分向您介绍使用 Python 的数字运算和数据分析工具,并深入解释环境配置、数据加载、数值处理、数据分析和可视化。第二部分涵盖机器学习基础知识和 Scikit-learn 库。它还通过理论和实践课程以简单的方式解释了监督学习、无监督学习、回归算法的实现和分类以及集成学习方法。第三部分解释了复杂的神经网络架构,并详细介绍了卷积神经网络的内部工作和实现。最后一章包含 Pytorch 中神经网络的详细端到端解决方案。本书可以帮助读者实现机器学习和神经网络解决方案。特色主题如下:复习NumPy和Pandas中的数据结构展示机器学习技术和算法了解监督学习和非监督学习重点讨论卷积神经网络和递归神经网络全面介绍熟悉scikit-learn和 PyTorch预测递归神经网络和长短期记忆中的序列
我们一直想要合作写一本以机器学习为主题的书。十年前,我们刚开始接触AI。如今,这个领域已经有了突飞猛进的发展和扩张。作为终身学习者,我们意识到,在最开始接触任何领域时,都需要一份更明晰的资料来清楚地指明前方的道路。在通过阅读、学习和利用所学的知识来加强学习体验的过程中,也需要有一系列明确的解释和偶尔的灵感。我们在软件开发、数据科学和机器学习的学术经历与职业生涯中经常使用Python。通过这本书,我们做了一次非常谦卑的尝试,为绝对零基础的初学者写一本以机器学习为主题的分步骤指南。本书的每一章都包含对概念的解释、代码示例、对代码示例的解释以及代码输出截图。第Ⅰ部分包含4章的内容。第1章讲解不同平台上如何设置Python环境。第2章涉及NumPy和Ndarray。第3章探讨如何用Matplotlib进行可视化。第4章介绍Pandas数据科学库。最开始的这几章都旨在建立编程和基本的数据处理基础,这是学习机器学习的先决条件之一。第Ⅱ部分探讨传统的机器学习方法。在第5章中,我们先对机器学习领域进行概览,然后讲解如何安装Scikit-learn,并介绍一个简短而快速的使用Scikit-learn的机器学习解决方案示例。第6章详细说明一些方法,以帮助大家理解结构化数据、文本数据和图像数据,并将这些数据转化为机器学习库所能接受的格式。第7章介绍监督学习式,讲解了针对回归问题的线性回归和针对分类问题的逻辑回归和决策树。在每个实验中,我们还展示了如何利用决策边界图(decision boundary plot)来绘制算法所学到的可视化内容。第8章深入研究如何进一步微调机器学习模型。我们解释了一些评估模型性能的想法,过拟合和欠拟合的问题,以及处理这些问题和提升模型性能的方法。第9章继续探讨监督式学习方法并重点介绍朴素贝叶斯和支持向量机。第10章讲解集成学习,这种解决方案将多个较简单的模型结合起来,以获得比单独这些模型更好的性能。在第11章中,我们讨论了无监督学习,并重点关注降维、聚类和频繁模式挖掘方法。每个部分都包含一个使用Scikit-learn实现所讨论方法的完整例子。最后,第Ⅲ部分中的第12章介绍神经网络和深度学习的基本思想。我们介绍了一个非常流行的开源机器学习框架PyTorch,后续章节的例子都会用到它。第13章讲解人工神经网络,并深入论述了前馈(feedforward)和反向传播(backpropagation)的理论基础,然后要地介绍损失函数(loss function)和一个简单神经网络的例子。在后半部分中,我们解释了如何创建一个能够识别手写数字的多层神经网络。在第14章中,我们讨论卷积神经网络并讲述了一个图像分类案例。第15章探讨递归神经网络,并指导您解决一个序列建模问题。在最后的第16章中,我们论述规划、管理和设计机器学习和数据科学项目的策略。我们还讲解了一个端到端的案例,它很简短,使用了深度学习来进行情感分析。如果是初次接触这个主题,那么我们强烈建议您按照章节顺序阅读本书,因为其中概念是相互关联的。仔细阅读所有代码,可以随意地尝试修改和调整代码结构、数据集和超参数。如果对一些主题已经有所了解,请随意跳到自己感兴趣的章节并深入研究相关内容。祝大家学习顺利。
阿什温·帕扬卡(AshwinPajankar)是一名技术类作家、讲师、内容创作者和YouTuber主播。他在南德的SGGSIE&T获得了工程学士学位,在印度理工学院海德拉巴校区获得了计算机科学与工程硕士学位。他在7岁的时候接触到电子技术和计算机编程。BASIC 是他学会的第一种编程语言。他还用过其他很多编程语言,比如汇编语言、C、C 、VisualBasic、Java、ShellScripting、Python、SQL和 JavaScript。他还非常喜欢使用单板计算机和微控制器,比如树莓派、BananaPro、Arduino、BBC Microbit 和 ESP32。他目前正专注于发展 YouTube 频道,内容涉及计算机编程、电子技术和微控制器。
阿迪亚·乔希(AdityaJoshi)是一名机器学习工程师,他曾经在早中期创业公司的数据科学和机器学习团队工作。他在浦那大学获得了工程学士学位,在印度理工学院海德拉巴校区获得了计算机科学与工程硕士学位。他在硕士学习期间对机器学习产生了兴趣,并与印度理工学院海德拉巴校区的搜索和信息提取实验室有了联系。他喜欢教学,经常参加培训研讨会、聚会和短期课程。
欧拉在校期间多次入选优等生名单,奉行深思笃行的做事原则,擅长于问题引导和拆解,曾经运用数据模型和R语言帮助某企业在半年内实现了十倍的增长。美食爱好者。有多部译著,翻译风格活泼而准确,有志于通过文字、技术和思维来探寻商业价值与人文精神的平衡。目前感兴趣的方向有机器学习和人工智能。
第Ⅰ部分PYTHON机器学习第1章Python 3和Jupyter Notebook入门 31.1Python概述 41.1.1Python编程语言的历史 41.1.2Python编程语言的哲学 41.1.3Python的使用范围 51.2安装Python 61.2.1在Linux 发行版上安装 Python 71.2.2在macOS 上安装Python 71.3Python模式 71.3.1交互模式 71.3.2脚本模式 111.4Pip3工具 131.5科学Python生态系统 141.6Python的实现和发行版 141.7Anaconda发行版 151.8小结 16第2章NumPy入门 172.1开始使用NumPy 182.2Ndarray的索引 202.3Ndarray的属性 222.4NumPy常量 232.5小结 24第3章数据可视化入门 253.1用于创建Ndarray的NumPy例程 263.2Matplotlib数据可视化 283.3小结 34第4章Pandas入门 354.1Pandas基础知识 364.2Pandas中的Series 364.3Pandas中的数据框架 384.4在数据框架中实现数据的可视化 404.5小结 46第Ⅱ部分机器学习方法第5章Scikit-learn机器学习概述 495.1从数据中学习 505.1.1监督式学习 505.1.2无监督学习 515.2机器学习系统的结构 525.2.1问题理解 535.2.2数据收集 535.2.3数据标注和数据准备 535.2.4数据整理 535.2.5模型的开发、训练和评估 545.2.6模型的部署 545.3Scikit-Learn 555.4安装Scikit-Learn 555.5了解API 565.6第一个Scikit-learn实验 575.7小结 60第6章为机器学习准备数据 616.1数据变量的类型 626.1.1名目数据 626.1.2次序数据 626.1.3等距数据 636.1.4等比数据 636.2转换 636.2.1转换名目属性 646.2.2转换有序属性 666.3归一化 676.3.1线性函数归一化 686.3.2标准缩放 696.4预处理文本 706.4.1准备NLTK 706.4.2NLP流水线的5个步骤 716.4.3词干提取和词形还原 726.4.4移除停用词 736.4.5准备词向量 736.5预处理图像 756.6小结 77第7章初探监督式学习方法 797.1线性回归 807.2逻辑回归 867.2.1表达式概率的线与曲线的比较 877.2.1学习参数 877.2.2可视化决策边界 907.3决策树 917.3.1构建决策树 927.3.2Python中的决策树 937.4小结 96第8章对监督式学习进行调试 978.1训练和测试过程 988.2性能的衡量标准 988.2.1混淆矩阵 998.2.2精确率 1008.2.3准确率 1008.2.3F值 1008.2.4Python中的性能指标 1018.3交叉验证 1038.3.1为什么要进行交叉验证 1048.3.2使用Python进行交叉验证 1058.4ROC曲线 1068.5过拟合和正则化 1098.5.1偏差和方差 1128.5.2正则化 1138.6超参数调优 1168.7小结 120第9章再谈监督学习方法 1219.1朴素贝叶斯 1229.1.1贝叶斯定理 1229.1.2条件概率 1239.1.3朴素贝叶斯的运作方式 1239.1.4多项朴素贝叶斯 1249.1.5Python中的朴素贝叶斯 1249.2支持向量机 1269.2.1SVM的运作方式 1279.2.2非线性分类 1289.2.3SVM中的核技巧 1299.2.4Python中的支持向量机 1309.3小结 134第10章集成学习方法 13510.1Bagging算法和随机森林 13610.2Boosting算法 14010.3Stacking集成 14610.4小结 150第11章无监督学习方法 15111.1降维 15211.1.1了解维数灾难 15211.1.2主成分分析 15311.1.3Python中的主成分分析 15411.2聚类 15711.2.1使用k-均值进行聚类 15811.2.2Python中的k-均值 15811.2.3什么是正确的k 16111.2.4聚类之图像分割 16211.2.5使用DBSCAN进行聚类 16511.3频繁模式挖掘 16811.3.1购物篮分析 16811.3.2Python中的频繁模式挖掘 16911.4小结 172第Ⅲ部分神经网络和深度学习第12章神经网络和PyTorch基础 17512.1安装PyTorch 17712.2 PyTorch的基础知识 17712.2.1创建张量 17712.2.2张量操作 17912.3感知器 18112.4人工神经网络 18512.5小结 186第13章前馈神经网络 18713.1前馈神经网络 18813.1.1训练神经网络 18913.1.2损失函数 19313.2使用人工神经网络进行回归 19513.3激活函数 19813.3.1ReLU 激活函数 19813.3.2Sigmoid 激活函数 19913.3.3tanh激活函数 20013.4多层人工神经网络 20013.4.1PyTorch中的神经网络(NN)类 20613.4.2过拟合和Dropout 20813.5分类手写数字 20913.6小结 214第14章卷积神经网络 21514.1卷积运算 21614.2CNN的结构 21914.3在PyTorch中使用卷积神经网络 22114.4使用CNN进行图像分类 22314.5卷积神经网络的深度网络 23314.5小结 234第15章循环神经网络 23515.1循环单元 23615.2RNN的类型 23815.2.1一对一 23815.2.2一对多 23815.2.3多对一 23815.2.4多对多 23915.3Python中的RNN 23915.4长短期记忆 24015.4.1LSTM单元 24115.4.2时间序列预测 24215.5门控循环单元 25215.6小结 252第16章项目实战 25316.1数据科学生命周期 25416.2如何提供ML应用 25716.3通过实践学习 25816.3.1定义问题 25816.3.2数据 25916.3.3准备模型 26316.3.4序列化模型,以便未来用于预测 26816.3.5托管模型 27016.4未来可期 271