全书共分为12章,首先介绍大模型的基础知识与发展历程,从神经网络的起源到大规模预训练模型的演化,再到Transformer、BERT与GPT等模型架构的深入剖析,帮助读者理解大模型的技术基石。其次详细解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术,包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践,介绍API调用、上下文拼接、模型微调、知识蒸馏等关键技术,并结合DeepSeek实际案例展示其在数学推理、代码生成等
人工智能作为21世纪科技发展的最新成就,深刻揭示了科技发展为人类社会带来的巨大影响。本书结合求解智能问题的数据结构以及实现的算法,把人工智能的应用程序应用于实际环境中,并从社会和哲学、心理学以及神经生理学角度对人工智能进行了独特的讨论。本书提供了一个崭新的视角,展示了以人工智能为代表的科技现象作为一种“奇点”思潮,揭示了其在世界范围内所产生的广泛影响。本书全书分为以下几大部分:第一部分人工智能,第二部分问题延伸,第三部分拓展人类思维,第四部分推理,第五部分通信、感知与行动,第六部分结论。本书既详
本书涵盖从DeepSeek入门到成为DeepSeek高手的核心知识、方法和技巧。全书共7章,第1章DeepSeek 快速上手,从注册、安装到界面解析,帮助读者快速入门。第2章向DeepSeek 提问的艺术,掌握提示工程的精髓以及与DeepSeek进行高效对话的方法和技巧。第3章DeepSeek让学习更轻松,帮助读者制订学习计划、追踪学习进度、协助阅读文献,充当学习小助手。第4章DeepSeek 让办公更高效,在职场效率、Office 办公、沟通效率、图片编辑、短视频生成、AI工作流等方面成
这是一本面向初中级读者的Agent学习指南,作者既是资深的AI技术专家,又是经验丰富的项目导师,融合作者亲身实践、培训反馈与官方资源,为Agent使用者和开发者提供了快速上手的实用指导。本书从基础知识、操作和应用开发3个维度循序渐进地讲解Agent实战技巧,分为三篇:?基础篇(1~2章) 介绍Agent定义、发展历程、常用开源技术、主要组件等基础知识和开发环境的搭建过程。?应用篇(3~6章) 从通用型、任务驱动型、辅助开发型和检索增强型 4大类,通过AutoGPT、Mem
《从零开始学ESP32物联网应用开发》结合50个实践案例和2个综合实战项目,详细介绍ESP32从入门到进阶提升的全方位知识,涵盖ESP32物联网应用开发的基础知识、通信技术和网络编程等相关内容。《从零开始学ESP32物联网应用开发》免费提供程序源代码、100分钟配套教学视频、教学PPT和开发工具等超值学习资源,以方便读者学习和实践。《从零开始学ESP32物联网应用开发》共11章,分为4篇。第1篇基础知识,主要介绍ESP32硬件基础知识、ESP-IDF开发环境搭建、ESP32外设
《Python ChatGPT自动化办公很简单》从Python与ChatGPT的基础知识讲起,结合35个典型应用实战案例,详细介绍如何使用二者实现自动化办公的相关知识。《Python ChatGPT自动化办公很简单》不仅可以帮助读者大幅度提高工作效率,而且可以激发他们的创新思维,用全新的方式思考和解决问题,从而探索科技的无限可能,开启智能办公的新时代。为了帮助读者高效学习,《Python ChatGPT自动化办公很简单》附赠配套教学视频、不同场景的提示词使用示例、常见任务的自动化实现脚本、
大模型在众多领域得到了广泛应用,促进了AI技术的整合和创新。然而,在实际应用过程中,直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。本书分为6个部分,共16章。第1部分主要介绍大模型技术的发展与应用,从大模型的发展现状展开,重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施,涵盖湖仓一体引擎、湖仓的关键技术、实时数据写入和高效数据分析等内容。第3部分主要介绍大模型下的数据资产,围绕数据资产
本书为广受读者喜爱的畅销书升级版,旨在让读者快速、简单地上手大模型应用开发。 本书为初学者提供了一份清晰、全面的最小可用知识,带领你快速了解 GPT-4 和 ChatGPT 的工作原理及优势,并在此基础上使用流行的 Python 编程语言构建大模型应用。升级版在旧版的基础上进行了全面更新,融入了大模型应用开发的最新进展,比如 RAG、GPT-4 新特性的应用解析等。本书提供了大量简单易学的示例,帮你理解相关概念并将其应用在自己的项目中。 准备
本书超越了简单的AI工具使用教程,书中分为三大部分,逐步引导读者从理解AI的核心概念,到掌握高效使用AI的方法,最终探索AI的进阶应用。第一部分探讨了DeepSeek为何被视为AI时刻,分析了它与OpenAI、Anthropic等的不同之处,解析了AI的思考方式,还讨论了AI是否真正理解人类需求。第二部分介绍了如何高效使用DeepSeek。首先,详细解析了DeepSeek R1的核心能力、提示词技巧,以及如何让DeepSeek成为工作搭档,应用于营销、写作等场景。接着探讨了DeepSeek
DeepSeek 是一种基于 Transformer 架构的生成式 AI(Artificial Intelligence)大模型,融合了MoE 架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型 DeepSeek-V3 的核心技术及其在实际开发中的深度应用。 全书分三部分共12章,涵盖理论解析、技术实现和应用实践。第一部分从理论入手,详细解析了Transformer 与注意力机制、DeepSee