📢 转载信息
原文链接:https://www.kdnuggets.com/the-5-free-must-read-books-for-every-ai-engineer
原文作者:Kanwal Mehreen
Image by Editor
# 引言
当我刚开始学习人工智能时,我花了很多时间从教程中复制代码,但我意识到我并没有真正理解它们的工作原理。真正的技能不仅仅是运行模型。而是要知道它们为什么有效,以及如何将它们应用于实际问题。AI书籍以快速教程无法比拟的方式帮助我学习了人工智能的概念、推理和实际应用方面的内容。有鉴于此,我们开始这个系列来推荐免费但真正有价值的书籍。本文面向所有想学习AI的人,以下是第一批推荐。
# 1. 神经网络与深度学习
这本书《神经网络与深度学习》将带您从神经网络的基础知识,到实际构建和训练深度模型。它从感知器和Sigmoid神经元等简单概念开始,引导您创建能够识别手写数字的网络。您还将了解反向传播(backpropagation)如何真正用于训练这些模型,以及如何使用成本函数、正则化、权重初始化和超参数调优来改进它们。书中包含大量的Python代码示例,因此您可以自己测试所有内容并查看它们如何相互关联。它很好地结合了直觉和数学,因此您开始理解的不仅是神经网络如何工作,还有为什么工作。如果您已经了解一些数学知识(如线性代数或微积分),这本书是超越简单使用库而真正了解底层发生情况的绝佳选择。
// 大纲概览:
- 神经网络基础(感知器、Sigmoid神经元、网络架构、手写数字分类、梯度下降、网络实现)
- 反向传播与学习(基于矩阵的计算、成本函数假设、Hadamard积、四个基本反向传播方程、算法实现、改进学习)
- 高级训练技术(交叉熵成本、过拟合与正则化、权重初始化、超参数选择、神经网络的普遍性、Sigmoid神经元的扩展)
- 深度学习与卷积网络(梯度消失问题、不稳定的梯度、卷积神经网络、实际应用、图像识别的最新进展、未来方向)
# 2. 深度学习
《深度学习》全面概述了深度学习以及机器如何通过经验学习,它从简单的概念逐步构建复杂的知识。它首先介绍了您需要的数学知识,如线性代数、概率论、信息论和一些数值计算,然后介绍机器学习的基础知识。之后,它深入研究现代深度学习方法,如前馈网络、卷积网络和循环网络、正则化和优化,展示它们如何在实际项目中应用。它还讨论了一些高级主题,如自动编码器、生成和表示学习以及结构化概率模型。它主要面向具有扎实数学背景的人员,因此更像是一本用于研究或高级工作的参考书,而不是入门指南。
// 大纲概览:
- 因子模型与自动编码器(PCA、ICA、稀疏编码、欠完备和正则化自动编码器、去噪、流形学习)
- 表示学习与概率模型(分层预训练、迁移学习、分布式表示、结构化概率模型、近似推断、蒙特卡洛方法)
- 深度生成模型与高级技术(玻尔兹曼机、深度信念网络、卷积模型、生成随机网络、自动编码器采样、生成模型评估)
# 3. 实用深度学习
链接:
免费课程《实用深度学习》是为那些已经掌握一些编程知识并希望在机器学习和深度学习方面获得实践经验的人准备的。您将不会只阅读理论,而是会立即开始构建解决实际任务的模型。该课程涵盖了Python、PyTorch和fastai等现代工具,并向您展示如何处理从数据清理到模型训练、测试和部署的方方面面。您将使用实际的Jupyter Notebook、数据集和问题进行操作,从而实现边做边学。重点是用于选择正确算法、适当验证、扩展和部署的实用、最新的方法。
// 大纲概览:
- 基础知识与模型训练(神经网络基础、随机梯度下降、仿射函数与非线性、反向传播、MLP、自动编码器)
- 跨领域的应用(使用CNN的计算机视觉、自然语言处理(NLP)包括词嵌入和短语相似度、表格数据建模、协同过滤与推荐)
- 高级技术与优化(迁移学习、权重衰减、数据增强、加速随机梯度下降(SGD)、ResNets、混合精度、DDPM/DDIM、注意力与Transformer、潜在扩散、超分辨率)
- 部署与实用技能(将模型转化为Web应用、提高准确性/速度/可靠性、道德考量、学习器(The Learner)等框架、矩阵运算、模型初始化/归一化)
# 4. 人工智能:计算智能体基础
本书《人工智能:计算智能体基础》通过“计算智能体”的概念来解释AI,即能够感知、学习、推理和行动的系统。最新版本增加了神经网络、深度学习、因果关系以及AI的社会和伦理方面等新主题。它展示了智能体是如何构建的,它们如何规划和行动,以及它们如何处理复杂或不确定的情况。每一章都包含Python算法、案例研究和现实世界的讨论,因此您可以同时学习“如何”和“为什么”。它是理论与实践的平衡结合,非常适合想要获得现代、深入的AI介绍的学生或任何人。
// 大纲概览:
- AI与智能体基础(自然智能与人工智能、历史背景、智能体设计空间,以及送货机器人、诊断助手、辅导系统、交易智能体和智能家居等示例。)
- 智能体架构与控制(分层控制、智能体功能、离线与在线计算,以及智能体如何在环境中感知和行动。)
- 推理、规划与搜索(通过搜索解决问题、图遍历、约束满足、概率推理以及包括前向、回归和部分顺序规划在内的规划方法)
- 学习与神经网络(监督学习、决策树、回归、过拟合、提升等复合模型、深度学习架构(卷积神经网络(CNN)、循环神经网络(RNN)、Transformer)以及大型语言模型。)
- 不确定性、因果关系与强化学习(概率推理、贝叶斯学习、无监督方法、因果推断、不确定性下的决策、序贯决策和Q学习与进化算法等强化学习策略。)
# 5. 伦理人工智能
这篇论文《伦理人工智能》探讨了未来AI系统可能以我们意想不到或有害的方式运行,并提出了安全设计的建议。它首先指出,AI可能会学习到比人类完全理解的更复杂的模型,这使得安全保障变得棘手。作者建议使用效用函数(描述AI应该关心什么的数学描述),而不是模糊的规则,因为它们能更清晰地阐明目标。它还涵盖了诸如“自我欺骗”(AI可能破坏其自身观测或奖励)、意外的“捷径”行为以及奖励生成器损坏(AI操纵自身奖励系统)等问题。作者提出了学习人类价值观、使用有限定义以及包含自我建模的模型,以便AI可以推理其自身的行为。它还考虑了更宏大的图景,例如AI如何影响社会、政治和人类的未来。
// 大纲概览:
- 基础与AI设计(未来AI与当前AI、指令AI、效用最大化智能体、学习环境模型、智能度量、伦理框架)
- AI行为与挑战(自我欺骗、意外的工具性行为、基于模型的效用函数、学习人类价值观、演化和嵌入式智能体)
- 测试、治理与社会(AI测试、现实世界行为、政治层面、透明度、利益分配、伦理考量)
- 哲学与社会影响(意义的探寻、社会和文化影响、计算与人类价值观的桥接)
# 总结
这些书籍(以及一篇论文和一个课程)涵盖了AI工程师所需知识的广泛领域,从神经网络和深度学习到动手编程、基于智能体的AI以及伦理问题。它们为从学习思想理念到在现实世界情境中应用AI提供了一条清晰的路径。您希望我接下来涵盖哪些主题?请在评论中留下您的建议!
Kanwal Mehreen 是一位机器学习工程师和技术作家,对数据科学以及人工智能与医学的交叉领域怀有深厚的爱好。她是电子书《使用ChatGPT最大化生产力》的合著者。作为2022年亚太地区谷歌代际学者,她倡导多元化和学术卓越。她还被认定为Teradata技术多元化学者、Mitacs Globalink研究学者和哈佛WeCode学者。Kanwal是变革的坚定倡导者,她创立了FEMCodes以赋能STEM领域的女性。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区