📢 转载信息
原文链接:https://www.kdnuggets.com/the-5-free-must-read-books-for-every-machine-learning-engineer
原文作者:Kanwal Mehreen
Image by Editor
# 引言
大多数时候,你通过构建事物来学习,就像前端开发中常见的那样。我记得我刚开始编程时,花了一个月时间阅读关于UI/UX、HTML和CSS的知识,但我仍然无法设计一个简单的界面。这是因为这类学习需要实践、项目和动手经验。
机器学习有所不同。在这个领域,对理论有深入的理解会带来更大的回报。它不仅仅是像在其他领域那样应用简单的规则。如果你不了解幕后发生的事情,很容易在模型中遇到障碍或犯错。这就是我强烈推荐阅读高质量机器学习书籍的原因。
本文是我们新系列的一部分,该系列重点介绍免费但绝对值得一读的书籍。如果你是一个认真的学习者,并希望加强你的基础,这份列表就是为你准备的。让我们从第一个推荐开始。
# 1. 理解机器学习:从理论到算法 (Understanding Machine Learning: From Theory to Algorithms)
理解机器学习:从理论到算法以一种严谨而有原则的方式介绍了机器学习,从如何将经验(训练数据)转化为专业知识(预测模型)这一核心问题入手。它从基础理论思想构建到实用的算法范式。它详尽地介绍了学习背后的数学原理,同时解决了学习任务的统计复杂性和计算复杂性,并涵盖了诸如随机梯度下降、神经网络、结构化输出学习等算法方法,以及PAC-Bayes和压缩界等新兴理论。这本书非常适合那些希望超越使用黑盒模型并真正理解算法为何如此运作的人。
// 大纲概述:
- 学习基础(核心学习理论,可能是近似正确(PAC)学习,Vapnik–Chervonenkis(VC)维度,泛化,偏差-复杂度权衡)
- 算法与优化(线性预测器,神经网络,决策树,提升(Boosting),随机梯度下降,正则化)
- 模型选择与实际考量(过拟合,欠拟合,交叉验证,计算效率)
- 无监督与生成式学习(聚类,降维,主成分分析(PCA),期望最大化(EM)算法,自编码器)
- 高级理论与新兴主题(核方法,支持向量机(SVMs),PAC-Bayes,压缩界,在线学习,结构化预测)
# 2. 机器学习数学基础 (Mathematics for Machine Learning)
机器学习数学基础弥合了数学基础与机器学习核心技术之间的差距。它主要分为两个部分。第一部分涵盖了主要数学工具,如线性代数、微积分、概率论和优化。第二部分展示了这些工具如何在关键的机器学习任务中使用,如回归、分类、密度估计和降维。许多机器学习书籍将数学视为次要主题,但本书专注于数学,以便读者能够真正理解并构建机器学习模型。
// 大纲概述:
- 机器学习的数学基础(线性代数,解析几何,矩阵分解,向量微积分,概率论,以及连续优化)
- 监督学习与回归(线性回归,贝叶斯回归,参数估计,经验风险最小化)
- 降维与无监督学习(PCA,高斯混合模型,EM算法,隐变量建模)
- 分类与高级模型(SVMs,核方法,分离超平面,概率建模,图模型)
# 3. 统计学习导论 (An Introduction to Statistical Learning)
统计学习导论(在我看来是一本现代经典)为您提供了对统计学习领域的清晰、实用的介绍——即我们如何利用数据进行预测和理解模式。它涵盖了您需要的关键工具,如回归、分类、重采样(用于检查模型的好坏)、正则化(防止模型失控)、基于树的方法、SVM、聚类,甚至是深度学习、生存分析和一次性处理大量测试等较新主题。每一章还包含基于Python的实际操作实验,因此您不仅能学到思想,还能学到如何将它们转化为代码。
// 大纲概述:
- 统计学习基础(统计学习介绍,监督与无监督学习,回归与分类,模型准确性,偏差-方差权衡)
- 线性和非线性建模(线性回归,逻辑回归,广义线性模型,多项式回归,样条(Splines)和广义加性模型)
- 高级预测方法(基于树的方法,集成方法,SVMs,深度学习和神经网络)
- 无监督和专业技术(PCA,聚类,生存分析,删失数据(Censored Data),以及多重检验方法)
# 4. 模式识别与机器学习 (Pattern Recognition and Machine Learning)
模式识别与机器学习教授机器如何从数据中学习识别模式。它从概率和决策制定的基础知识开始,以帮助理解不确定性。然后它涵盖了重要的技术,如线性回归、分类、神经网络、SVM和核方法。后面它解释了更高级的模型,如图模型、混合模型、采样方法和序列模型。本书侧重于贝叶斯方法,这有助于处理不确定性和比较模型,而不仅仅是找到一个“最佳”解决方案。虽然数学可能具有挑战性,但它非常适合希望深入理解机器学习的学生或工程师。
// 大纲概述:
- 机器学习基础(概率论,贝叶斯方法,决策论,信息论,以及维度灾难,以建立强大的概念基础)
- 核心模型(线性回归和分类,神经网络,核方法和稀疏模型,重点关注贝叶斯方法、正则化和优化技术)
- 高级方法(图模型,使用EM的混合模型,近似推断,以及复杂概率建模的采样方法)
- 专题与应用(连续隐变量模型(PCA,概率PCA,核PCA),序列数据(隐马尔可夫模型(HMMs),线性动态系统(LDS),粒子滤波器),模型组合策略,以及数据集、分布和矩阵属性的实用附录)
# 5. 机器学习系统导论 (Introduction to Machine Learning Systems)
机器学习系统导论展示了如何构建真正的机器学习系统——不仅仅是模型,而是使它们运行的整个设置。它首先解释了仅仅知道如何训练模型是不够的:你还需要了解数据工程、系统设计、硬件和软件的交汇点、如何在现实世界中部署以及如何保持系统的运行和安全。它还提供了动手实验,并强调你需要像一个工程师(硬件、资源限制、管道、可靠性)那样思考,而不仅仅是一个模型构建者。目标是为你提供语言、框架和工程思维,使你能够从“我有一个模型”转变为“我有一个可扩展、健壮且符合实际需求的工作中的AI系统”。
// 大纲概述:
- 基础与设计原则(机器学习系统的基本架构,包括介绍、机器学习工作流、数据工程、框架、训练基础设施)
- 性能工程(模型优化、硬件加速、推理效率、基准测试和系统级权衡)
- 稳健部署(机器学习运维(MLOps)、设备端学习、安全与隐私、鲁棒性、可信赖性)
- 机器学习系统前沿(可持续AI,AI向善,通用人工智能(AGI)系统,新兴研究方向)
# 总结
这些书籍涵盖了机器学习的关键部分,从数学和统计到现实世界的系统。它们共同为从理解理论到构建和使用机器学习模型提供了一条清晰的路径。接下来我应该介绍哪些主题?请在评论中告诉我。
Kanwal Mehreen 是一位机器学习工程师和技术作家,对数据科学以及AI与医学的交叉领域抱有深厚的热情。她是电子书《利用ChatGPT最大化生产力》的合著者。作为2022年亚太地区谷歌学者,她倡导多样性和学术卓越。她还被认可为Teradata技术多样性学者、Mitacs Globalink研究学者和哈佛WeCode学者。Kanwal是一位坚定的变革倡导者,她创立了FEMCodes以赋能STEM领域的女性。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区