机器学习入门指南 | Cry̵̴̷̧̛͠stal P̷̢͢͢͜͝uNK's Blog

type

status

date

slug

summary

tags

category

icon

password

前言

这是一个颇具挑战性的任务，但对于完全没有接触过的你而言，不用害怕，本文将介绍一些互联网上的资源，方便你无痛入门机器学习，逐渐构建起自己对机器学习领域的见解。除此之外，也希望你能在探索机器学习的路上总结出一套自己的学习方法论：当你在面对下一个自己完全没接触过的领域时，你该如何勇敢、快速、高效的去面对这次新的挑战？

本文推荐的入门时常为两月左右，可根据自己的进度与规划安排学习时间。

理论的价值在于指导实践，学习的目的全在于运用。机器学习的发展也是在理论与实验的相互反哺中进步的。基本功的学习也分为了两大部分：

机器学习基本理论

机器学习基本概念，基本运作思路

前向传播？反向传播？梯度下降？训练集测试集？…

经典而常用的网络

CNN、RNN、Transformer….

机器学习的实验基础

配置环境
Python
Pytorch
git
Linux基本命令

打好基本功后，你会开始在机器学习的某一领域继续深耕，你需要掌握：

如何有效的阅读论文

扎实的数学基本功：概率论与数理统计、微积分、线性代数

资源推荐

下面推荐一些课程与书籍

基本理论学习：

李沐机器学习：https://courses.d2l.ai/zh-v2/ （可自行选择最新版本）

资料的优点在于，比较有规律，注重代码实践（有完整配套的视频、PPT、课本）一个课程就能达到不错的理论和实验基础

李宏毅老师系统课程，2022版 b站上有授权正版课程

幽默风趣，讲的很有意思

2022版侧重机器学习的基本知识

课后作业有一定难度，需要思考，但是做了收获很大，提供作业思路参考的博客主页(可以全局搜索关键词”HW”找到相应的作业博客) https://www.zhihu.com/people/lao-ma-wo-er-zi

上面两个课程选择一个即可

《机器学习》周志华著清华大学出版社

又名西瓜书，非常详尽的介绍了机器学习的基本知识，常见算法以及进阶知识，十分经典，推荐人手一本

先看完1～3章以及第五章，其他章节可以稍后再看。

机器学习的实验基础

b站上的教程很多，大家可以根据自己喜好搜索，下面列出几个任务点。找几个课程学习实践基础效果不好，这类知识的学习需要秉持“To learn by doing”的理念，建议大家给自己布置一个项目（后面本文会有一个推荐的项目），通过实际上手写代码来学习，亲手配置环境，动手实验一些pytorch函数的效果，在视屏的引导下写下自己第一个dataloader、第一个网络，自己调整参数，观察实验效果。当然，这部分的学习需要机器学习理论基础的支撑。

搭建Linux编程环境

虚拟机（不推荐）
WSL（推荐）
安装Linux系统（推荐）
SSH远程连接Linux服务器（推荐）

配置Anaconda

配置Docker（可选）

学习python

有c语言的基础下，一周内铁能学会

学习pytorch

https://www.bilibili.com/video/BV1QT411B7Aj?spm_id_from=333.1387.favlist.content.click

进阶

继续阅读西瓜书的剩余章节

深度学习论文精读（李沐）

https://github.com/mli/paper-reading
b站：李沐带你读论文

于静老师近期在 B 站开设了《科研与英文学术论文写作》视频课程

https://www.bilibili.com/video/BV1aa411H757?spm_id_from=333.337.search-card.all.click

实践演练

这是两个检验你学习效果的任务，尝试着完成吧！不要留着把课和书刷完了再做这两个任务，你完全可以边学边做，这有助于你更深入的理解你学习到的理论知识。

自行尝试一下MINIST手写数字识别，可谓ai版本的 “hello world！”

自行复现一个Transformer模型。这个任务会有些难度：

了解Transformer的基本原理——视频、以及论文《Attention is all you need》

可以参考一下网上的复现教程

附：一份可供参考的规划

第一周

任务

机器学习&ChatGPT相关基础概念以及Pytorch基础操作

(正课)机器学习 2023 规则说明哔哩哔哩bilibili

(正课)【生成式AI】ChatGPT原理剖析(1_3)-对 ChatGPT 的常见误解哔哩哔哩bilibili

第一节内容：P1-P9

git 代码仓库的学习

Git使用教程,最详细，最傻瓜，最浅显，真正手把手教 - 知乎 (zhihu.com)

收藏了！Git 核心操作图解 (qq.com)

GitHub仓库快速导入Gitee及同步更新 - Gitee.com

Gitee 帮助中心 - Gitee.com

输出

在Gitee上，建立自己的笔记仓库，利用git工具进行自己笔记的版本管理，学会分支、合并等基本操作

视频课程学习笔记并将自己的笔记上传到在上建立的自己的gitee笔记仓库中，作业部分不用完成（可以根据视频讲解和博主提供的git/gitee仓库中的内容学习）

第二周

任务

机器学习基本原理

(正课)【生成式AI】快速了解机器学习基本原理 (1_2) (已经略懂机器学习的同学可以跳过这段)哔哩哔哩bilibili

P13-P21

Linux环境配置以及基本命令

在windows上运行WSL2

在widows子系统WSL2中建立Ubuntu环境

了解Linux基本操作

第一章：引言 The Linux Command Line 中文版 · 看云 (kancloud.cn)

输出

视频课程学习笔记并上传到自己的gitee笔记仓库中

完成linux的配置以及基本操作的学习

第三周

任务

生成式AI

(正课)【生成式AI】Finetuning vs. Prompting：对于大型语言模型的不同期待所衍生的两类使用方式 (1_3)哔哩哔哩bilibili

P23-P25

课程作业

(作业)Colab Tutorial (introduction + demo)哔哩哔哩bilibili

P10-P12，P22，P28

在WSL2下安装anaconda或miniconda（功能更轻量级，占用空间更小）并配置PyTorch环境（PyTorch有GPU版和CPU版，个人笔记本上使用CPU版就行，后续进入实验室后会分配有GPU的服务器）

安装方法自行搜索，例如linux安装anaconda及配置pytorch环境

在WSL2中安装jupyter notebook，在windows中打开可视化界面，并熟悉jupyter使用方法

安装方法自行搜索，例如搭建 Python 轻量级编写环境（WSL2+Jupyter 自动开启本地浏览器） - 知乎 (zhihu.com)

使用方法：

PyTorch包学习

什么是PyTorch？ (apachecn.org)

PaddlePaddle学习

PaddlePaddle与PyTorch的转换

飞桨PaddlePaddle-源于产业实践的开源深度学习平台前五章

输出

视频课程学习笔记

完成环境配置以及对PyTorch的初步了解

初步了解PaddlePaddle，以及与PyTorch的转换关系

完成P10-P12，P22，P28的课程作业

第四周

任务

大模型

(正课)大模型 + 大资料 = 神奇结果？ (1_3)：大模型的顿悟时刻哔哩哔哩bilibili

P29-P33

图像生成模型

(正课)速览图像生成常见模型哔哩哔哩bilibili

P35-P36，P39-P41

PyTorch入门中剩下部分的学习

【布客】PyTorch 中文翻译 (apachecn.org)

PaddlePaddle包配置尝试

使用指南使用文档PaddlePaddle深度学习平台

输出

视频课程学习笔记以及作业

完成PyTorch教程上的代码教程

完成环境配置以及对PaddlePaddle的初步实践

第五周

任务

NLP相关基础知识

自然语言处理导引及词向量Lecture 1 - Introduction and Word Vector

Word2vec参考资料：

Efficient Estimation of Word Representations in Vector Space

Distributed Representations of Words and Phrases and their Compositionality

word2vec Parameter Learning Explained

依赖分析Lecture 4 - Dependency Parsing
语言模型Lecture 5 - Language Models and RNNs
Transformer模型、预训练模型Lecture 10 - Transformers and Pretrained Model
大模型相关：大模型基础清华大模型课程、大模型知识点

、

多模态学习：经典论文阅读

实战演练-阶段一

nlp

midlevel_data

nlp_dive

输出

视频课程学习笔记以及作业

阶段一涵盖NLP中模型构建的基本步骤，记录实验结果

第六周

任务

NLP相关任务

翻译任务Lecture 7 - Translation, Seq2Seq, Attention

这部分内容中包含的序列模型，注意力机制在第四周的神经网络训练任务部分已经讲述过，所以该部分可以略看。

问答任务Lecture 11 - Question Answering

自然语言生成任务Lecture 12 - Natural Language Generation

共指消解任务Lecture 13 - Coreference Resolution

实战演练-阶段二

词嵌入 TransE实现

词嵌入 Glove实现

序列模型与Attention

情感分析模型

关系抽取模型

大模型

输出

视频课程学习笔记以及作业

阶段二主要涵盖词嵌入学习及基础模型应用两部分内容完成模型调优，记录实验结果

第七周

任务

知识+大语言模型相关

T5 and Large Language Model

【生成式AI】ChatGPT 原理剖析 P1-P3、P7-P14

大模型微调相关-基于LangChain的大语言模型应用开发，微调以及RAG

指令微调 Instruction Tuning

常见微调方法：全量微调/P-Tuning/Prompt Tuning/LoRA

吴恩达大模型系列教程：2024吴恩达LLM大模型教程，手把手带你实现大模型预训练和模型微调，中英字幕（附学习课件）

【配套代码：GitHub - ConnectAI-E/LangChain-Tutior: ⛓ LangChain 入门指南，配套吴恩达老师 ai 课程 😎复现语言：Python、NodeJs、Golang】

实战演练-阶段三若对预训练模型微调部分感兴趣，可以参考huggingface主页。

文本分类

问答1

问答2

以下内容选择性完成

BERT微调

（本地或教程中提及Colab中执行）

RoBERTa微调

输出

视频课程学习笔记

阶段三涵盖预训练模型微调的基本过程，主要用意为熟悉huggingface平台，记录实验结果

熟悉大模型的离线知识检索增强生成以及在线知识微调流程，记录实验结果

第八周

任务

其他

知识增强Lecture 15 - Add Knowledge to Language Model

伦理道德Lecture 16 - Social & Ethical Consideration

模型分析与可解释性Lecture 17 - Model Analysis and Explanations

NLP未来Lecture 18 - Future of NLP

实战演练-阶段四

语义检索系统

智能问答系统

情感分析

输出

视频课程学习笔记以及作业

阶段四涵盖预训练模型微调的基本过程，主要目的为熟悉paddleNLP平台，记录实验结果

第九周

任务

模型压缩入门

模型压缩概述

模型蒸馏

入门

模型剪枝

入门

模型参数量化入门

论文阅读

模型压缩综述论文：Model compression as constrained optimization, with application to neural nets. Part I: general framework

其他（推荐计划从事该方向研究的同学阅读）

输出

视频课程学习笔记

论文阅读笔记

第十周

任务

代码实操

模型剪枝

知识蒸馏

低秩分解

模型参数量化

输出

熟悉代码的编写和内在逻辑，记录实验结果

作者:CrystalPuNK
链接:https://crystalpunk.top/article/1635d734-b731-804b-8f82-d5543b1ac298
声明:本文采用 CC BY-NC-SA 4.0 许可协议，转载请注明出处。

相关文章

【ML】队列数据 Cohort Data

Lazy loaded image

【ML】扩散薛定谔桥&扩散模型

Lazy loaded image

Cross Domain Skeleton-based Action Recognition by Using Parameter-free Similarity Matching

Lazy loaded image

【NIPS2017】Attention Is All You Need

Lazy loaded image

机器学习·李宏毅 2024版

Lazy loaded image

FLD+: DATA-EFFICIENT EVALUATION METRIC FOR GENERATIVE MODELS

Lazy loaded image

【NIPS 2024】One-Step Diffusion Distillation through Score Implicit Matching 符号收集

Loading...

CrystalPuNK

🤔

最新发布

[CVPR2024]Generate Like Experts: Multi-Stage Font Generation by Incorporating Font Transfer Process into Diffusion Models

【NIPS 2024】One-Step Diffusion Distillation through Score Implicit Matching

认知的矛盾——与DeepSeek-R1的一次交流

Cross Domain Skeleton-based Action Recognition by Using Parameter-free Similarity Matching

【nature】Accurate predictions on small data with a tabular foundation model

【ICLR 2024】A Flexible Generative Model for Heterogeneous Tabular EHR with Missing Modality

公告

🎉Crystal PuNK’s blog🎉

--- 正在施工 ---

👏欢迎comment👏