机器学习(ML)和大型语言模型(LLMs)学习路线图
学生应该在微积分、统计学、计量经济学、基本经济理论和任何高级语言(最好是Python)的编程经验方面有扎实的基础。有助于理解优化问题,这是许多机器学习算法的核心,特别是在梯度下降和神经网络。对于理解概率分布、假设检验和推理至关重要,这些是大多数机器学习模型的基础。如果您有兴趣将机器学习技术应用于经济或金融数据,特别有用,因为它提供了分析关系和从数据中得出结论的技能。对于理解影响金融模型的潜在因素非
学生应该在微积分、统计学、计量经济学、基本经济理论和任何高级语言(最好是Python)的编程经验方面有扎实的基础。
微积分有助于理解优化问题,这是许多机器学习算法的核心,特别是在梯度下降和神经网络。统计对于理解概率分布、假设检验和推理至关重要,这些是大多数机器学习模型的基础。如果您有兴趣将机器学习技术应用于经济或金融数据,计量经济学特别有用,因为它提供了分析关系和从数据中得出结论的技能。基础经济理论对于理解影响金融模型的潜在因素非常重要,有助于创建预测性或规范性模型。实现算法和模型需要编程经验,Python是首选,因为它拥有庞大的机器学习和数据分析库生态系统,如NumPy、Pandas、Scikit-Learn、TensorFlow和PyTorch。有了这些先决条件,你就可以开始学习机器学习(ML)和大型语言模型(LLM)。
下面是一个结构化的路线图来指导你的学习之旅:
步骤1: 机器学习基础
- 复习线性代数与概率
学习线性代数(向量、矩阵、运算)和概率论的基础知识。
资源:
-
DeepLearning.AI 推出的 Mathematics for Machine Learning and Data Science 专项课程 Probability & Statistics for Machine Learning and Data Science 虽然口音有点重,但是真的容易理解 https://www.bilibili.com/video/BV1Fo4y1N7AX?p=1&vd_source=e1382be5be85cdcfd0d80d83c7c62002 【搬运自Coursera】
-
Essence of Linear Algebra 非常容易理解的短片系列 https://www.bilibili.com/video/BV1u4411H7Ry/?vd_source=e1382be5be85cdcfd0d80d83c7c62002 【搬运自油管】
-
可汗概率学院:https://www.khanacademy.org/math/statistics-probability
-
线性代数可汗学院:https://www.khanacademy.org/math/linear-algebra
-
Python编程基础
如果你还没有熟悉Python,请熟悉它,因为它广泛用于ML。
关键库:NumPy、Pandas、Matplotlib。
资源:
-
Bill Lubanovic 的《Introducing Python》
-
Python.org教程:https://docs.python.org/3/tutorial/index.html
-
W3School Python教程:https://www.w3schools.com/python/
Python的网上资源非常的多,这里就不一一赘述了。如果需要,请**联系我(**nihe78 # gmail.com)。
- 机器学习导论
-
从基本的机器学习概念开始,如监督学习和无监督学习。
-
了解线性回归、逻辑回归、K近邻和决策树等关键算法。
资源:
-
周志华《机器学习》:这本书是机器学习领域的经典入门教材之一,被称为“西瓜书”。它涵盖了机器学习的基础知识和各种算法,内容全面且易于理解,适合初学者入门。
Github 资源:
https://github.com/datawhalechina/pumpkin-book _开源组织Datawhale将《机器学习》中1-16章节的公式进行了整理,并对难点公式进行了详解和补充,创建了《pumpkin-book》南瓜书项目
_https://github.com/Vay-keen/Machine-learning-learning-notes 周志华《机器学习》的学习笔记,记录了在学习这本书的过程中的理解思路以及一些有助于消化书内容的拓展知识,笔记中参考了许多网上的大牛经典博客以及李航《统计学习》的内容。 -
李航 《统计学习方法》这本书全面系统地介绍了统计学习的主要方法,特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场等。
Github 资源:https://github.com/zhengjingwei/statistical-learning-method _用python手动实现和sklearn实现《统计学习方法》中所提到的算法。_https://github.com/datawhalechina/statistical-learning-method-solutions-manual 完成了《统计学习方法》的所有习题解答,并提供Python代码和运行截图。内容包括感知机、K近邻法、朴素贝叶斯法、决策树、逻辑斯蒂回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型、条件随机场等章节的习题解答。
- https://github.com/WenDesi/lihang_book_algorithm 致力于将《统计学习方法》一书中所有算法实现一遍。提供了详细的代码示例和注释,帮助读者理解和实现书中的算法 -
吴恩达的Coursera ML课程:https://www.coursera.org/learn/machine-learning
-
Scikit学习用户指南:https://scikit-learn.org/stable/user_guide.html
4. 练习机器学习模型
-
练习使用Scikit-Learn构建简单模型。
-
使用Kaggle或UCI机器学习库中的数据集来实现您的模型。
步骤2: 中级机器学习技术
- 深度学习基础
-
了解神经网络、激活函数、损失函数和优化器。
-
了解反向传播和梯度下降的基础知识。
资源:
-
Ian Goodfellow, Yoshua Bengio, and Aaron Courville《Deep Learning》这本书是深度学习领域的经典著作,被称为“深度学习AI圣经”。它涵盖了深度学习的概念、方法以及工业界实践应用,适合对深度学习感兴趣的读者深入学习。
-
Christopher Bishop《Pattern Recognition and Machine Learning》比较老,但是非常经典的读物,相对《Deep Learning》容易理解一些。
-
深度学习 Coursera 课程:https://www.coursera.org/specializations/deep-learning
-
TensorFlow.org教程:https://www.tensorflow.org/tutorials
2. 深度学习框架
-
获得TensorFlow和PyTorch的实践经验。
-
从构建用于分类和回归任务的简单神经网络开始。
3. 评估指标和模型调整
-
了解评估指标,如准确性、精确度、召回率、F1评分、ROC曲线和AUC。
-
练习超参数调整、正则化和模型选择。
步骤3: NLP和大语言模型(LLMs)
- 自然语言处理(NLP)基础
-
了解Tokenization、Embedding、Indexing等技术。
-
理解RAG技术,了解如何从Huggingface调用大语言模型。
资源:
-
HuggingFace上的资源 https://huggingface.co/learn/nlp-course/
-
Jurafsky和Martin的《Speech and Language Processing》https://web.stanford.edu/~jurafsky/slp3/ 第三版的电子资源
-
Delip Rao和Brian McMahan的 “Natural Language Processing with PyTorch”
-
斯坦福NLP课程:https://web.stanford.edu/class/cs224n/
2. Transformers和LLM
-
了解构成LLM基础的Transformer架构。
-
研究注意力机制、序列到序列模型和自我注意力。
资源:
-
《Transformer》:https://jalammar.github.io/illustrated-transformer/
-
“Attention is All You Need”论文:https://arxiv.org/abs/1706.03762
-
HuggingFace Transformers概述:https://huggingface.co/transformers/
-
LLM实践
-
学习使用预训练的LLM,如GPT、BERT,并针对特定任务对其进行微调。
-
框架:HuggingFace Transformers,用于实现最先进的NLP模型。
-
使用HuggingFace练习文本分类、摘要和生成。
步骤5: 应用和实践
- 构建机器学习项目
-
实施各种机器学习项目,如股价预测、情绪分析和推荐系统。
-
将计量经济学知识应用于机器学习模型,以解决金融相关问题。
- 微调LLMs
-
承担涉及聊天机器人、摘要工具或使用LLM进行语言翻译的项目。
-
练习使用不同的数据集,如财务报告、社交媒体数据或其他特定领域的文本,为自定义应用程序微调LLM。
- 强化学习
-
学习强化学习(如Bandit learning, Q-learning)和对抗模型(GAN)的基础知识。
-
探索这些在金融中的应用,如算法交易。
- 研究论文和实践经验
-
开始阅读相关的研究论文,了解最新进展。
-
实施和实验论文中的模型,以亲身了解前沿研究。
建议时间表
-
第1-3个月:基础和Python基础。
-
4-6个月:中级机器学习,从深度学习开始。
-
第7-9个月:NLP和LLMs。
-
第10-12个月:应用和竞赛。
推荐工具
-
VS Code或Jupyter Notebook用于实验。
-
Huggingface适合LLMs。
-
Scikit learn,TensorFlow,PyTorch用于ML。
那么,如何系统的去学习大模型LLM?
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~
篇幅有限,部分资料如下:
👉LLM大模型学习指南+路线汇总👈
💥大模型入门要点,扫盲必看!
💥既然要系统的学习大模型,那么学习路线是必不可少的,这份路线能帮助你快速梳理知识,形成自己的体系。
路线图很大就不一一展示了 (文末领取)
👉大模型入门实战训练👈
💥光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
👉国内企业大模型落地应用案例👈
💥两本《中国大模型落地应用案例集》 收录了近两年151个优秀的大模型落地应用案例,这些案例覆盖了金融、医疗、教育、交通、制造等众多领域,无论是对于大模型技术的研究者,还是对于希望了解大模型技术在实际业务中如何应用的业内人士,都具有很高的参考价值。 (文末领取)
👉GitHub海量高星开源项目👈
💥收集整理了海量的开源项目,地址、代码、文档等等全都下载共享给大家一起学习!
👉LLM大模型学习视频👈
💥观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。 (文末领取)
👉640份大模型行业报告(持续更新)👈
💥包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
👉获取方式:
这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐
所有评论(0)