一、前言

入门-初识卷积神经网络CNN

1. 机器学习开发环境配置

2. 入门之-波士顿房价预测

3.入门之-手写数字识别

4.入门之-Transformer基础

二、Image classification – 图像分类

iChallenge-PM数据集图像分类(一)

iChallenge-PM数据集图像分类(二)(含源码)

三、Image Segmentation – 分割算法

SemanticGAN-一种语义分割半监督学习算法

Vision Transformers系列

SEEM-分割一切算法

solo系列 – 高效的实例分割算法

四、Object detection – 目标检测

目标检测(一)

目标检测(二)

五、RL-强化学习

1. 强化学习-基础算法

2. CartPole环境-DQN算法实现(含源码)

3. CartPole环境-DDPG算法实现(含源码)

4. PyGame环境-FlappyBird实现(含源码)

5. 并行强化学习A2C算法实现

六、 MARL-多智能体强化学习

1. 多智能体强化学习基础

2. UPDeT transformer应用于多智能体强化学习

七、GAN – 生成对抗

GAN系列算法教程

Pix2PixHD算法详解

如何把图片嵌入StyleGAN隐空间

7.1 小数据算法

StyleGAN-ADA迁移学习经验总结

DatasetGAN-半监督小数据算法

EditGAN-可精确编辑GAN算法

八、LLM – 大语言模型

Flan:为高效指令微调设计数据和方法

从Orca聊数据集制作、LLM微调和魔改

TinyLlama小型化语言模型baseline

RHO-1选择Tokens训练算法

长文本系列LLM(LA、RetNet、Mamba)

8.1 参数高效微调(PEFT)

LoRA Learns Less and forgets Less 摘要

大语言模型的LoRA方法综述

8.2 其他

RLHF算法

九、Diffusion – 扩散模型

Stable Diffusion WebUI使用教程

Lora for Diffusion算法

免训练图像编辑算法

扩散模型综述

unCLIP-使用CLIP隐码的文字引导图片生成(DALLE-2)

图片生成算法中的Autoregressive与 Vector Quantization

十、Agent – 基于大模型的智能体

RDAgent – 来自微软亚洲研究院

Agent Laboratory – 用LLM作为研究助手

HKUDS/GraphAgent (注意:代码跑不通)

人工智能重要的经典算法

ConvNeXt论文阅读

Transformer框架

基于信息熵的RL算法-SAC

基于skill的RL算法-DIAYN

L-DAE解构扩散模型实现自监督学习

AI-实战和部署

1. 零算法实现目标检测

2.安卓手机基于mincap的开发(含源码)

3.Reward和GameOver设计思路

4.部署目标检测到安卓手机(Flutter)

5. AirSim环境部署PARL强化学习算法

附录

高性能机器学习主机DIY-篇外

Win+Ubuntu双系统(GPU)安装

GPU加速-篇外

Python操作Android-篇外

numpy常用方法

Pytorch教程

Paddle高级玩法

chrome extension编程指南

Python消息队列pika+RabbitMQ

Python RESTFul库-fastapi教程

存档(Archive)

Python人工智能集成工具-AutoGPT

本地化GPT-Langchain+chatGLM

Zephyr微调技巧学习

无监督GAN重建3D形状

拟真MineCraft游戏世界GANcraft

生成对抗模仿学习(外链)