Categories
2025
LLaDA-Rec - Discrete Diffusion for Parallel Semantic ID Generation in Generative Recommendation
Happy LLM · Part1 · Transformer
TiDAR - Think in Diffusion, Talk in Autoregression
Awesome LLaDA
UltraLLaDA Scaling the Context Length to 128K for Diffusion Large Language Models
LLaDA-MoE ASparse MoEDiffusion Language Model
强化学习的数学原理 · Chap6 · Stochastic Approximation and SGD
强化学习的数学原理 · Chap5 · Monte Carlo Learning
强化学习的数学原理 · Chap4 · Value Iteration and Policy Iteration
强化学习的数学原理 · Chap3 · Bellman Optimality Equation
强化学习的数学原理 · Chap2 · Bellman Equation
强化学习的数学原理 · Chap1 · 基本概念
Multimodal Diffusion Language Model · BirdResearch · 202510
WSL2部署
Vscode + LaTeX
Python · uv指南
Diffusion Language Model · BirdResearch · 202510
Diffusion Language Model · 论文笔记(一)
Diffusion Model · 李宏毅2023
Colab SSH指南
大语言模型教育纠错 · 论文笔记(三)
李宏毅机器学习2025 · Transformer
李宏毅机器学习2025 · Agent
李宏毅机器学习2025 · 前言
大语言模型教育纠错 · 论文笔记(二)
大语言模型数据清洗 · 论文笔记(五)
大语言模型教育纠错 · 论文笔记(一)
大语言模型教育纠错 · 论文笔记(零)
大语言模型数据清洗 · 论文笔记(四)
大语言模型数据清洗 · 论文笔记(三)
大语言模型数据清洗 · 论文笔记(二)
大语言模型数据清洗 · 论文笔记(一)
Python Rookie 扫盲 · 语法进阶
Python Rookie 扫盲 · 语法基础
浅谈MinHash
FineWeb-Edu-Chinese数据集论文记录
FineWeb数据集论文记录
CritiQ 工作文档
Read Me