optimizer
发表于
2026-06-04
本文字数
2
字
阅读时长
1 分钟
Yuuko
首页
LLM
上一篇
OS
内存管理
下一篇
OS
文件管理
LLM学习:01--Transformer
mup -- 小样本参数迁移
Spherical motion dynamic -- 球面动力学
Transformer 中的 Layer Normalization与梯度稳定性
From ResNet to mHC
DeepNet
MoE -- Mixture of experts
optimizer
Position Encoding
Assignment1 -- Building a Transformer LM
BPE-tokenizer
Yuuko
Amor che nella mente mi regiona.
46
文章
14
分类
25
标签
首页
文章
归档
分类
标签
读书笔记
友链