optimizer

发表于2026-06-04本文字数2字阅读时长1 分钟
  • Yuuko
Yuukoの小屋
首页LLM
更新于 2026-06-17
  • 本文作者:Yuuko@Yuukoの小屋
  • 本文链接:https://yuuko.site/2026/06/04/CS/LLM/optimizer/
  • 版权声明:本站所有文章除特别声明外,均采用 (CC)BY-NC-SA 许可协议。转载请注明出处!
上一篇OS

内存管理

下一篇OS

文件管理

  • LLM学习:01--Transformer
  • mup -- 小样本参数迁移
  • Spherical motion dynamic -- 球面动力学
  • Transformer 中的 Layer Normalization与梯度稳定性
  • From ResNet to mHC
  • DeepNet
  • MoE -- Mixture of experts
  • optimizer
  • Position Encoding
  • Assignment1 -- Building a Transformer LM
  • BPE-tokenizer
Yuuko

Yuuko

Amor che nella mente mi regiona.
46文章
14分类
25标签
  • 首页
  • 文章
    • 归档
    • 分类
    • 标签
    • 读书笔记
  • 友链
    © 2025 -2026Yuuko @ Yuuko
    166k 字 | 2:31
    基于 Hexo & Theme.ShokaX