Latent
首页
博客
项目
归档
关于
搜索
主页
Tags
Reasoning
理解注意力机制:从缩放点积到多头注意力
深入解析 Transformer 中的注意力机制——从 Query-Key-Value 的直觉出发,经过缩放点积注意力,到多头注意力,配合具体数值示例追踪数据流。