跳过正文
  1. Tags/

LLM

2026

Llm04 Position Encoding

位置编码 # 卷积具有局部性,天然地会注意元素之间的相对位置,但是基于自注意力的transformer模型则对位置不敏感,因此必须要把元素的位置信息在embedding阶段传给元素。 比如:

LLM01 Self Attention

attention # 注意力机制,最早是在机器翻译论文**Neural Machine Translation by Jointly Learning to Align and Translate**中提出来的,他的核心是,用一个东西产生的query,去key/value中查询需要的东西。在上述论文中encoder-decoder attention的结构中。