Witllm/rwkv/RWKV-v7/model.md

17 lines
535 B
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

R-Receptance 这个接受度可以从代码上直接看到,它是模型对过去的记忆程度。
W-Weight 这个Weight本身并不是一个泛指是一个过去信息的时间衰减
K、V 就是等同于Transformer的Key与Value。
- 记住过去的信息(通过 V
- 找到相关的信息(通过 K
- 控制信息的重要性(通过 W
- 决定使用多少信息(通过 R
TimeMix指的是过去信息x-1与当前信息x的混合。 xx = self.time_shift(x) - x 这个是典型的操作
RWKV_Tmix_x070