Add none linear dot.
This commit is contained in:
parent
a326df1bba
commit
297c346df9
|
@ -23,3 +23,9 @@
|
||||||
|
|
||||||
1. 使用stride的方法,在每个token的中间插入一个固定的无用的token
|
1. 使用stride的方法,在每个token的中间插入一个固定的无用的token
|
||||||
2. 插入的token用或者不用于计算loss,对精度都没有提升
|
2. 插入的token用或者不用于计算loss,对精度都没有提升
|
||||||
|
3. 使用tree的数据集,在token中间插入一些tree node,对精度都没有提升
|
||||||
|
|
||||||
|
## 非线性Dot
|
||||||
|
|
||||||
|
1. A = B *C 变成 A = B *(C+D) 等价于 A = B*C + B*D
|
||||||
|
2. 增加了参数,会提升精度
|
Loading…
Reference in New Issue