Update meaning dataset stride token.

This commit is contained in:
Colin 2025-08-21 18:11:58 +08:00
parent 297c346df9
commit e18ee0c781
2 changed files with 10 additions and 3 deletions

View File

@ -19,11 +19,18 @@
![alt text](q@k_seq_47_layer_0.png)
## 在样本的中间插入固定的token
## stride数据集 插入固定的token
1. 使用stride的方法在每个token的中间插入一个固定的无用的token
2. 插入的token用或者不用于计算loss对精度都没有提升
3. 使用tree的数据集在token中间插入一些tree node对精度都没有提升
## stride数据集 总是插入前一个token重复token
1. 能提升精度 0.75940 0.76777
## Tree数据集 固定token
1. 使用tree的数据集在token中间插入一些固定的tokentree node对精度都没有提升
## 非线性Dot

View File

@ -124,7 +124,7 @@ class MeaningMap:
ms_rank_idx[index] = 0xFFFFFFF
ms_rank_all[index] = 0xFFFFFFF
for ind in range(index + 1, index + stride):
ms_data[ind] = vocab_of_stride
ms_data[ind] = i
ms_level[ind] = 511
ms_rank_idx[ind] = 0xFFFFFFF
ms_rank_all[ind] = 0xFFFFFFF