Add none linear dot.
This commit is contained in:
		
							parent
							
								
									a326df1bba
								
							
						
					
					
						commit
						297c346df9
					
				| 
						 | 
					@ -23,3 +23,9 @@
 | 
				
			||||||
 | 
					
 | 
				
			||||||
1. 使用stride的方法,在每个token的中间插入一个固定的无用的token
 | 
					1. 使用stride的方法,在每个token的中间插入一个固定的无用的token
 | 
				
			||||||
2. 插入的token用或者不用于计算loss,对精度都没有提升
 | 
					2. 插入的token用或者不用于计算loss,对精度都没有提升
 | 
				
			||||||
 | 
					3. 使用tree的数据集,在token中间插入一些tree node,对精度都没有提升
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					## 非线性Dot
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					1. A = B *C 变成 A = B *(C+D) 等价于 A = B*C + B*D
 | 
				
			||||||
 | 
					2. 增加了参数,会提升精度
 | 
				
			||||||
		Loading…
	
		Reference in New Issue