Witllm/wit/query_meaning_freq.py

import pytorch_lightning as pl
import torch

from model.light_module import LightModule
from model.tokenization_qwen import QWenTokenizer
import numpy as np

import configuration
import meaning as m

if __name__ == "__main__":

    checkpoint_path = "log/bigger/version_1/checkpoints/epoch=14-step=74040.ckpt"

    qwen = LightModule.load_from_checkpoint(checkpoint_path=checkpoint_path)
    qwen.eval()
    conf = qwen.config
    torch.manual_seed(conf.seed)
    np.random.seed(conf.seed)

    train_dataloader, val_dataloader = m.InitDataset(conf)

    loader = train_dataloader.dataset

    map = loader.meaning_dataset.get_meaning_map()
    seqs = {}
    for batch in loader:
        for m in batch["meaning"]:
            seqs[m] = map.get_sequence(m)
    while True:
        m = int(input("input meaning: "))
        total = 0
        for seq in seqs.values():
            total = total + seq.count(m)
        print(f"meaning of {m} count as {total}")
Add query file. Refine print tree. 2025-02-26 16:55:20 +08:00			`import pytorch_lightning as pl`
			`import torch`

Fix model path. 2025-03-18 15:58:08 +08:00			`from model.light_module import LightModule`
Add query file. Refine print tree. 2025-02-26 16:55:20 +08:00			`from model.tokenization_qwen import QWenTokenizer`
			`import numpy as np`

			`import configuration`
Refine import code. 2025-08-10 15:10:20 +08:00			`import meaning as m`
Add query file. Refine print tree. 2025-02-26 16:55:20 +08:00
			`if __name__ == "__main__":`

			`checkpoint_path = "log/bigger/version_1/checkpoints/epoch=14-step=74040.ckpt"`

Rename QwenModule to lightmodule. 2025-03-10 19:14:47 +08:00			`qwen = LightModule.load_from_checkpoint(checkpoint_path=checkpoint_path)`
Add query file. Refine print tree. 2025-02-26 16:55:20 +08:00			`qwen.eval()`
			`conf = qwen.config`
			`torch.manual_seed(conf.seed)`
			`np.random.seed(conf.seed)`

Refine import code. 2025-08-10 15:10:20 +08:00			`train_dataloader, val_dataloader = m.InitDataset(conf)`
Add query file. Refine print tree. 2025-02-26 16:55:20 +08:00
			`loader = train_dataloader.dataset`

			`map = loader.meaning_dataset.get_meaning_map()`
Add meaning dataset get_relation_table support and paint to qk image. 2025-06-25 20:13:48 +08:00			`seqs = {}`
Add query file. Refine print tree. 2025-02-26 16:55:20 +08:00			`for batch in loader:`
			`for m in batch["meaning"]:`
Add meaning dataset get_relation_table support and paint to qk image. 2025-06-25 20:13:48 +08:00			`seqs[m] = map.get_sequence(m)`
Add query file. Refine print tree. 2025-02-26 16:55:20 +08:00			`while True:`
			`m = int(input("input meaning: "))`
			`total = 0`
Add meaning dataset get_relation_table support and paint to qk image. 2025-06-25 20:13:48 +08:00			`for seq in seqs.values():`
			`total = total + seq.count(m)`
Add query file. Refine print tree. 2025-02-26 16:55:20 +08:00			`print(f"meaning of {m} count as {total}")`