/home/donghwan/kospeech_env/kospeech/kospeech/trainer/__init__.py
설정 항목 | 기본 값 | 설명 |
dataset | "kspon" | 사용할 데이터셋의 이름 |
dataset_path | "???" | 데이터셋이 저장된 경로. 실제 데이터셋 경로로 수정해야 함 |
transcripts_path | "../../../data/transcripts.txt" | 텍스트 전사 파일의 경로 |
output_unit | "character" | 모델 출력 단위 ("character", "subword", "grapheme" 등) |
batch_size | 8 | 한 번의 학습에서 처리하는 데이터 샘플의 개수 |
save_result_every | 1000 | 결과를 저장하는 빈도 (학습 반복 수) |
checkpoint_every | 5000 | 체크포인트 파일을 저장하는 빈도 (학습 반복 수) |
print_every | 10 | 학습 상태를 출력하는 빈도 (학습 반복 수) |
mode | "train" | 학습 모드 ("train") 또는 평가 모드 ("eval") |
num_workers | 4 | 데이터 로딩에 사용할 CPU 코어의 개수 |
use_cuda | TRUE | GPU(CUDA) 사용 여부 |
num_threads | 2 | 사용할 CPU 스레드의 개수 |
init_lr_scale | 0.01 | 초기 학습률의 스케일 |
final_lr_scale | 0.05 | 최종 학습률의 스케일 |
max_grad_norm | 400 | 그라디언트 클리핑에 사용되는 최대 그라디언트 노름 값 |
weight_decay | 1.00E-05 | 가중치 감쇠 (정규화) 비율 |
total_steps | 200000 | 전체 학습 과정에서 수행할 총 스텝 수 |
seed | 777 | 랜덤 시드 값 (재현성 보장) |
resume | FALSE | 이전 학습을 재개할지 여부 (True로 설정 시 체크포인트에서 학습 재개 가능) |
'Kospeech' 카테고리의 다른 글
[Python/AI/ASR] Kospeech - Install (0) | 2024.10.19 |
---|---|
[Python/AI/ASR] Kospeech - 에러 수정 (0) | 2024.10.14 |
[Python/AI/ASR] Kospeech - Intro ~ Preprocess (0) | 2024.10.14 |