본문 바로가기
Kospeech

[Python/AI/ASR] Kospeech - 학습 파라미터 조절

by hwanikim 2024. 10. 14.

/home/donghwan/kospeech_env/kospeech/kospeech/trainer/__init__.py

설정 항목 기본 값 설명
dataset "kspon" 사용할 데이터셋의 이름
dataset_path "???" 데이터셋이 저장된 경로. 실제 데이터셋 경로로 수정해야 함
transcripts_path "../../../data/transcripts.txt" 텍스트 전사 파일의 경로
output_unit "character" 모델 출력 단위 ("character", "subword", "grapheme" 등)
batch_size 8 한 번의 학습에서 처리하는 데이터 샘플의 개수
save_result_every 1000 결과를 저장하는 빈도 (학습 반복 수)
checkpoint_every 5000 체크포인트 파일을 저장하는 빈도 (학습 반복 수)
print_every 10 학습 상태를 출력하는 빈도 (학습 반복 수)
mode "train" 학습 모드 ("train") 또는 평가 모드 ("eval")
num_workers 4 데이터 로딩에 사용할 CPU 코어의 개수
use_cuda TRUE GPU(CUDA) 사용 여부
num_threads 2 사용할 CPU 스레드의 개수
init_lr_scale 0.01 초기 학습률의 스케일
final_lr_scale 0.05 최종 학습률의 스케일
max_grad_norm 400 그라디언트 클리핑에 사용되는 최대 그라디언트 노름 값
weight_decay 1.00E-05 가중치 감쇠 (정규화) 비율
total_steps 200000 전체 학습 과정에서 수행할 총 스텝 수
seed 777 랜덤 시드 값 (재현성 보장)
resume FALSE 이전 학습을 재개할지 여부 (True로 설정 시 체크포인트에서 학습 재개 가능)

 

'Kospeech' 카테고리의 다른 글

[Python/AI/ASR] Kospeech - Install  (0) 2024.10.19
[Python/AI/ASR] Kospeech - 에러 수정  (0) 2024.10.14
[Python/AI/ASR] Kospeech - Intro ~ Preprocess  (0) 2024.10.14