- generate_synthetic.py: plate 전체 box → 글자 실제 좌표 기반 tight polygon으로 변경
(글자 반복 출력·over-segmentation의 근본 원인 해결)
gen_type1/2/_gen_two_line 모두 (plate, label_list) 통일 반환
- tools/make_gt_mat.py: test.txt → ICDAR wordBB 포맷 gt_img_N.mat 생성 스크립트 신규
(E2EMetric seqerr=0.99 고착 문제 해결)
- scripts/run_step1.sh: 데이터 생성 → GT mat 생성 → 학습 3단계로 재구성
NUM_SAMPLES 환경변수로 데이터 수 제어 가능
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>