파이썬/OCR(14)
-
mftraining 처리할 수 있는 tr 갯수 제한 있음
리눅스에서 64개까지 가능 윈도우에서 115개까지 가능 에러 No such file or directory: './static/ocr/pffmtable' shapetable 파일을 지워야 초기화 됨
2021.01.04 -
shapeclustering 효과 없음
단, mftraing 수행시, 에러가 발생하는 경우 사용하면 해결되는 경우가 있음
2021.01.03 -
윈도우에서 폰트를 찾지 못하는 에러
text2image --text ./data/train.txt --outputbase ./data/font_image/kor.12lottemartdreambold.exp0 --font '12LotteMartDreamBold' --fonts_dir C:\ppData\Local\Microsoft\Windows\Fonts --fontconfig_tmpdir ./data/tmp Could not find font named '12LotteMartDreamBold'. Please correct --font arg. fonts_dir값의 '\'문자를 '/'로 변환 필요 font_dir = font_dir.replace('\', '/') fonts_dir은 윈도우와 사용자계정의 디렉토리 중 해당하는 디렉토리 정보를 ..
2021.01.02 -
java로 text를 image로 변환하는 샘플
jogeum.net/21
2020.12.31 -
tesseract 실행
# box 파일만 생성 tesseract ./aa/aa.png ./aa/aa -l kor batch.nochop makebox # tif, box 파일 생성 "unicharset_extractor --output_unicharset ./data/font_image/unicharset text2image --text %s --outputbase %s --font '%s' --fonts_dir %s --fontconfig_tmpdir %s" %(train, outputbase, font_name, font_dir,temp) # tr 파일 생성 "tesseract %s %s nobatch box.train" %(tif,outputbase) # unicharset 파일 생성 'unicharset_extracto..
2020.12.31 -
OCR 현대 한글의 모든 글자
namu.wiki/w/%ED%98%84%EB%8C%80%20%ED%95%9C%EA%B8%80%EC%9D%98%20%EB%AA%A8%EB%93%A0%20%EA%B8%80%EC%9E%90
2020.12.31