OCR(8)
-
OCR Tesseract inttemp not found
이유는 잘 모르겠지만, shapetable 파일을 삭제하면 해결됨 mftraining -F ./ocr/work/kor2.font_properties -D ./static/ocr -U ./static/ocr/unicharset -O ./static/ocr/kor2-0.unicharset Reading ./static/ocr\kor2.12lottemartdreambold.exp0.tr ... id size():Error:Assert failed:in file ../../../src/ccutil/unicharset.cpp, line 294 cntraining Reading ./static/ocr\kor2.12lottemartdreambold.exp0.tr ... Clustering ... Wri..
2021.04.18 -
이미지 임계처리
opencv-python.readthedocs.io/en/latest/doc/09.imageThresholding/imageThresholding.html 이미지 임계처리 — gramman 0.1 documentation 기본 임계처리 이진화 처리는 간단하지만, 쉽지 않은 문제를 가지고 있다. 이진화란 영상을 흑/백으로 분류하여 처리하는 것을 말합니다. 이때 기준이 되는 임계값을 어떻게 결정할 것인지가 중 opencv-python.readthedocs.io
2021.02.13 -
사진속 글자 검출 참조
d2.naver.com/helloworld/8344782
2021.02.13 -
mftraining 처리할 수 있는 tr 갯수 제한 있음
리눅스에서 64개까지 가능 윈도우에서 115개까지 가능 에러 No such file or directory: './static/ocr/pffmtable' shapetable 파일을 지워야 초기화 됨
2021.01.04 -
윈도우에서 폰트를 찾지 못하는 에러
text2image --text ./data/train.txt --outputbase ./data/font_image/kor.12lottemartdreambold.exp0 --font '12LotteMartDreamBold' --fonts_dir C:\ppData\Local\Microsoft\Windows\Fonts --fontconfig_tmpdir ./data/tmp Could not find font named '12LotteMartDreamBold'. Please correct --font arg. fonts_dir값의 '\'문자를 '/'로 변환 필요 font_dir = font_dir.replace('\', '/') fonts_dir은 윈도우와 사용자계정의 디렉토리 중 해당하는 디렉토리 정보를 ..
2021.01.02 -
tesseract 실행
# box 파일만 생성 tesseract ./aa/aa.png ./aa/aa -l kor batch.nochop makebox # tif, box 파일 생성 "unicharset_extractor --output_unicharset ./data/font_image/unicharset text2image --text %s --outputbase %s --font '%s' --fonts_dir %s --fontconfig_tmpdir %s" %(train, outputbase, font_name, font_dir,temp) # tr 파일 생성 "tesseract %s %s nobatch box.train" %(tif,outputbase) # unicharset 파일 생성 'unicharset_extracto..
2020.12.31