파이썬/OCR(14)
-
OCR Tesseract inttemp not found
이유는 잘 모르겠지만, shapetable 파일을 삭제하면 해결됨 mftraining -F ./ocr/work/kor2.font_properties -D ./static/ocr -U ./static/ocr/unicharset -O ./static/ocr/kor2-0.unicharset Reading ./static/ocr\kor2.12lottemartdreambold.exp0.tr ... id size():Error:Assert failed:in file ../../../src/ccutil/unicharset.cpp, line 294 cntraining Reading ./static/ocr\kor2.12lottemartdreambold.exp0.tr ... Clustering ... Wri..
2021.04.18 -
Tesseract text2image
--char_spacing 1 : 글자간의 간격을 1로 셋팅 --find_fonts : 폰트를 찾아서 실행 --outputbase ./work/output/ : 해당 위치에 결과 이미지 생성(마지막에 '/'가 없으면, 디렉토리 제대로 찾지 못함) text2image --text ./work/words.txt --outputbase ./work/output/ --fontconfig_tmpdir ./work/tmp --fonts_dir C:/Windows/Fonts --char_spacing 1 --find_fonts
2021.03.28 -
Tesseract 사용 가능한 Font 확인
사용가능한 폰트 확인 text2image --list_available_fonts --fontconfig_tmpdir ./work/tmp --fonts_dir c:/Windows/Fonts --fonts_dir이 없으면 아래와 같은 에러 발생 text2image --list_available_fonts --fontconfig_tmpdir ./work/tmp Fontconfig warning: "./work/tmp\fonts.conf", line 4: empty font directory name ignored
2021.03.28 -
Tesseract TR 생성시 인식률 높이기
'-- psm 8'을 추가해 줬을 때, 좀더 많은 문자를 제대로 인식함'-- psm 8'을 추가해 줬을 때, 좀더 많은 문자를 제대로 인식함 cmd = "tesseract %s %s --psm 8 nobatch box.train" %(file,file[:file.rfind('.')]) 아래 Fail을 줄일 수 있음 FAIL! APPLY_BOXES: boxfile line 184/: ((2135,9883),(2139,9906)): FAILURE! Couldn't find a matching blob
2021.03.08 -
이미지 임계처리
opencv-python.readthedocs.io/en/latest/doc/09.imageThresholding/imageThresholding.html 이미지 임계처리 — gramman 0.1 documentation 기본 임계처리 이진화 처리는 간단하지만, 쉽지 않은 문제를 가지고 있다. 이진화란 영상을 흑/백으로 분류하여 처리하는 것을 말합니다. 이때 기준이 되는 임계값을 어떻게 결정할 것인지가 중 opencv-python.readthedocs.io
2021.02.13 -
사진속 글자 검출 참조
d2.naver.com/helloworld/8344782
2021.02.13