opencv ocr 예제

opencv ocr 예제

다운로드 코너에 제공된 스크립트를 테스트하고 있었습니다. 그러나 무슨 일이 일어나고 있는지 모르겠지만 이미지의 모든 단어 (예 _03.jpg)로 반복되지는 않습니다. 그것은 첫 번째 단어에 갇혀 그 후 다음 단어를 인식하지 않습니다. 코드에서 아무 것도 변경하지 않았고 주어진 명령 (python text_recognition.py – 동쪽 frozen_east_text_detection.pb -이미지 이미지/예제_03.jpg)을 사용하여 실행합니다. 이제 내 질문 : 그 약간 수정 된 구현은 여전히 픽셀 조작 공격 이나 다른 공격 형태에 대한 유효한 대상이 될 것입니다, 나는 거기에 5-6 가장 큰 그물에 그들을 기반으로하거나 즉시 수정 (예를 들어 레이블 클래스를 추가) 그물 것입니다 메인 풀)이 만들어졌다, 그 공격의 안전 ? 안녕하세요 애드리안, 나는 opencv 버전 4.1.0을 사용하고이 문제 파이썬 text_recognition.py 발생 -동쪽 냉동_east_text_detection.pb – 이미지 이미지 / 예제_01.jpg [INFO] 동부 텍스트 검출기를로드 … OCR 텍스트 paths.list_images 함수를 사용하여 지정된 디렉터리에 있는 모든 입력 이미지를 반복합니다. PyImageSearch에서 많은 자습서에서 해당 함수를 사용하지만 예제로이 함수로 시작하는 것이 좋습니다. 다음으로 영어 알파벳에 대해동일한 작업을 수행하지만 데이터 및 기능 집합에 약간의 변화가 있습니다. 여기, 이미지 대신, OpenCV는 데이터 파일과 함께 제공, opencv / 샘플 / CPP / 폴더에 문자 인식.데이터. 당신이 그것을 열면, 당신은 첫눈에, 쓰레기처럼 보일 수 있습니다 20000 라인을 볼 수 있습니다.

실제로 각 행에서 첫 번째 열은 우리의 레이블인 알파벳입니다. 다음 16 숫자는 다른 기능입니다. 이러한 기능은 UCI 기계 학습 리포지토리에서 가져옵니다. 이 페이지에서 이러한 기능에 대한 자세한 내용을 확인할 수 있습니다. 이봐 애드리안,나는 Jupyter 노트북에서이 코드를 실행하고 있습니다 (pyhton 3.6.+ 콘다 4.5.11 + opencv 3.4). 인식할 수 없는 오류가 발생했습니다. opencv와 numpy를 사용하는 간단한 파이썬 OCR 엔진. 과장 된 세리프와 양식에 일치시키는 글꼴을 사용하여 (신문 브랜드의 전형적인 오래된 영어 타이프 페이스로 과장되지 않음).

Tesseract 텍스트 감지 경계 상자는 텍스트 인식이 부정확해지 않게 하는 일부 문자의 중요한 부분을 잘라내고 있습니다. ocr7.com 학습된 trainingdata 파일을 사용하여 매우 글꼴을 포함하고 동일한 글꼴을 사용하여 만든 완벽한 텍스트 예제를 사용하여 매우 글꼴을 포함하더라도 이 문제가 발생합니다. 테서랙트의 경계 상자 매개변수를 조정할 수 있습니까? 이봐 비토리오, 당신은 랜덤 문자의 어떤 예가 있습니까? 나는 그들이 내 머리 꼭대기에서 어떻게 생겼는지 잘 모르겠다. 감독 학습은 기계를 "가르치는" 방법입니다. 기본적으로 알고리즘은 예제를 통해 학습됩니다(예: 이 특정 세그먼트에는 문자 f가 포함되어 있음). 교육 후, 기계는 새로운 데이터에 획득 한 지식을 적용 할 수 있어야합니다. 나는 그것에 똑바로 tesaract를 설치할 수 있습니다 … 아니면 opencv.를 제거해야합니다. 물론, OpenCV 플랫 아웃 실패 예가있다 : 친애하는 박사 애드리안, 위의 예는 세리프 예를 들어 타임즈 로마와 세리프없이 글꼴에 대한 작동, 예를 들어 아리알, 그래서 우리의 기본 OCR 응용 프로그램은 준비가되어 있습니다. 이 특별한 예는 나에게 91 %의 정확도를 주었다.

אין תגובות

מצטער, טופס התגובה סגור בשלב זה.