OCR (Optical Character Recognition)이란 무엇입니까?

OCR (Optical Character Recognition)은 수동으로 텍스트를 입력하거나 입력 할 필요없이 컴퓨터가 읽을 수있는 인쇄, 타이핑 또는 필기 문서의 디지털 버전을 만드는 소프트웨어를 의미합니다. OCR은 일반적으로 스캔 된 문서에서 PDF 형식으로 사용되지만 이미지 파일 내에 컴퓨터가 읽을 수있는 텍스트 버전을 만들 수도 있습니다.

OCR이란 무엇입니까?

문자 인식이라고도하는 OCR은 인쇄물이나 문서로 된 숫자, 문자 및 구두점과 같은 문자를 컴퓨터 및 기타 소프트웨어 프로그램에서보다 쉽게 ​​인식하고 읽을 수있는 전자 형식으로 변환하는 소프트웨어 기술입니다. 일부 OCR 프로그램은 문서가 디지털 카메라로 스캔되거나 촬영됨에 따라이를 수행하며 다른 사람들은 OCR없이 이전에 스캔되거나 촬영 된 문서에이 프로세스를 적용 할 수 있습니다. OCR을 통해 사용자는 PDF 문서 내에서 검색하고, 텍스트를 편집하고, 문서를 다시 포맷 할 수 있습니다.

OCR은 무엇을 위해 사용됩니까?

매일 필요로하는 빠른 검색을 위해 OCR은 큰 문제가 아닐 수도 있습니다. 많은 양의 스캐닝 작업을 수행하는 경우 PDF 내에서 원하는 항목을 찾을 수 있으면 시간을 상당히 절약 할 수 있고 스캐너 프로그램의 OCR 기능이 더 중요해질 수 있습니다. OCR이 도움이되는 몇 가지 다른 것들이 있습니다 :

왜 OCR을 사용합니까?

왜 그냥 사진 찍지 않는 거지? 왜냐하면 이미지 일 뿐이므로 아무것도 편집하거나 텍스트를 검색 할 수 없기 때문입니다. 문서를 스캔하고 OCR 소프트웨어를 실행하면 해당 파일을 편집하고 검색 할 수있는 것으로 바꿀 수 있습니다.

OCR의 역사

1914 년까지 문자 인식을 가장 초기에 사용하는 동안 OCR 관련 기술의 광범위한 개발 및 사용은 1950 년대에 시작되었습니다. 특히 디지털로 읽을 수있는 텍스트로 변환하기가 쉬운 매우 단순한 글꼴을 만들었습니다. 이 단순화 된 글꼴 중 첫 번째 글꼴은 David Shepard에 의해 작성되었으며 일반적으로 OCR-7B로 알려져 있습니다. OCR-7B는 오늘날 금융 업계에서 신용 카드 및 직불 카드에 사용되는 표준 글꼴을 사용하고 있습니다. 1960 년대에 몇몇 국가의 우편 서비스는 OCR 기술을 사용하여 미국, 영국, 캐나다 및 독일을 비롯한 우편물 분류 속도를 크게 향상 시켰습니다. OCR은 전 세계적으로 우편 서비스를 위해 메일을 분류하는 데 사용되는 핵심 기술입니다. 2000 년 OCR 기술의 한계와 기능에 대한 핵심 지식을 사용하여 봇과 스패머를 막는 CAPTCHA 프로그램 을 개발했습니다.

수십 년 동안 OCR은 인공 지능 , 기계 학습 및 컴퓨터 비전과 같은 관련 기술 분야의 발전으로 인해보다 정확하고 정교 해졌습니다. 오늘날 OCR 소프트웨어는 패턴 인식, 기능 감지 및 텍스트 마이닝을 사용하여 이전보다 더 빠르고 정확하게 문서를 변환합니다.