본문 바로가기

NCP

[NCP] CLOVA OCR 이렇게 사용하세요!

반응형

안녕하세요. 네이버클라우드플랫폼의 웨비나에 참석하면서 CLOVA OCR 서비스 소개를 듣고 왔습니다.

간략하게나마 정리겸 소개를 해보려 합니다.

📚 이런 내용을 다룰 거예요

  • CLOVA OCR 서비스 소개
  • CLOVA OCR 주요 기능
  • CLOVA OCR 활용

👀 이런 궁금증을 가진 분들께 추천해요

  • 영수증, 신분증 등을 알아서 인식∙분류하는 방법 없을까?
  • 사내 시스템과 연동해 문서 처리를 자동화 하고 싶어!
  • 기울어진 텍스트나 필기체도 인식할 순 없을까?

OCR 이란?

OCR은 Optical Character Recognition의 약자로서 광학 문자 인식이라고도 부릅니다.

사람이 직접쓰거나 이미지 속에 있는 문자를 이미지 스캔으로 얻은 다음, 이를 컴퓨터가 인식할 수 있도록 문자를 디지털화하는 기술입니다.

 

OCR 의 역사

1928년 오스트리아 엔지니어인 구스타프 타우셰크 박사가 1928년 문자인식방법에 대한 특허 등록

-> 우편번호 추출을 통한 우편물관리, 자동차 번호판 인식, 모바일 기기를 사용한 명함 인식

2990년대 초 역사 신문을 디지털화하면서 대중화

 

OCR의 분류

크게 2가지로 분류

OCR 기술은 크게 문자탐지(text detection)와 문자인식 (text recognition)으로 구성

 

OCR 기술 구현은 왜 어려울까?

첫째, 문서 이미지 속 글자들은 정형화되어 있지만, 손글씨 및 서명은 비정형화되어 있어 분별이 어렵다.

둘째, 배경이 복잡한 경우 배경과 문자의 구분이 힘들다.

셋째, 다양한 간섭요소, 예를 들면 노이즈, 왜곡 글자 사이 밀도, 저해상도로 인해 식별에 어려움이 있다.

 

 

OCR 기술의 진화과정

출처 : https://www.sepoasoft.co.kr/?p=6780

 

 

딥러닝 기반의 OCR의 원리

출처 : https://m.blog.naver.com/with_msip/221846680863

 

 

전 세계가 주목하는 OCR 기술

 

CLOVA OCR 서비스 개요

CLOVA OCR 서비스는 문서를 정확하게 인식하고, 후속 처리 워크플로우를 지정하여 빠르게 업무를 처리할 수 있습니다.

 

CLOVA OCR 동작 프로세스

 

 

Template OCR

 

 

필기체 및 멀티박스 인식

 

 

Document OCR

 

Document OCR - 영수증

Document OCR - 신용카드

Document OCR - 사업자등록증

 

Document OCR - 명함

 

 

Document OCR - 신분증

 

 

Document OCR 보안