1. CLOVA OCR 주요 기능과 사용 계획

Untitled

작업을 탬플릿화해주는 기능을 제공함

Untitled

Untitled

Untitled

Untitled

RESTful API

탬플릿 방식과 제너럴 방식이 있음

탭플릿은 구역을 정하면 그 블럭의 정보를 정해진 형식에 맡게 저장함. 정형화된 문서에 적합함

제너럴 방식은 사진에 있는 글자들을 모두 읽어 와서 텍스트를 반환하는 방식

case1)

탬플릿에 맞추기 위해 사용자에게 적당한 형태의 사진을 요구

→ 영수증의 경우 종이의 길이도 다르고 회사마다 다른 형태를 가짐.

길이와 위치가 모두 다르기 때문에 불필요하고 잘못된 정보가 끼어들 수 있음.(노이즈)

case2)

모든 텍스트를 읽어와서 “상품명” “총계”와 같은 키워드를 중심으로 정보를 후처리

예상되는 문제 : 영수증 외부의 텍스트가 인식될 가능성(노이즈)

기준이 될 키워드를 모두 적용시키지 못할 가능성

띄어쓰기 등 수량 정보와 같이 간격이 있는 정보를 구분하지 못할 가능성

case3)

표형태로 인식이 가능한경우

Untitled