포티투마루, 인공지능 OCR-NLP 솔루션 ‘텍스탠딩’ 출시
포티투마루, TTA 기계독해 품질성능평가 유일하게 통과
공지능 앤서링(Answering) AI 스타트업 포티투마루(42Maru, 대표 김동환)는 인공지능 광학문자인식-자연어처리(OCR-NLP) 솔루션 ‘텍스탠딩’을 출시했다고 28일 밝혔다.
포티투마루가 출시한 텍스탠딩(Textanding)은 문서(Text)의 이해(Understnading)라는 의미로, 인공지능 딥러닝 기술을 이용해 기존의 기술을 한 단계 발전시킨 솔루션이다.
광학문자인식(OCR) 솔루션은 문서내 글자를 인식할 수 있지만 구조화된 정보를 얻을 수 없어 체계적인 정보 구축을 위해서는 추가적인 처리 방법이 요구된다. 이때 사용되는 것이 인지된 기호를 우리가 평소 사용하는 언어로 바꿔주는 자연어처리(NLP) 기술이다.
그러나 기존의 기술은 문서내 줄 바뀜이나, 배경의 음영, 점, 문서 오염, 수기 작성 문자 등을 잘못 이해하는 경우가 많아 추출 후 정제 과정에서의 수작업 의존도가 매우 높았다. 신규 비정형 문서나 위치 값이 변동될 때도 매번 추가 개발이 필요했다.
이러한 단점을 보완하기 위해 포티투마루는 인공지능 기술을 이용해 다양한 서식을 자동으로 인식하고 수정 및 교정, 분류할 수 있으며, 딥러닝 기술로 핵심 데이터 추출률과 문서 양식을 지속적으로 확대할 수 있는 AI OCR-NLP 솔루션 ‘텍스탠딩’을 내놓았다.
포티투마루의 텍스탠딩은 문서에서 필요한 항목명과 값을 자동으로 추출한 후 구조화하여 데이터베이스(DB)에 저장한다. 저장된 DB는 업무에 활용 가능한 형태로 사용자에게 제공된다. 이때 정보는 사용자가 확인할 수 있는 UI를 통해 신뢰도 및 오류를 지속적으로 관리할 수 있다. 신규 문서의 경우 별도의 프로그래밍 없이 사용자가 손쉽게 학습데이터를 구축하고 활용할 수 있다.
포티투마루는 지난해 H은행 등의 자금세탁 방지 모니터링 프로그램에 자사의 AI OCR-NLP 솔루션을 구축했다. M제약사와 C공제조합 등에서도 해당 솔루션으로 외주검사 성적서 및 계약서 등의 검토와 분류, 핵심 데이터 추출, 키밸류 구조화, 오타교정 등의 작업을 자동으로 수행 중이다. 진단서, 영수증, 거래명세서를 비롯한 각종 금융 서식 및 법률 문서 등에도 적용이 가능하다.
포티투마루 김동환 대표는 “비정형 자료의 데이터 추출시 평균 93% 이상의 정확도로 자동 구조화가 가능하고, 학습 기반의 딥러닝 기술로 인식률과 정확도, 대상 문서 범위 역시 지속적으로 확대될 예정”이라고 말했다.
김수미 기자 ([email protected])
Source: 넥스트데일리[KR]