이미지=인터엑스
이 서비스는 문서 내 텍스트뿐만 아니라 표, 수식, 차트, 캡션, 섹션 구조를 최대한 보존한 상태로 JSON, HTML, 마크다운(Markdown) 등 다양한 형태로 변환해 준다.
특히 제조 및 엔지니어링 문서에서 자주 발생하는 ‘멀티 페이지 표(Multi-page Table)’를 의미적으로 하나의 표로 자동 병합하는 기능을 탑재했다. 이를 통해 페이지 경계에 걸쳐 분리된 데이터를 AI 모델이 정확하게 이해하고 활용할 수 있도록 했다.
인터엑스는 기업과 기관이 보유한 PDF, HWP, 스캔 이미지 등 비정형 문서 데이터를 시스템이 이해 가능한 구조화 데이터로 변환하는 데 드는 시간과 비용을 줄이는 데 초점을 맞췄다. 주요 타깃 고객은 제조·공공·연구기관을 대상으로 시스템을 구축하는 시스템통합(SI) 기업, AI 스타트업, 대기업 내부 데이터 팀 등이다.
도큐먼트.AI API는 인터엑스 홈페이지와 AWS 마켓플레이스를 통해 이용할 수 있으며, 가입 즉시 100 크레딧을 무료로 제공한다.









