정부, AI 학습용 데이터 보유 현황 첫 전수조사

IT/과학

뉴스1,

2026년 4월 10일, 오후 12:00

과학기술정보통신부 /뉴스1

정부가 전 부처를 대상으로 인공지능(AI) 학습용 데이터 보유 현황을 전수조사한다. 이를 통해 각 부처 및 공공기관이 보유한 데이터 현황을 파악하고, AI 학습 활용 가능성을 살피겠다는 방침이다.

과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 10일부터 'AI 학습용 데이터 현황 조사'(AI 학습용 데이터 센서스)를 실시한다.

현재 공공기관이 보유한 AI 학습용 데이터는 기관별로 분산·관리돼 보유 현황과 활용 가능성을 파악하기 어렵다는 지적을 받아 왔다. AI 기업들이 학습 데이터로 활용하는 데도 한계가 있는 상황이다.

이에 과기정통부는 'AI기본법'에 근거해 전 부처 대상 첫 전수조사를 실시하게 됐다. 이번 조사를 통해 AI 학습 활용 가능성이 높은 데이터 100종을 발굴해 'AI 학습용 데이터 통합제공체계'를 제공할 계획이다.

선정된 100종의 데이터는 품질 보완, 비식별조치 등 AI 학습용 데이터 가공 관련 기술적·재정적 지원을 거쳐 제공될 예정이다. 온라인 공개가 어려운 경우 '데이터 안심구역'을 통해 제공한다.

과기정통부는 AI기본법에 따라 현행 'AI허브'를 'AI 학습용 데이터 통합제공체계'로 고도화 중이다. AI 학습용 데이터 거래 활성화 지원 체계를 마련할 계획이다.

김경만 인공지능정책실장은 "AI 성능과 품질의 핵심은 활용 가능한 풍부한 데이터에 있다"며 "이번 조사를 통해 공공부문이 보유하고 있는 AI 학습용데이터 자산을 체계적으로 발굴하고 이를 편리하게 활용할 수 있는 AI 학습용데이터 통합제공 기반을 지속적으로 발전시켜 나가겠다"고 말했다.

Ktiger@news1.kr

추천 뉴스