뉴스펍

[이데일리 윤정훈 기자] “엔비디아는 인공지능(AI)이라는 금광에서 금을 캐는 삽(GPU)을 팔아 돈을 벌고, 미국 빅테크들은 이미 금을 캐냈습니다. 그런데 한국 기업들은 아직 규제 때문에 삽질조차 하지 못하고 있습니다.”

26일 오전 국회의원회관에서 열린 ‘AI 대전환의 동력, 데이터 활용 입법 개선 과제’ 토론회에서 김민호 성균관대 법학전문대학원 교수는 한국 AI 산업의 현실을 한 마디로 요약했다. 이번 토론회는 국회 스타트업 연구모임 ‘유니콘팜’과 스타트업얼라이언스가 공동 주최했다.

현장에 모인 산·학·관 전문가들은 한국이 AI 기술 주권을 잃지 않으려면 ‘학습용 데이터’에 대한 전향적인 면책 규정과 개인정보 규제 완화가 시급하다고 입을 모았다.

26일 오전 국회의원회관에서 열린 ‘AI 대전환의 동력, 데이터 활용 입법 개선 과제’ 토론회에 앞서 패널들이 기념촬영을 하고 있다(사진=윤정훈 기자)

◇AI 스타트업 “공개된 웹 데이터도 못 쓴다”

가장 큰 문제는 AI 모델 성능을 좌우하는 대규모 학습 데이터 확보가 원천적으로 봉쇄돼 있다는 점이다. 현행 개인정보보호법은 정보 주체의 ‘동의’를 절대적인 원칙으로 삼고 있어, 수십억 건의 웹 데이터를 긁어와야 하는 대형언어모델(LLM) 개발사들에는 사실상 현실성이 떨어진다는 지적이다.

LLM 개발 스타트업 트릴리온랩스의 신재민 대표는 “웹상에 공개된 데이터 위주로 100테라바이트(TB), 책으로 치면 10억 권 분량의 텍스트 데이터를 확보했지만, 학습하면서 개인 정보를 AI를 활용해 필터링하다 보면 데이터 절반이 날아간다”며 “데이터의 맥락이 끊겨 AI 모델의 성능이 급격히 저하되는 치명적인 문제가 발생할지 확인이 안 되고, 필터링 작업 자체도 비용이 많이 든다”고 토로했다.

이어 신 대표는 “동의 기반으로 개인정보보호법을 적용한다고 하면 이를 위해 수십억원에서 수백억원까지 비용이 든다”며 “좀더 현실적으로 가능한 방식을 적용해야 하지 않을까 생각한다”고 덧붙였다.

B2B(기업 간 거래) 영역에서도 상황은 마찬가지다. 채용 관리 솔루션 ‘그리팅’을 운영하는 두들린의 정일권 CPO(정보보호최고책임자)는 “기업 고객을 대신해 다량의 이력서를 처리하지만, 이를 AI 면접관 학습용으로 쓰려 해도 지원자 전원에게 별도의 ‘AI 학습 동의’를 받아야 해 사실상 불가능하다”고 말했다.

이어 정 CPO는 “결국 국내 데이터를 쓰지 못해 해외 AI 솔루션 도입을 검토해야 하는 아이러니한 상황”이라며 “해외 AI를 쓰려 해도 국외 이전 이슈에 걸린다. 결국 막대한 비용을 들여 데이터를 익명화하거나 사업을 포기해야 하는 상황”이라고 호소했다.

트릴리온랩스의 신재민(우측) 대표와 두들린 정일권(좌측) CPO가 토론회에 참석했다(사진=윤정훈 기자)

◇ 韓만 ‘동의’ 족쇄… 日·EU는 ‘학습 면책’

법률 전문가들은 한국의 법 제도가 글로벌 스탠다드에서 동떨어져 있다고 지적했다. 일본과 유럽(EU) 등 주요국은 이미 AI 학습을 위한 데이터 이용을 저작권 침해로 보지 않는 ‘TDM(텍스트·데이터 마이닝) 면책 규정’을 도입해 산업을 육성하고 있다. 또 EU는 저작권자가 자신의 저작물이 AI 학습에 사용되는 것을 원하지 않을 때에만 명시적으로 거부할 수 있는 ‘옵트아웃’ 제도를 시행하고 있다.

발제를 맡은 김앤장 법률사무소 방성현 변호사는 “일본은 전 세계에서 가장 광범위하게 영리 목적의 AI 학습 데이터 이용을 허용하고 있으며, EU 역시 적법하게 접근한 데이터에 대해서는 TDM을 허용하는 명문 규정을 두고 있다”고 설명했다.

방 변호사는 “한국은 저작권법상 ‘공정 이용’ 조항이 모호해 기업들이 소송 리스크를 떠안아야 하고, 개인정보보호법상 데이터 활용의 근거가 되는 ‘정당한 이익’ 조항도 요건이 지나치게 엄격하다”고 꼬집었다.

특히 현행 개인정보보호법 제15조는 사업자의 정당한 이익이 정보 주체의 권리보다 ‘명백하게’ 우선할 때만 동의 없는 이용을 허용한다. 방 변호사는 “이 ‘명백하게’라는 단어 하나 때문에 기업들은 사후 처벌이 두려워 데이터를 활용하지 못한다”며 “EU GDPR(일반개인정보보호법)처럼 합리적인 균형점을 찾아야 한다”고 제언했다.

◇ “AI 학습(Input)과 출력(Output) 구분해야”… 규제 패러다임 전환 시급

학계에서는 AI의 ‘학습’ 단계와 서비스 ‘출력’ 단계를 구분해 규제해야 한다는 주장이 제기됐다.

김현경 서울과기대 교수는 “개인정보보호법은 본래 마케팅 등 개인을 식별해 영향을 미치는 행위를 규제하기 위해 만들어진 것”이라며 “AI가 데이터를 학습하는 ‘인풋(Input)’ 단계는 개인을 식별하려는 목적이 아니므로 개인정보 규제를 배제하거나 대폭 완화해야 한다”고 주장했다.

이날 토론회에 참석한 정부와 국회 관계자들도 제도 개선의 필요성에는 일정부분 공감했다.

양청삼 개인정보보호위원회 개인정보정책국장은 “산업계의 어려움을 잘 알고 있으며, ‘정당한 이익’ 조항에서 논란이 되는 ‘명백하게’라는 요건을 삭제하거나 완화하는 방향의 법 개정을 추진하겠다”고 밝혔다. 또한 “공개된 정보의 AI 학습 활용에 대한 가이드라인을 구체화해 기업의 불확실성을 해소하겠다”고 덧붙였다.

김형진 국회입법조사처 조사관은 “AI 특례법 같은 특별법 방식보다는, 행정부 가이드라인을 통해 유연하게 대응하는 것이 바람직하다”며 “개인정보 법률은 추상적인 형태의 법률 규정이 유효하다”고 했다.

토론회를 주최한 김한규 더불어민주당 의원은 “글로벌 컨센서스 정도만 유지한다면 EU와 달리 한국 현실에 맞게 법안을 통과시킬 준비가 돼 있다”며 “다만 추상적인 개보위법 법안이 사업자 입장에서 예측 간능성이 떨어지기 때문에 정당한 이익에 대해 개보위가 구체적인 가이드라인을 만들 필요가 있다”고 말했다.

배현진 국민의힘 의원도 “국민의 높은 개인정보 보호 인식과 산업 발전 사이의 간극을 좁히는 입법이 필요하다”고 했고, 박민규 더불어민주당 의원은 “여야가 합심해 내년 2월에 상임위를 통과하고 지방선거전에 통과해야 내년 하반기에나 제대로 작동할 것“이라며 AI 특례법의 조속한 처리를 촉구했다.

현재 국회에는 민병덕 민주당 의원과 고동진 국민의힘 의원 등이 AI 특례법 등을 발의해 둔 상태다. AI 개발 목적에 한해 원본 개인정보 활용 허용 및 처리를 기존보다 규제를 완화해두는 내용을 골자로 한다.

“AI 패권 경쟁 ‘골든타임’ 놓친다…‘데이터 규제’ 완화해야”

IT/과학

추천 뉴스