인공지능(AI) 기술 발전과 함께 데이터의 중요성이 날로 커지고 있는 가운데, 공공저작물이 AI 학습용 데이터로 개방되며 국내 AI 경쟁력 강화에 기여할 전망이다. 이는 거대언어모델(LLM)과 같은 파운데이션 모델 개발에 있어 고품질 데이터를 확보하는 것이 핵심 과제로 떠오른 산업 트렌드와 맥을 같이 한다. 과학기술정보통신부는 지난 11일 개최된 제42차 ICT 규제샌드박스 신기술·서비스 심의위원회에서 ‘AI 파운데이션 모델 개발을 위한 공공누리 공공저작물의 학습용 데이터 구축 및 제공 서비스’ 등 총 8건의 규제 특례를 지정했다고 밝혔다.
이번 심의위원회에서 주목할 만한 실천 사례로 선정된 ‘AI 파운데이션 모델 개발을 위한 공공누리 공공저작물의 학습용 데이터 구축 및 제공 서비스’는 증가하는 AI 수요에 대응하기 위해 공공누리가 부착된 공공저작물 1180만 건을 AI 학습에 활용할 수 있도록 실증을 위한 규제 특례를 부여받았다. 과학기술정보통신부와 문화체육관광부는 AI 개발에 필수적인 데이터 활용을 지원하고자 공공누리 유형 중 출처 표시와 변경 금지 의무(1·3유형)에 대해 AI 학습 활용 시 출처 표시를 간소화하고, AI 학습을 위한 공공저작물 가공을 허용하는 조치를 취했다. 이와 함께 예기치 못한 공동 저작권자의 저작권 침해를 최소화하기 위해 사전 안내 및 저작권 관련 책임 보험 가입 등의 부가조건 하에 실증이 진행될 예정이다. 한국지능정보화사회진흥원은 해당 공공저작물을 AI 학습용 데이터로 가공하여 ‘독자 AI 파운데이션 모델’ 프로젝트에 선정된 5개 정예팀에 제공함으로써, AI 파운데이션 모델 학습에 필요한 고품질 데이터 활용 기반을 마련하게 된다.
이번 실증특례 지정은 국내 AI 경쟁력 강화와 더불어 국민이 체감할 수 있는 AI 서비스 확산에 크게 기여할 것으로 기대된다. 특히, ICT 규제샌드박스를 단순한 규제 유예 수단을 넘어 민간의 혁신 서비스를 제도적으로 뒷받침하는 민관 협력 전략이자 AI 친화적 시스템으로의 재편을 위한 정책적 실험장으로 활용하겠다는 배경훈 과학기술정보통신부 장관의 의지는 이러한 긍정적 전망에 힘을 싣는다. 이는 동종 업계 다른 기업들에게도 공공 데이터 활용의 새로운 가능성을 제시하며 AI 생태계 전반의 혁신을 촉진하는 선도적인 사례가 될 것으로 평가된다. 더불어, AI 기반 숏폼 콘텐츠를 통한 상품 홍보 서비스, 공인전자문서중계자 자체 생산 문서 유통 서비스, 반려동물 병원 전용 의약품 구매·관리 서비스, 실시간 통화 기반 보이스피싱 탐지 서비스, 전자적 방식에 의한 전자서명 및 동의서 징구 서비스, 중고차 성능·상태 점검 기록부 모바일 전자고지 등 다양한 분야에서 규제 특례가 지정됨에 따라 관련 산업의 성장과 국민 편익 증진이 더욱 가속화될 전망이다.

