지란지교데이터, 재현데이터 생성기술로 안전한 데이터 활용 지원

‘가상인물을 이용한 재현데이터 생성방법 및 운영시스템’ 특허 취득…개인정보 비식별화 솔루션 ‘아이디필터’에 적용

▲가상인물을 이용한 재현데이터 생성 방법 및 운영 시스템 특허 기술 개념도 / 사진=지란지교데이터


개인정보 보호 전문기업 지란지교데이터(대표 조원희)는 최근 ‘개인정보 보호를 위한 가상인물을 이용한 재현데이터 생성방법 및 운영시스템’에 대한 특허를 취득했다고 5일 밝혔다. 지란지교데이터는 이 기술을 개인정보 비식별화 솔루션 ‘아이디필터(IDFILTER)’에 적용, 기관 및 기업들의 안전한 데이터 활용을 지원할 계획이다.

재현데이터는 실제 데이터와 통계적 특성이 유사해 실제 데이터를 분석한 결과와 유사한 결과를 얻을 수 있도록 인공적으로 재현 및 생성한 가상의 데이터를 의미한다. 

해외에서는 ‘합성데이터(Synthetic Data)’로 불리고 있다. 재현데이터 생성기술은 실제 데이터의 통계적 특성을 바탕으로 가상의 데이터를 생성해 학습에 활용하기 때문에 개인정보 침해 우려를 최소화할 수 있다. 

또 실제 학습 데이터가 부족한 경우 양질의 데이터를 확보할 수 있는 방안으로도 각광받고 있다. 재현데이터 생성기술은 최근 개인정보보호위원회가 발표한 ‘가명정보 처리 가이드라인’에서 차세대 데이터 활용기술로 소개된 바 있다.

지란지교데이터가 출원한 특허기술은 ‘개인정보 보호를 위한 가상인물을 이용한 재현데이터 생성방법 및 운영시스템’이다. 원본 데이터를 분석해 목표 통계를 도출하고, 미리 등록된 가상인물 중 원본데이터와 목표통계에 상응하는 가상인물을 선택해 재현데이터를 생성하는 과정으로 구성된다. 

추가적으로 가상인물이 필요할 경우 신규 가상인물을 생성 및 등록해 재현데이터를 생성할 수 있다. 재현데이터 생성 운영시스템은 저장부, 출력부, 제어부로 구성된다. 또 제어부는 가상인물관리부, 데이터분석부, 재현데이터생성부로 나눠진다.

지란지교데이터는 이번에 등록된 특허기술을 개인정보 비식별화 솔루션 아이디필터에 적용해 안전한 데이터 활용을 지원할 계획이다. 재현데이터 생성기술이 고도화될수록 개인정보 보호는 물론, 양질의 학습 데이터를 확보할 수 있는 핵심 기술로 제공한다는 전략이다.

조원희 지란지교데이터 대표는 “이번에 등록된 특허기술을 통해 지란지교데이터는 ‘안전한 데이터 활용 환경 구현’이라는 미션에 한발 더 다가섰다”며 “지란지교데이터는 재현데이터 생성기술을 더욱 고도화해 데이터 활용도는 높이고 개인정보 노출 우려는 최소화한 환경을 구현할 수 있도록 지원하겠다”고 말했다.

강동식 기자 lavita@datanews.co.kr

[ⓒ데이터저널리즘의 중심 데이터뉴스 - 무단전재 & 재배포 금지]

맨 위로