큐빅, 합성데이터 검증 솔루션 'SynData v1.0' GS 1등급 획득

  • 카카오공유 
  • 메타공유 
  • X공유 
  • 네이버밴드 공유 
  • 프린트
  • 메일
  • 스크랩
  • 목록
  • 글자크기
  • 크게
  • 작게
큐빅, 합성데이터 검증 솔루션 SynData v1.0 GS 1등급 인증 획득

▲사진=큐빅


데이터 활용 인프라 기업 큐빅(CUBIG)은 자사의 합성데이터 품질·안전성 검증 프로그램 'SynData v1.0'이 GS(Good Software) 1등급 인증을 획득했다고 29일 밝혔다. 

이번 인증은 합성데이터를 만들어 쓰는 단계를 넘어 실제 업무·AI 학습에 투입 가능한 수준의 '검증된 AI-Ready 데이터'로 만들기 위한 품질 체계를 공식적으로 인정받았다는 점에서 의미가 크다.

최근 공공·금융·의료 등 민감정보 기반 데이터 활용이 확대되면서 합성데이터는 개인정보 노출 위험을 낮추는 대안으로 빠르게 확산되고 있다. 다만 '합성데이터가 실제로 유용한가(Utility)'와 '재식별 위험이 충분히 통제됐는가(Privacy)'를 객관적으로 설명·증명하지 못하면 대외 개방·내부 AI 학습·외부 협업 단계에서 활용이 멈추는 경우가 많다. SynData는 바로 이 검증 공백을 메우는 데 초점을 맞춘다.

SynData는 사용자가 생성한 합성데이터를 자동 분석하고, 원본 데이터와의 분포 유사도·통계적 일관성, 개인정보 보호 수준 등 핵심 지표를 기반으로 합성데이터의 품질과 안전성을 평가·검증하는 소프트웨어다. 단순 요약 점수에 그치지 않고, 임계값 기반 해석(활용 가능 여부 판단을 돕는 기준선)과 클래스 단위 세부 분석을 제공해 특정 구간·클래스에서 발생할 수 있는 품질 저하나 프라이버시 리스크를 조기에 식별할 수 있도록 설계됐다.

운영 방식도 공공·규제 산업의 요구에 맞췄다. SynData는 외부 서버 없이 단일 클라이언트 프로그램만으로 동작하는 독립형(stand-alone) 구조로, 원본·합성 데이터를 업로드한 뒤 라벨 컬럼을 선택해 검증을 실행한다. 업로드된 컬럼을 범주형·연속형으로 자동 분류하고 필터·검색 기능을 제공해 다수의 컬럼이 포함된 데이터에서도 검증 대상 컬럼을 손쉽게 선택할 수 있도록 지원한다. 검증 완료 후에는 결과 파일을 생성하고, 이를 기반으로 검증 리포트를 생성·전달하는 프로세스를 지원한다.

큐빅 측은 “SynData가 'AI-Ready' 관점의 데이터 거버넌스에도 직접 기여한다”고 설명했다.

AI-Ready 데이터는 단순히 '데이터가 존재한다'가 아니라 품질·일관성·활용 가능성·리스크 통제(프라이버시·규제)를 갖춰 실제 AI에 투입 가능한 상태를 뜻한다. SynData는 합성데이터의 유용성과 안전성을 동시에 수치화·설명이 가능하게 만들어 데이터 개방·내부 AI 학습·외부 협업 단계에서 의사결정이 멈추지 않도록 돕는 '검증 레이어' 역할을 한다.

GS 인증은 소프트웨어 품질을 검증하는 국가 제도로, 공공 조달 및 도입 검토 과정에서 신뢰 지표로 활용된다. 큐빅은 이번 GS 1등급 인증을 계기로 공공·금융·의료·제조 등 민감데이터 산업에서 ‘합성데이터 생성→검증→활용’의 표준 흐름을 확산하고, 합성데이터 기반 AI-Ready 데이터 구축을 위한 현장 적용을 확대해 나갈 계획이다.

배호 큐빅 대표는 “합성데이터는 만드는 것보다 쓸 수 있게 만드는 것이 더 어렵다”며 “이번 GS 인증을 통해 검증 체계의 신뢰성을 공식적으로 인정받은 만큼 국내 합성데이터 시장에서 '생성'을 넘어 '활용'까지 이어지는 흐름을 본격적으로 열어가겠다"고 전했다.

성수아 기자 sa358@datanews.co.kr