파수, 비정형 데이터 내 개인정보 탐지·보호 AI 솔루션 출시

  • 카카오공유 
  • 메타공유 
  • X공유 
  • 네이버밴드 공유 
  • 프린트
  • 메일
  • 스크랩
  • 목록
  • 글자크기
  • 크게
  • 작게

파수(대표 조규곤)는 최신 인공지능(AI) 기술을 기반으로 비정형 데이터 내 개인정보를 검출 및 마스킹할 수 있는 신규 솔루션 ‘파수 AI 레이더(파수 AIR)’를 21일 공개했다. 

파수의 개인정보관리 노하우가 집대성된 파수 AIR는 텍스트, 이미지, 영상 등에 포함된 다양한 개인정보를 AI 기반으로 탐지해 최근 사회적 문제로 떠오른 개인정보 유출을 방지하고 관련 컴플라이언스 준수하도록 돕는다. 파수는 AI 기반의 자연어처리(NLP)와 광학문자인식(OCR) 기술을 사용한 파수 AIR를 통해 문맥을 파악해 개인정보를 검출한다.

파수 AIR는 높은 정확도의 트랜스포머 기술 기반 언어 모델을 사용했으며, 특히 개인정보보호 분야를 이끌어 온 파수의 노하우가 접목돼 검출 정확성이 뛰어나다. 파수는 국내 최초의 개인정보 비식별화 솔루션 ‘애널리틱디아이디(ADID)’와 다양한 산업에서 활용되는 데이터 식별·분류 솔루션 ‘파수 데이터 레이더(FDR)’ 등을 통해 개인정보관리 인사이트를 축적해 왔다. 

이를 바탕으로 개인정보에 특화된 트레이닝 방법과 데이터셋을 파수 AIR에 적용, 개인정보 벤치마크 데이터셋에서 자연어 처리 기준 93% 이상의 검출 정확성을 기록했다. 

파수 AIR은 비정형 데이터 내의 이름, 주민등록번호, 키, 몸무게, 상호, 계좌 및 카드번호, 주소 등 15가지 개인정보 유형을 검출해 마스킹할 수 있다. 주소가 포함된 데이터의 경우 행정구역 체계를 광역시도, 시군구, 동읍면리, 상세주소 등으로 단계를 구분해 탐지하며, 키나 몸무게를 기타 길이나 무게와 구분하는 등 까다로운 문장 속에서도 높은 인지 정확도를 보여준다.

또 파수 AIR은 다양한 형태의 API를 제공해 편리하며, 마스킹 결과에 대한 사용자의 피드백도 반영할 수 있다. 데이터 특성에 따라 AI 및 패턴 매칭 기법도 유연하게 적용할 수 있다.

강동식 기자 lavita@datanews.co.kr