와이즈넛, 이종 데이터 증식기술 개발…데이터간 경계 허문다

증식 데이터 상호 연관성 정보 바탕으로 새로운 데이터의 높은 정확도 및 품질 향상 기대


인공지능(AI) 전문기업 와이즈넛(대표 강용성)은 과학기술정보통신부 주관 소프트웨어컴퓨팅산업 원천기술 개발사업 중 ‘이종 정보 활용 및 데이터 융합을 통한 데이터 증식기술 개발’ 과제 주관기관으로서 3년간의 개발을 완료했다고 밝혔다.

이번 과제는 확보된 원시 데이터를 분류해 형상(이미지, 텍스트, 오디오, 비디오 등)이 다른 이종 데이터를 추출하고, 이들의 메타(Meta, 의미) 정보를 파악해 연관성 높은 다른 데이터를 증식하는 ‘종적 증식’ 기술과 다른 서비스 도메인에서 의미적 연관성이 높은 데이터를 검색·융합해 다종의 데이터를 확장하는 ‘횡적 증식’ 기술 개발 상용화를 목표로 진행됐다.

이번 과제의 핵심기술 중 하나인 이종 정보 활용기술은 기존에 확보된 이미지로부터 텍스트 정보를 추출하거나 비디오에서 음성을 추출해 본래의 이미지 및 비디오뿐 아니라 다른 종류의 정보를 활용해 연관 데이터를 확장해 분석하는 것이다.

두 번째 핵심 기술인 데이터 융합기술은 하나의 데이터에 대해 여러 서비스 분야에 대한 복합적 분석이 필요한 경우 기존 데이터셋과는 다른 서비스 도메인의 데이터를 검색 및 융합해 분석을 보강하는 것이다. 

이러한 두 기술을 골자로 한 이번 연구는 기존 단순 데이터 증식과는 달리 증식된 데이터의 상호 연관성 정보를 바탕으로 ▲증식 데이터의 정합도 측정 ▲유효성 검증 ▲데이터 시각화 도구 ▲데이터간 확장모델 관리 ▲원시 데이터에서 추출된 메타데이터의 카테고리 분류기술 등을 복합적으로 적용해 증식 데이터의 품질을 향상했다는 점에서 업계의 주목을 받아왔다.

와이즈넛은 3년간의 연구를 통해 각 비즈니스 분석 목적에 맞는 양질의 빅데이터를 손쉽게 확보해 다양한 분야의 AI 및 빅데이터 분석 니즈를 충족하고, 높은 분석 정확도로 신뢰도 높은 데이터를 기대할 수 있게 됐다.

또 이번 기술을 통해 기존 대비 방대한 양의 AI 데이터를 수집할 수 있어 AI 모델의 성능을 개선함과 동시에 데이터 수집 및 분석에 소요되는 시간과 자원을 줄일 수 있게 됐다. 향후 이 기술은 각종 플랫폼에서 제공하는 데이터와의 연동을 통해 데이터 탐색과정을 자동화하는 AI 플랫폼을 구성해 빅데이터 수집사업에 활용될 예정이다.

강용성 와이즈넛 대표는 “와이즈넛은 이종 데이터 증식기술과 함께 다크데이터 분석기술, 빅데이터 인과 추론기술을 복합적으로 연구 개발하며 차세대 빅데이터 분석 및 AI 기술력에 대한 로드맵을 계속적으로 만들어 나가고 있다”며 “앞으로도 비정형 빅데이터 및 AI 기술분야의 끊임없는 기술 개발을 통해 데이터 기반 디지털 전환을 선도해나갈 수 있도록 노력할 것”이라고 말했다. 

강동식 기자 lavita@datanews.co.kr

[ⓒ데이터저널리즘의 중심 데이터뉴스 - 무단전재 & 재배포 금지]

맨 위로