인공지능(AI) 전문기업 와이즈넛(대표 강용성)은 2021년부터 과학기술정보통신부 주관 제1차 정보통신·방송 기술개발사업 중 정보통신기획평가원(IITP)이 추진하는 ‘데이터 규모 확장과 정확성 향상을 위한 다크데이터 분석기술 개발 과제’ 주관기관으로서 3차년도 개발을 완료했다고 4일 밝혔다.
IDC에 따르면, 생산·저장되는 데이터의 약 90% 이상이 미활용되는 다크데이터(Dark Data)다.
2024년까지 총 4차년도로 진행되는 본 연구는 그동안 활용이 어려웠던 다크데이터를 유용한 데이터로 전환하기 위한 목적으로, 6종(영상, 이미지, 오디오, 텍스트, IoT, 시스템 로그)의 다크데이터를 수집 및 분석한 뒤 유의미한 지식 데이터세트를 발굴하고, 범용 지식 또는 각 도메인에 특화된 양질의 지식 자산으로 활용하는 것을 목표로 한다.
앞선 1,2차년도에서는 다크데이터로부터 의미 있는 정보를 추출하기 위한 다양한 알고리즘과 모델을 개발했고, 수집한 다크데이터를 실제 데이터 형식에 따라 자동 분류할 수 있는 기술을 구축해 각종 비정형 데이터로부터 정형 데이터를 추출할 수 있는 기술적 기반을 마련했다.
특히 이번 3차년도 과제에서는 다크데이터로부터 가치있는 정보를 추출하는 기존의 연구내용을 고도화하고, 이를 바탕으로 실제 다양한 산업분야에서 활용할 수 있는 방안을 탐색하기 위해 제조 산업 및 영상 콘텐츠 분야에서의 실증 방안 연구에 주력했다.
이번 다크데이터 연구는 통계적 분석 및 데이터간 면밀한 관계 분석을 통해 데이터의 품질과 신뢰성을 보장할 수 있으며, 무엇보다 기업이 안정적으로 활용할 수 있는 데이터를 추출하고, 이를 시각화한 기술 개발로 데이터 분석에 대한 직관적 이해를 돕는다는 특징이 있다.
강용성 와이즈넛 대표는 “이번 과제 내 실증과 같이 다크데이터를 가공해 각 도메인에서 필요로 하는 유의미한 비즈니스 데이터로 활용한다면, 각종 인공지능 서비스의 정확도는 높아질 것이고 사회 문제 및 제도 개선에 기여하는 등의 놀라운 파급력이 기대된다”며 “와이즈넛의 빅데이터 분석 및 활용을 위한 기술적 기반을 토대로, 실제 산업에 필요한 양질의 지식 데이터 양산에 기여함으로써 미래 데이터 및 인공지능 기술 혁신을 선도해 나갈 것”이라고 말했다.
김민지 기자 honest@datanews.co.kr
[ⓒ데이터저널리즘의 중심 데이터뉴스 - 무단전재 & 재배포 금지]