흩어져 있는 시계열 데이터를 효과적으로 활용할 수 있게 하는 기술이 오픈소스로 공개된다.
인공지능(AI) 및 빅데이터 전문기업 위세아이텍(대표 김다산·이제동)은 흩어져 있는 시계열 데이터를 통합해 산업의 AI 기술 접목을 가속하기 위한 ‘파편화된 데이터의 적극 활용을 위한 시계열 기반 통합 플랫폼 기술 개발’ 연구과제를 성공적으로 마무리하고 있으며, 연구 기술 일부를 오픈소스로 제공한다고 17일 밝혔다.
이 연구과제는 서로 다른 구조, 양과 질, 다양한 포맷, 접근 권한, 수집 위치 등의 개별차로 파편화된 데이터를 목적에 맞게 통합하고 활용할 수 있도록 시계열 통합 기반 애널리틱스 플랫폼 기술을 개발하는 것이 목표로 진행돼 왔다.
연구과제의 주무 부처는 과학기술정보통신부, 관리기관은 정보통신기획평가원, 주관 연구개발기관은 한국전자기술연구원이다. 사업기간은 2021년 4월 1일부터 2023년 12월 31일까지 총 3차 연도에 걸쳐 진행됐으며, 올해가 수행 마지막 해다.
위세아이텍은 파편화돼 있는 시계열 데이터를 비전문가도 어려움 없이 활용할 수 있도록 하는 ‘AutoML(자동화 머신러닝)’ 기술 개발에 주력해 왔다. 불완전한 시계열 데이터에 특화된 전처리 기술과 다양한 산업 도메인의 요구사항 반영을 위한 시계열 메타데이터 카탈로그 체계를 구축하고 이를 기반으로 데이터 분석과 전처리, 모델 학습과 구축까지의 전 과정을 반자동화했다.
이 기술의 프로토타입(prototype, 핵심 기능이 담긴 기본 모델)은 오픈소스 코드 공유 플랫폼인 깃허브(GitHub)를 통해 공개된다.
김지혁 위세아이텍 최고기술책임자(CTO)는 “약 3년 간의 연구를 통해 집약된 주요 기술이 오픈소스 소프트웨어로 무상 공개되면 AI의 도입을 가속화하고 실용화를 앞당길 수 있을 것으로 기대한다”고 말했다.
김 CTO는 또 “앞으로도 위세아이텍은 막대한 양이 저장되지만 사용되지 못하고 사장되고 있는 다크 데이터의 활성화와 기관 및 기업의 데이터 활용역량 강화를 위한 노력에 앞장설 것”이라고 강조했다.
강동식 기자 lavita@datanews.co.kr