LG, 초거대 멀티모달 ‘엑사원2.0’ 공개…“상위 1% 전문가 AI 개발”

전문문헌 4500만건, 이미지 3억5000만장 학습…이중 언어, 양방향 멀티모달 모두 상용화

  • 카카오공유 
  • 메타공유 
  • X공유 
  • 네이버밴드 공유 
  • 프린트
  • 메일
  • 스크랩
  • 목록
  • 글자크기
  • 크게
  • 작게

▲배경훈 LG AI연구원장이 19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 발표하고 있다. / 사진=LG


LG가 2021년 12월 ‘엑사원’을 공개한 지 1년 반 만에 초거대 멀티모달 인공지능(AI) '엑사원 2.0'을 선보였다. 

LG AI연구원은 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 'LG AI 토크콘서트 2023'을 열었다.

LG AI연구원은 LG계열사와 국내외 파트너사들이 엑사원으로 각 분야에 특화된 전문가 AI를 사용할 수 있도록 연구개발을 진행했다. 이번에 공개한 엑사원 2.0은 파트너십을 통해 확보한 특허, 논문 등 약 4500만 건의 전문 문헌과 3억5000만 장의 이미지를 학습했다.

엑사원 2.0은 한국어와 영어를 동시에 이해하고 답변할 수 있는 이중 언어 모델로 개발했고, 학습 데이터 양도 기존 모델보다 4배 이상 늘려 성능을 높였다.

이는 기존 모델과 동일한 성능을 유지하면서도 추론 처리시간은 25% 단축하고, 메모리 사용량은 70% 줄여 비용을 78% 절감했다.

언어와 이미지 간의 양방향 생성이 가능한 멀티모달 모델은 이미지 생성 품질을 높이기 위해 기존 모델에 비해 메모리 사용량을 2배 늘렸지만, 추론 처리시간을 83% 단축해 66%의 비용 절감을 달성했다.

엑사원 2.0은 원하는 용도나 예산에 맞게 모델의 크기부터 종류(언어, 비전, 멀티모달), 사용 언어까지 맞춤형으로 설계할 수 있다. 또 고객 데이터 보안을 위해 학습과정을 미세 조정하는 파인 튜닝(Fine-Tuning)과 AI 인프라를 고객이 보유한 서버에 직접 설치하는 구축형(On-Premise) 및 프라이빗 클라우드(Private Cloud) 방식도 지원한다.

LG AI연구원은 대표적인 엑사원 사례로 LG전자의 AI컨택센터(AICC)를 소개했다. AICC는 고객 상담내용을 실시간으로 분석·요약하고 상담내용을 자동으로 정리했다.

LG는 엑사원 3대 플랫폼인 유니버스(Universe), 디스커버리(Discovery), 아틀리에(Atelier)를 차례로 공개했다.

'엑사원 유니버스'는 전문가들이 믿고 정보를 탐색해 인사이트를 찾을 수 있는 플랫폼을 만들기 위해 전문성과 신뢰성을 높이는 데 주력했다. 또 사전에 학습한 데이터는 물론 각 도메인별 최신 전문 데이터까지 포함해 근거를 찾아내 추론한 답변을 생성한다.

LG 측은 자사 연구원 및 학계 연구원 대상으로 엑사원 유니버스 전체 플랫폼 평가를 진행한 결과, 전문성·신뢰성에서 다른 기업들보다 높은 점수를 받았다고 설명했다.

엑사원 유니버스는 오는 31일부터 LG그룹 내  AI 연구자, 협력 중인 대학을 대상으로 시작하며, 9월에는 LG에서 AI를 연구하거나 공부하는 임직원 대상으로 정식 서비스를 진행하고 글로벌 출시를 진행할 계획이다. 화학, 바이오, 제약, 의료, 금융, 특허 등 각 전문 도메인별 특화 서비스도 준비하고 있으며, 기업 내부에서 임직원이 쉽게 필요한 정보에 대한 답을 얻을 수 있는 조력자 역할이 기대된다.

이문태 LG AI연구원 어드밴스드 ML랩장은 "기존 생성형 AI는 데이터를 기반으로 답변을 만들어 환각 문제를 발생시킬 수 있다"며 "엑사원 유니버스는 데이터베이스 내 문서를 파악하고, 선택 문서의 디테일을 보고 근거를 추론해 논리적 사고를 통해 답변을 도출해 환각 문제를 줄이고 있다"고 말했다.

'엑사원 디스커버리'는 세상에 없던 새로운 지식을 발견하는 플랫폼으로, 먼저 신소재·신물질·신약 관련 탐색에 적용하고 있다.

엑사원 디스커버리는 논문과 특허 등 전문 문헌의 텍스트뿐만 아니라 분자 구조, 수식, 차트, 테이블, 이미지 등 비텍스트 정보까지 AI가 읽고 학습할 수 있는 형태로 데이터베이스화 하는 심층 문서 이해(DDU) 기술을 적용했다. 또 1만 회가 넘었던 합성 시행착오를 수십회로 줄이고, 연구개발 소요 시간은 40개월에서 5개월로 단축시킬 수 있을 것으로 예상된다.

엑사원 디스커버리는 올해 4분기에 그룹 내 화학 및 바이오 분야 연구진을 대상으로 서비스를 제공할 예정이다.

'엑사원 아틀리에'는 저작권이 확보된 이미지-텍스트가 짝을 이룬 페어 데이터 3억5000만 장을 학습했다. 이미지뿐 아니라 이미지를 기반으로 한 문구도 만들 수 있다. 이는 캡셔닝 AI 기능을 통해 처음 보는 이미지까지 자연어로 설명할 수 있으며, 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등의 메타 데이터도 생성한다.

이화영 LG AI연구원 AI비즈 유닛장은 "엑사원2.0은 플랫폼 사업화가 진행된 상황"이라며 "해외 크리에이티브 플랫폼인 셔터스톡, 세계적인 국제학술출판사인 엘스비어와 업무협약을 맺었으며, 대부분 기업 간 거래 모델이지만 디스커버리와 아틀리에는 일반 소비자에게도 문을 열 계획"이라고 말했다.

이 유닛장은 또 비즈니스 모델에 대해 "산업분야나 파트너에 따라 원하는 부분이 다르다"며 "파트너사 연구원이 서비스 형태로 핵심 기반기술(API)를 호출할 때마다 비용을 청구할 수도 있고 데이터 보안이 중요해 구축형으로 해달라는 곳도 있다"고 덧붙였다.

배경훈 LG AI연구원장은 “LG는 국내에서 유일하게 이중 언어 모델과 양방향 멀티모달 모델을 모두 상용화한 기업이며, 세상의 지식을 이해하고 발견하는 상위 1%의 전문가 AI를 개발하고 있다”며 “다른 생성형 AI들과 차별화된 고객 가치를 창출하는 글로벌 경쟁력을 갖춘 AI 컴퍼니로 발전해 나갈 것”이라고 말했다.

김민지 기자 honest@datanews.co.kr