코난테크놀로지가 파라미터 131억 개로 자체개발 초거대언어모델(Large Language Model, 이하 코난 LLM) 출시에 속도를 내게 됐다.
인공지능(AI) 소프트웨어 전문기업 코난테크놀로지(대표 김영섬)는 지난 17일 기준 전체 학습 토큰 4920억 개, 한국어 토큰 2840억 개로 학습을 마쳤다고 밝혔다.
코난테크놀로지에 따르면, 13.1B 파운데이션 모델은 파인튜닝을 거쳐 내달 정식 출시되며, 8월 1일 학습을 시작해 10월 중 마무리할 코난 LLM 파운데이션 모델의 파라미터는 400억 개다. 전체 토큰 6000억 개, 한국어 토큰은 4000억 개로 준비 중이다.
코난 LLM은 온프레미스 제공으로 생성형 AI의 보안과 기밀유출 우려를 방지하고, B2B, B2G향 초거대 AI를 표방하는 점이 특징이다.
코난 LLM은 해당 기업이나 기관에 최적화된 지도학습 및 강화학습을 거쳐서 문서 초안 생성, 문서 요약, 질의, 응대 등에 사용 시 뛰어난 성능을 제공한다는 계획이다. 특정 기업의 API나 오픈소스 기반이 아닌, B2B, B2G 특화로 자체 개발된 생성형 언어모델은 코난 LLM이 처음으로 출시했다는 게 회사 측 설명이다.
코난테크놀로지는 생성형 AI 시장에 선도적으로 대응하고자 지속적으로 개발인력을 증원해 왔고, 2007년부터 운영 중인 실시간 AI 분석 서비스 ‘펄스케이(PulseK)’를 통해 205억 건 이상의 고품질의 한국어 데이터를 축적하고 있다.
김영섬 코난테크놀로지 대표는 “자체개발 초거대 언어모델 확보를 위해 24여년간의 기술력을 쏟아 부었다”며 “기업과 기관에 최적화된 모델로 시장 요구에 부응하고, 온프레미스 형태로 보안을 강화시켜 생성형 AI 생태계 구축을 이끌겠다”고 말했다.
강동식 기자 lavita@datanews.co.kr
[ⓒ데이터저널리즘의 중심 데이터뉴스 - 무단전재 & 재배포 금지]