▲kt cloud 직원들이 하이퍼스케일 AI 존이 구축된 IDC에서 장비를 점검하고 있다. / 사진=kt cloud
kt cloud(대표 윤동식)은 오는 12월까지 KT 대덕2연구센터에 초거대 인공지능(AI) 학습용 GPU 인프라를 구축한다고 25일 밝혔다.
kt cloud는 이번 사업에서 HAC(Hyperscale AI Computing) 인프라를 구축해 최적의 성능, 운영 효율성 등을 검증하고, 본격적인 초거대 AI 사업 시장 공략에 나선다는 전략이다.
kt cloud는 초거대 AI 학습 성능 개선과 재학습 결과 등을 검토·보완해 글로벌 톱티어 수준까지 기술력을 끌어올릴 계획이다. kt cloud는 국내 기업인 모레와 협력해 최적화된 AI 프레임워크를 개발하는 한편, 리벨리온과 함께 국산 AI 클라우드 반도체 칩 개발도 추진 중이다.
kt cloud의 HAC는 지난해 12월 출시된 세계 최초 종량제 GPU 서비스다. AI 모델 대형화에 필요한 ▲비즈니스 민첩성 ▲비용 효율성 ▲개발 유연성·연속성 ▲프로그래밍 호환성의 강점을 갖추고 있다.
HAC는 여러 대의 GPU를 논리적으로 결합해 하나의 GPU처럼 사용하며, 수백·수천개의 GPU 클러스터링을 지원한다. 대규모 연산이 필요할 때 다중·동적 할당 기술을 통해 원하는 만큼만 GPU 자원을 할당받고, 연산 후 즉시 반납할 수 있어 탄력적으로 서비스를 이용할 수 있다.
kt cloud는 초거대 AI 언어모델 학습 테스트를 진행한 결과, HAC는 동등한 조건의 기존 구축형 서비스 대비 30~50%의 비용 절감 효과를 낼 수 있는 것으로 나타났다고 설명했다.
kt cloud는 서버 팜을 지속적으로 증설할 계획이며, 향후 최대 10분의 1 수준의 효율적 비용으로 동급 연산 자원을 제공할 수 있을 것으로 기대하고 있다.
강동식 기자 lavita@datanews.co.kr