LG는 LG사이언스파크가 개발한 인공지능(AI) 프로그램이 AI 학습용 한국어 표준데이터셋 ‘코쿼드(KorQuAD)1.0’ 기계독해 평가에서 95.39점을 받아 1위를 기록했다고 19일 밝혔다. 사람이 동일한 독해 문제를 풀었을 때 받은 점수(91.2점)를 뛰어넘는 결과다.
기계독해는 AI가 ‘질문하고 답하기’를 반복적으로 학습해 스스로 문제를 분석하고 질문에 최적화된 답안을 찾아내는 기술이다.
예를 들어 “제주도는 대한민국의 남해 상에 위치하는 섬으로 대한민국에서 가장 큰 섬이다. 행정구역상 제주특별자치도에 속한다. 섬의 면적은 1833.2제곱킬로미터인데 이는 남한 면적의 1.83%에 해당한다. 2020년 주민등록 인구는 약 67만 명으로 대한민국의 섬 중에서 가장 인구가 많다”와 같은 지문을 주고 “제주도에서 살고 있는 사람은?”이라고 물으면 AI가 맥락을 이해해 “67만 명”이라고 대답하는 식이다.
독해 평가는 AI가 약 10분 동안 수천 개의 비정형화된 주관식 질문에 답하는 방식으로 진행되며, 답변의 정밀도와 재현율에 따라 점수를 높게 산출한다.
LG는 해당 기술을 고객 상담 챗봇에 적용할 계획이다. 고도화된 챗봇 서비스는 질문 유형에 따라 정해진 답변을 취사선택해 응대하는 기존 챗봇과 달리 질문 의미를 이해, 사람이 상담하는 것처럼 자연스러운 답변이 가능하다. AI 기술로 한국어 제품 설명서, 웹페이지 등 방대한 양의 길고 복잡한 문서를 빠르고 정확하게 이해해 필요한 핵심 정보를 단시간 안에 찾아낼 수 있기 때문이다.
강동식 기자 lavita@datanews.co.kr
[ⓒ데이터저널리즘의 중심 데이터뉴스 - 무단전재 & 재배포 금지]