LG 엑사원 3.0 7.8B 오픈소스 모델 공개

LG의 야심작, 7.8B 오픈소스 모델 '엑사원 3.0' 심층 분석

작성일: 2024년 3월 24일 | 카테고리: AI 기술 트렌드, 국산 AI 모델

안녕하세요, 반갑게도 국내 기업인 LG가 최근 '엑사원 3.0'이라는 인공지능 언어모델을 공개했네요. 이 모델은 국내 기업이 개발한 AI 모델이 글로벌 빅테크 기업들의 동급 모델과 어깨를 나란히 한다는 점에서 큰 의미가 있습니다.

LG 엑사원 3.0 모델 성능 비교 이미지 — LG 엑사원 3.0과 글로벌 모델 성능 비교 (출처: LG)

엑사원 3.0, 글로벌 경쟁에 도전장을 내밀다

LG AI연구원(원장 배경훈)은 지난 8월 7일, 'AI 연구 생태계 발전'에 기여하기 위해 엑사원 3.0 중 활용도가 높은 경량 모델을 오픈소스로 공개했습니다. 매개변수(파라미터) 78억 개를 가진 이 모델은 메타의 '라마 3.1 8B', 알리바바의 '큐원 2 7B', 미스트랄 AI의 '미스트랄 7B' 등 글로벌 인기 오픈소스 모델들과 비교해도 뒤처지지 않는 성능을 보여준다고 해요.

"국내에서는 처음으로 자체개발한 AI 모델을 오픈소스로 공개, 개방형 AI 연구 생태계 활성화 및 국가 AI 경쟁력 제고에 기여하고자 한다"

- 배경훈 LG AI연구원장

특히 주목할 만한 점은 모델 출시와 동시에 기술 보고서를 함께 발표했다는 것입니다. 매개변수와 학습 데이터 토큰, 모델 학습 방법, 성능 평가 결과 등을 상세히 공개했죠. 국내 AI 기업들 중에서는 이렇게 투명하게 기술 정보를 공개한 사례가 거의 없었는데, LG의 이러한 행보는 국내 AI 생태계 발전에 큰 도움이 될 것으로 보입니다.

엑사원 3.0의 핵심 경쟁력: 성능과 경제성

엑사원 3.0의 가장 큰 특징은 성능과 경제성을 모두 갖췄다는 점입니다. LG에 따르면 이전 모델인 '엑사원 2.0'에 비해:

추론 처리 시간 56% 단축
메모리 사용량 35% 감소
구동 비용 72% 절감

특히 모델 크기를 획기적으로 줄인 점이 인상적인데요, 초기 '엑사원 1.0'이 3000억 매개변수(300B)였던 것에 비해 엑사원 3.0은 그 1/38 수준인 78억 매개변수로 줄였음에도 더 나은 성능을 보여준다고 합니다.

LG 엑사원 모델 경량화 및 성능 향상 그래프 — 엑사원 모델의 경량화 및 성능 향상 추이 (출처: LG)

이는 경량화 및 최적화 기술 연구에 집중한 결과로, 동급 모델 대비 전력 소모도 크게 줄였다고 해요. 이런 경제성은 실제 산업 현장에서 AI를 활용할 때 매우 중요한 요소죠. 클라우드 서버에서 대규모 AI 모델을 운영할 때 발생하는 비용과 전력 문제를 해결할 수 있는 방향을 제시했다는 점에서 의미가 큽니다.

글로벌 모델과의 성능 비교: 벤치마크 결과는?

LG는 엑사원 3.0의 성능을 객관적으로 입증하기 위해 다양한 벤치마크 테스트 결과를 공개했습니다. MT-벤치, 알파카이벨(AlpacaEval-2.0), 아레나-하드, 와일드벤치 등 총 25개 벤치마크를 통해 성능을 검증했죠.

결과는 상당히 고무적이었습니다. 비교 대상이 된 메타, 알리바바, 구글, 마이크로소프트, 미스트랄 AI 등이 개발한 글로벌 대표 오픈소스 모델들 중에서 코딩과 수학 영역 등 13개 벤치마크에서 1위를 차지했다고 해요.

특히 주목할 부분은 한국어 성능입니다. 엑사원 3.0은 한국어 전 영역에서 최고 성능을 기록했을 뿐만 아니라, 영어 추론(ARC) 영역에서도 평균 이상의 성능을 보여주며 다국어 모델로서의 가능성을 입증했습니다.

주요 모델별 벤치마크 성능 비교
모델명	파라미터 크기	코딩 성능	수학 성능	한국어 성능	영어 추론
LG 엑사원 3.0	7.8B	상위권	상위권	최상위	중상위
메타 라마 3.1	8B	중상위	중상위	중위	상위권
구글 젬마 2	9B	중상위	상위권	하위	상위권
미스트랄 7B	7B	중위	중위	하위	중상위

이러한 성능은 특허와 소프트웨어 코드, 수학, 화학 등 국내외 전문 분야 데이터 6000만 건 이상을 학습한 결과라고 합니다. LG는 여기서 그치지 않고 연말까지 법률, 바이오, 의료, 교육, 외국어 등 분야로 학습 데이터를 확장해 1억 건 이상으로 늘릴 계획이라고 밝혔어요.

LG 제품과 서비스에 적용될 엑사원 3.0

LG는 엑사원 3.0을 단순히 연구용 모델로 그치지 않고 실제 제품과 서비스에 적용할 계획을 가지고 있습니다. 하반기부터는 LG 계열사의 다양한 제품과 서비스에 엑사원 3.0을 탑재하는 과정이 진행된다고 해요.

LG가 개발한 모델은 용도에 따라 다양한 크기로 설계되었습니다:

온디바이스 AI용 초경량 모델: 스마트폰, TV 등 기기 내에서 직접 구동되는 모델
범용 목적의 경량 모델: 다양한 서비스에 활용 가능한 모델
특화 분야용 고성능 모델: 전문 영역에서 높은 성능을 발휘하는 모델

각 계열사는 자사가 보유한 데이터로 엑사원 3.0을 미세조정(Fine-tuning)하여 각 회사의 제품과 서비스에 맞춤화할 예정입니다. 이는 LG그룹이 AI를 그룹 전체의 핵심 경쟁력으로 삼겠다는 의지를 보여주는 부분이라고 볼 수 있죠.

'챗엑사원(ChatEXAONE)': LG 임직원을 위한 AI 비서

LG는 엑사원 3.0 모델을 기반으로 한 생성 AI 서비스 '챗엑사원(ChatEXAONE)'의 베타 버전도 공개했습니다. 이 서비스는 LG 임직원들을 위한 것으로, 실시간 웹 정보 기반 질의응답, 문서 및 이미지 기반 질의응답, 코딩, 데이터베이스 관리 등 업무 효율성을 높이는 다양한 기능을 제공한다고 해요.

챗엑사원의 주요 기능은 다음과 같습니다:

검색부터 요약, 번역, 데이터 분석, 보고서 작성까지 AI 지원
검색 증강 생성(RAG) 기술 적용으로 최신 정보 반영
자연어 입력만으로 22개 프로그래밍 언어와 SQL 쿼리 생성
소프트웨어 개발자와 데이터 분석 전문가를 위한 특화 기능

베타 서비스는 연말까지 진행되며, 이후 정식 서비스와 모바일 앱은 LG 계열사별 준비 상황에 맞춰 순차적으로 제공될 예정입니다. 사내 문서 학습이나 보안 데이터 관리가 필요한 계열사의 경우에는 별도의 특화 서비스 구축이 진행될 계획이라고 합니다.

이러한 서비스는 LG 임직원들의 업무 생산성을 크게 향상시킬 것으로 기대됩니다. 특히 일상적인 문서 작업부터 전문적인 코딩, 데이터 분석까지 폭넓게 지원함으로써 디지털 전환(DX)을 가속화하는 역할을 할 것으로 보입니다.

AI 안전성과 윤리적 측면: '레드팀' 운영

LG는 AI 모델의 성능뿐만 아니라 안전성과 윤리적 측면에도 주의를 기울이고 있습니다. 특히 '레드팀(Red Team)' 활동을 통해 AI 모델에 의도적으로 공격을 시도하여 기술과 서비스의 취약점을 검증하고 보완하는 작업을 지속적으로 진행하고 있다고 밝혔습니다.

레드팀 활동은 생성형 AI 모델이 가질 수 있는 여러 위험 요소를 사전에 발견하고 대응하기 위한 노력으로, 최근 AI 윤리와 안전성이 강조되는 글로벌 AI 개발 트렌드와도 일치합니다.

이는 단순히 기술적 우수성만을 추구하는 것이 아니라, 책임 있는 AI 개발을 지향하는 LG의 철학을 보여주는 부분이라고 할 수 있겠죠. 특히 오픈소스로 공개된 모델이 다양한 영역에서 활용될 가능성이 있는 만큼, 이러한 안전성 검증은 매우 중요한 과정입니다.

한국 AI 생태계에 미칠 영향

엑사원 3.0의 오픈소스 공개는 한국 AI 생태계에 어떤 영향을 미칠까요? 지금까지 한국의 AI 개발은 주로 해외 대형 AI 모델에 의존하는 경향이 있었습니다. 하지만 LG의 이번 행보는 국내 기업이 개발한 모델이 글로벌 수준의 성능을 갖출 수 있다는 것을 증명했다는 점에서 큰 의미가 있습니다.

또한 오픈소스로 공개함으로써 다양한 개발자와 연구자들이 이 모델을 활용하고 발전시킬 수 있는 기반을 마련했습니다. 이는 국내 AI 연구 생태계를 활성화하고, 더 많은 혁신을 이끌어낼 수 있는 촉매제 역할을 할 것으로 기대됩니다.

"실제 산업 현장에서 활용할 수 있는 AI를 만드는 것이 중요한 만큼 특화 성능과 경제성을 갖춘 엑사원으로 LG 계열사와 외부 기업 및 기관과의 파트너십을 강화해 나갈 계획"

- 배경훈 LG AI연구원장

특히 한국어 성능이 우수하다는 점은 국내 기업들이 AI를 도입할 때 큰 장점으로 작용할 수 있습니다. 영어 중심의 글로벌 모델들은 한국어 처리에 한계가 있을 수밖에 없는데, 엑사원 3.0은 이런 언어적 장벽을 낮출 수 있을 것으로 보입니다.

글로벌 AI 경쟁 속 LG의 포지셔닝

글로벌 AI 시장은 OpenAI, 구글, 메타, 마이크로소프트 등 거대 테크 기업들의 치열한 경쟁이 이어지고 있습니다. 이런 상황에서 LG는 어떤 포지셔닝을 가져갈 수 있을까요?

LG의 강점은 실제 산업 현장에 적용 가능한 AI에 초점을 맞추고 있다는 점입니다. 대형 언어 모델의 성능 경쟁보다는 경제성과 실용성을 강조하며, 특히 자사의 다양한 제품과 서비스에 AI를 접목시키는 전략을 추구하고 있습니다.

또한 한국 기업으로서 한국어와 아시아 시장에 특화된 AI를 개발할 수 있다는 점도 차별화 요소가 될 수 있습니다. 글로벌 빅테크 기업들이 주로 영어권 시장에 집중하는 동안, LG는 아시아 시장의 특성을 반영한 AI 개발로 틈새 시장을 공략할 수 있을 것입니다.

결론: 엑사원 3.0의 의미와 전망

지금까지 LG의 '엑사원 3.0' 모델에 대해 살펴보았습니다. 이 모델은 단순히 또 하나의 AI 모델이 아니라, 한국 AI 기술의 성숙도를 보여주는 중요한 이정표라고 할 수 있습니다.

특히 주목할 점은:

글로벌 빅테크 기업들의 동급 모델과 비교해도 뒤처지지 않는 성능
한국어 처리에 강점을 가진 국내 환경 특화 모델
실제 산업 현장에서 활용할 수 있는 경제성과 실용성 확보
오픈소스 공개를 통한 국내 AI 생태계 활성화 기여

LG의 이러한 행보는 국내 AI 기술 발전에 큰 도움이 될 것으로 기대됩니다. 특히 엑사원 3.0을 오픈소스로 공개함으로써, 더 많은 개발자와 연구자들이 이를 활용해 다양한 혁신을 이끌어낼 수 있는 기반이 마련되었다는 점이 중요합니다.

앞으로 LG가 엑사원 3.0을 어떻게 발전시켜 나갈지, 그리고 이를 통해 어떤 혁신적인 제품과 서비스를 선보일지 기대가 됩니다. 한국의 AI 기술이 글로벌 시장에서 더 큰 존재감을 보여줄 수 있는 발판이 마련된 것 같아 기대가 큽니다.

여러분은 LG의 엑사원 3.0에 대해 어떻게 생각하시나요? 국내 AI 기술의 발전과 활용에 대한 여러분의 생각을 댓글로 공유해 주세요!

무료 오픈소스 AI 개발 플랫폼 bolt.diy

- 2월 17, 2025

자세한 내용 보기

이 블로그 검색

SpoZoneAI