메타(Meta)는 2025년 4월 5일에 출시된 고급 AI 모델군인 Llama 4를 소개하며, 인공지능 기술에서 중요한 이정표를 세웠습니다.
이 기사에서는 Llama 4의 주요 기능, 이전 모델 대비 개선 사항, 경쟁 모델들과의 위치를 자세히 살펴보고, 진화하는 AI 환경에서 Llama 4의 역할을 명확히 조명합니다.
배경 및 개발 맥락
Llama 4는 2023년에 출시된 메타의 Llama 시리즈를 기반으로 하며, 세 가지 모델로 구성되어 있습니다: 스카우트(Scout), 매버릭(Maverick), 비헤모스(Behemoth).
전문가 혼합(MoE) 아키텍처와 초기 융합 기술로 설계된 이 모델은 텍스트, 이미지, 비디오 처리를 탁월하게 수행하며, DeepSeek 및 GPT와 같은 모델들과의 치열한 경쟁에 대응합니다.
출시 세부 정보 및 가용성
2025년 4월 5일에 출시된 Llama 4 스카우트와 매버릭은 Hugging Face와 같은 플랫폼에서 다운로드할 수 있습니다.
가장 큰 변형인 비헤모스는 현재 훈련 중이며 미리보기가 제공됩니다.
이 모델들은 WhatsApp과 Instagram Direct와 같은 앱에서 Meta AI에 통합되지만, 다중 모달 기능은 현재 미국 영어로만 제공됩니다.
Llama 4 스카우트, 매버릭, 비헤모스의 차이점
Llama 4의 세 가지 변형은 각기 다른 요구를 충족합니다:
Llama 4 스카우트
1090억 개의 파라미터와 16명의 전문가를 갖춘 스카우트는 가볍고, 단일 Nvidia H100 GPU에 적합합니다.
1000만 토큰의 컨텍스트 창은 문서 요약과 같은 긴 맥락 작업에서 뛰어나며, 백만 토큰당 0.26달러로 가격이 책정됩니다.
Llama 4 매버릭
4000억 개의 파라미터와 128명의 전문가를 자랑하는 매버릭은 고성능 요구를 목표로 하며, Nvidia H100 DGX 시스템이 필요합니다.
100만 토큰 컨텍스트와 뛰어난 코딩 및 추론 능력을 균형 있게 제공하며, 백만 토큰당 0.40달러입니다.
Llama 4 비헤모스
거의 2조 개의 파라미터를 가진 비헤모스는 아직 미리보기 단계에 있으며, 최첨단 STEM 응용 프로그램을 위해 설계된 가장 강력한 모델입니다.
상당한 하드웨어를 요구하며, 완전히 훈련되면 최고 모델들과 경쟁할 것으로 기대됩니다.
Llama 3 대비 주요 발전
Llama 4는 Llama 3에 비해 상당한 업그레이드를 제공하여 다양한 분야에서 유용성을 향상시킵니다.
더 큰 컨텍스트 창
Llama 4 스카우트는 1000만 토큰의 컨텍스트 창을 제공하며, 이는 Llama 3의 12만 8000 토큰을 훨씬 초과합니다.
이 업그레이드는 여러 문서 요약이나 광범위한 코드베이스 분석과 같은 복잡한 작업을 지원하여 개발자들에게 유용성을 높입니다.
향상된 다국어 지원
Llama 3보다 10배 많은 다국어 토큰으로 200개 언어에 대해 훈련된 Llama 4는 아랍어, 힌디어, 프랑스어와 같은 언어로 글로벌 사용을 지원합니다.
이는 다양한 국제 응용 프로그램에 강력한 선택지가 됩니다.
향상된 아키텍처 및 성능
스카우트는 1090억 개, 매버릭은 4000억 개 파라미터의 MoE 아키텍처를 통해 Llama 4는 코딩, 추론, 이미지 처리에서 효율성과 성능을 개선합니다.
또한 편견을 줄여 논쟁적인 주제에 대한 거부율을 7%에서 2% 미만으로 낮췄습니다.
경쟁 모델들과의 비교
모델 | 제공자 | 컨텍스트 창 | 지능 점수 | 가격 ($/M 토큰) | 출력 속도 (토큰/s) | 지연 시간 (초) |
Llama 4 매버릭 | 메타 | 100만 | 49 | 0.40 | 127.2 | 0.36 |
Llama 4 스카우트 | 메타 | 1000만 | 36 | 0.26 | 104.1 | 0.33 |
GPT-4o | OpenAI | 12만 8000 | 50 | 7.50 | 212.2 | 0.55 |
Gemini 2.5 Pro | 구글 | 100만 | 68 | 3.44 | 157.9 | 35.88 |
Gemini 2.0 Flash | 구글 | 100만 | 48 | 0.17 | 248.3 | 0.30 |
(데이터 출처: 인공지능 분석(Artificial Analysis))
최고 모델들과의 성능 비교
Llama 4 매버릭은 코딩, 추론, 다국어 작업에서 GPT-4o와 Gemini 2.0을 능가하지만, 일부 벤치마크에서 Gemini 2.5 Pro와 Claude 3.7 Sonnet에 뒤처집니다.
비헤모스는 완전히 훈련되면 특히 STEM 분야에서 이러한 선두 모델들에 도전할 수 있습니다.
비용 및 오픈소스 우위
(데이터 출처: Meta)
스카우트의 백만 토큰당 0.26달러는 GPT-4o의 7.50달러에 비해 비용 효율적인 대안을 제공합니다.
오픈소스 상태는 맞춤화를 가능하게 하여 독점 모델들에 비해 우위를 제공하고 개발자들에게 더 폭넓은 접근성을 부여합니다.
미래에 미칠 영향
Llama 4의 다중 모달 기능과 경제성은 혁신적인 AI 응용 프로그램을 가능하게 함으로써 교육 및 의료와 같은 산업을 변화시킬 수 있습니다.
오픈소스 특성은 경쟁과 창의성을 촉진하며 공정한 경쟁의 장을 만들 수 있습니다.

편집자의 코멘트
Llama 4는 메타가 독점 AI 거대 기업들에 도전하는 대담한 행보로 돋보입니다. 비용 효율성과 유연성은 소규모 단체들이 고급 AI를 채택할 수 있게 하여 산업 역학을 바꿀 가능성이 있습니다.
아직 모든 영역에서 최고 성능을 발휘하지는 않지만, 특히 비헤모스와 함께하는 그 궤적은 메타가 미래 AI 발전을 주도하며 접근성과 성능에서 새로운 표준을 세우려는 목표를 시사합니다.