엔비디아, GTC 2026에서 'AI 제국' 로드맵을 펼치다
엔비디아(Nvidia)가 2026년 3월 16일 개막한 GTC 2026에서 차세대 Vera Rubin 아키텍처와 AI 에이전트 플랫폼을 공개했다. FY2026(2026년 1월 마감) 연간 매출은 2,159억 달러로 전년 대비 65% 성장했다. 시가총액은 약 4.8조 달러에 달한다.
GPU 회사가 아니라 AI 인프라 전체를 지배하는 플랫폼 기업으로의 전환이 한층 뚜렷해졌다.
Vera Rubin, Blackwell 이후의 다음 수는?
GTC 2026의 핵심은 Vera Rubin 아키텍처다. 7개 칩, 5개 랙스케일 시스템, 1개 슈퍼컴퓨터로 구성된 풀스택 플랫폼이다. 에이전틱 AI(Agentic AI) 인프라 — 자율적으로 판단하고 행동하는 AI 에이전트 — 를 위해 설계됐다.
더 흥미로운 것은 차차세대 Feynman 아키텍처의 공개다. Rosa CPU, 차세대 LP40 LPU, BlueField-5 네트워킹 칩, Kyber 연결 기술까지 공개하면서, 엔비디아가 최소 2~3세대 앞의 로드맵을 이미 확보하고 있음을 보여줬다.
DGX Station GB300도 주목할 만하다. 책상 옆에 놓을 수 있는 데스크사이드 슈퍼컴퓨터로, 748GB 코히런트 메모리와 FP4 20 페타플롭스 성능을 갖추고 있다. 1조 파라미터 모델까지 단일 시스템에서 돌릴 수 있다.
젠슨 황 CEO는 Blackwell과 Vera Rubin을 통한 2025~2027년 누적 매출이 최소 1조 달러에 달할 것이라고 전망했다.
CUDA 해자는 여전한가, 균열이 보이나?
CUDA 생태계는 여전히 엔비디아의 가장 강력한 경쟁 우위다. 400만 명 이상의 개발자, 3,000개 이상의 최적화 애플리케이션, 모든 주요 AI 프레임워크 통합 — 20년간 축적된 생태계를 단기간에 대체하기는 어렵다.
하지만 균열이 보이기 시작했다.
엔비디아의 데이터센터 GPU 시장 점유율은 2024년 약 90%에서 2026년 약 86%로 하락했고, 2026년 말에는 75%까지 떨어질 것이라는 전망이 나온다. AMD의 MI355X는 벤치마크 기준 B200 대비 추론 성능이 30% 빠르고, 달러당 토큰 처리량이 40% 우수하다는 평가를 받고 있다. AMD ROCm 7도 이전 버전 대비 추론 성능이 3.5배 향상됐다.
구글 TPU는 2025년 250만 유닛을 출하했고, 아마존 Trainium2는 50만 개 칩 규모의 시설을 구축했다. OpenAI의 Triton 컴파일러, MLIR 등 하드웨어 비종속 소프트웨어 스택도 발전하면서, CUDA 종속에서 벗어나려는 움직임이 가속화되고 있다.
엔비디아의 대응은 공격적이다. 260억 달러 규모의 오픈소스 AI 투자를 단행하며, CUDA 옆에 새로운 생태계 해자를 구축하고 있다. 200억 달러에 인수한 추론 전문 기업 Groq의 첫 칩 'Groq 3 LPU'도 2026년 3분기 출하 예정이다.
DGX 클라우드 전략은 왜 바뀌었나?
흥미로운 변화가 하나 있다. 엔비디아가 외부 고객 대상 퍼블릭 DGX Cloud 서비스 확대를 사실상 중단했다. 대신 내부 AI 모델 개발과 칩 설계 지원 인프라로 전환하는 쪽을 택했다.

