상세 컨텐츠

본문 제목

구글 TPU의 한계, 엔비디아의 CPX 방어 전략 및 젠슨 황의 AI 버블론 반박 심층 분석

AI와 기술 혁신

by saeserap 2025. 11. 29. 01:40

본문

 

최근 구글의 TPU와 관련된 소식(Gemini 3의 TPU 단독 훈련, Anthropic의 TPU 사용 계약)이 엔비디아의 시장 독점 체제를 무너뜨릴 것이라는 해석에 대해, 기술적, 시장 구조적 관점에서 반박하고 엔비디아의 방어 전략을 분석한 내용을 상세히 정리한 것입니다.


 

1. 구글 TPU의 부상과 엔비디아 위협론에 대한 분석

 

1.1. 장기적인 시장 환경 변화 예측

  • 장기적으로 엔비디아가 가지고 있는 독점적인 시장 환경(모노폴리)은 개선될 것으로 예상됩니다.
  • 하이퍼스케일러들의 자체 칩(ASIC) 개발 프로젝트가 진행 중이며, 시장은 ASIC으로 분화되고 있습니다. 구글이 선두에 있고, 올해 상반기부터는 아마존, 내년부터는 메타, OpenAI 등 각자의 자체 칩이 등장할 시기입니다.
  • 이에 따라 AI 가속기 시장에서의 엔비디아 점유율은 하락할 것이지만, 엔비디아는 네트워크나 서버 플랫폼 단에서의 추가 매출을 통해 더 큰 단위에서의 통합을 이루려 하고 있습니다.

1.2. 엔비디아 위협론의 근거 (최근 일주일 사이의 이슈)

  • Gemini 3 훈련: 최근 공개된 Gemini 3가 벤치마크에서 원탑으로 떠오르는 등 성능이 우수하며, 이 모델이 TPU 단독으로 훈련되었다는 소식이 보도되었습니다. (참고: Gemini 2.5와 2도 TPU로 훈련되었으며, 이는 새로운 사실은 아니지만 Gemini 3를 통해 대중적 확신을 얻게 되었습니다 ).
  • Anthropic의 TPU 사용: Anthropic이 구글 TPU 팟(Pod) 계약을 크게 맺은 사실이 알려졌습니다.
  • 시장의 해석: 이 두 가지 사실(TPU의 훈련 가능성과 외부 기업 사용)을 통해 엔비디아가 독점하던 훈련 시장이 뚫리고, 다른 기업들도 TPU로 넘어갈 수 있다는 논리가 만들어지면서 엔비디아 주가가 하락했습니다.

1.3. 위협론에 대한 반박: 프레임워크의 이해가 핵심

  • 프레임워크 시장의 현실: AI 모델 개발에 사용되는 프레임워크 시장은 현재 PyTorch 기반으로 통일화(일어나)되고 있으며, 거의 대부분의 메이저 AI 모델(OpenAI, Meta 등 70~80%)이 PyTorch 기반입니다.
  • 구글의 포지션: 구글은 자체 스택인 JAXTensorFlow를 기반으로 하며, Gemini도 JAX 기반입니다. 이 때문에 TPU를 사용할 수 있습니다.
  • TPU의 한계: TPU에서 PyTorch를 사용하려면 XLA라는 중간 단계를 거쳐야 하는데, 이 경우 효율이 낮아져서 불리합니다.
  • 경쟁사 ASIC의 강점: 아마존, 메타 등 나머지 기업들의 자체 칩은 모두 PyTorch를 네이티브로 지원합니다.
  • 결론: 구글 TPU는 설계 자체부터 자체 스택을 돌리기 위해 독립적으로 만들어졌기 때문에, 엔비디아의 90% 시장을 노리는 것이 아닙니다. 구글 내부적으로도 엔비디아 매출의 10% 수준을 목표로 하고 있습니다.

1.4. Anthropic 및 Meta 계약에 대한 상세 분석

  • Anthropic의 TPU 사용: Anthropic은 Google과 마찬가지로 JAX 기반을 사용하며, TPU를 사용하는 것은 주로 추론용으로 추론 비용을 절감하기 위함입니다.
    • Anthropic의 주요 훈련은 Amazon의 Trainium 칩을 기반으로 아마존과 진행하고 있습니다. AWS는 애널리스트 미팅에서 Anthropic이 자사의 칩으로 훈련하며, AWS가 프라이머리임을 공식적으로 밝혔습니다.
  • Meta의 TPU 사용: 메타가 구글 TPU 사용 계약을 맺은 것도 화제였지만, 메타는 클라우드 기업이 아닌 SNS 플랫폼 기업이라는 특성이 있습니다.
    • 메타의 자체 칩(MTIA)은 AI 훈련/추론용보다는 SNS 추천 알고리즘 최적화 및 광고 비즈니스를 위한 추론 칩으로 설계되었으며, HBM이 아닌 LPDDR 기반입니다.
    • 메타는 자체적인 훈련 생태계를 구축하는 시간(약 2~3년) 동안 엔비디아 GPU와 함께 TPU를 사용하여 OpEx와 CapEx 일부를 줄이기 위해 TPU를 사용하는 것입니다.

1.5. 장기적인 전망 (2027년 이후)

  • 2027년 이후는 미래를 예측하기 어렵지만, 구글이 엔비디아를 무너뜨릴 가능성은 여전히 낮습니다.
  • 그 이유는 다른 하이퍼스케일러들의 자체 칩이 PyTorch를 네이티브로 지원하고 있어, 이들이 엔비디아로부터 독립하는 한이 있더라도 2030년 넘어서까지 TPU를 다 쓰게 되는 시나리오는 어렵기 때문입니다.

2. 엔비디아의 방어 전략: CPX의 중요성

  • 엔비디아의 통합 전략: 엔비디아는 AI 가속기 기업이 아닌 AI 인프라 기업으로 포지셔닝하여, AI 가속기 시장에서의 점유율 감소를 네트워크나 플랫폼 단의 통합을 통해 상쇄하려 합니다 (예: Spectrum-X).
  • CPX (추론 시장의 해결사): 엔비디아의 가장 중요한 방어 전략 중 하나는 CPX입니다.
    • 문제점: 기존 엔비디아 GPU는 추론 과정에서 프리필(Prefill)과 디코드(Decode) 과정 중 프리필에 병목이 생겨, 4~5만 달러짜리 가속기가 20~30% 효율밖에 내지 못하는 문제가 있었습니다. ASIC은 분산 추론으로 이 문제를 해결할 수 있었습니다.
    • CPX의 역할: CPX는 이 프리필 작업을 대신 처리하여, GPU가 디코드 작업을 효율적으로 수행하도록 돕습니다.
    • 시장 전망: 훈련 시장보다 2030년까지 여덟 배 커질 것으로 예상되는 추론 인프라 시장에서 CPX가 방어 역할을 할 것으로 기대됩니다.
    • 공급 문제 해소: CPX는 GDDR 메모리를 사용하여, HBM 수급 및 TSMC CoWoS 캐파 부족 문제를 해소할 수 있다는 장점도 있습니다.
    • 방어율: CPX의 시장 반응에 따라 엔비디아는 TAM 방어율을 높일 수 있을 것으로 예상됩니다. CPX의 본격적인 시장 충격은 베라 루빈(Bera Rubin) 출시 시점인 2026년부터 가능할 것으로 보입니다.

3. 젠슨 황의 'AI 버블론' 반박과 주요 쟁점 정리

  • 발생 배경: 엔비디아는 570억 달러의 분기 매출과 650억 달러의 다음 분기 가이던스 등 뛰어난 실적을 발표했으나, TPU 위협론 등으로 주가가 하락하자 젠슨 황 CEO가 직접 비공개 간담회를 열어 버블론에 반박했습니다.

 

3.1. 버블론의 주요 쟁점과 엔비디아의 반박

쟁점
버블론 근거
엔비디아의 반박 (사실 확인)
출처
재고 증가
재고가 전년 동기 대비 158% 증가하여 과잉 재고 우려.
2026년까지 500억 달러 규모의 RPO(Remaining Performance Obligations) 등 막대한 미래 매출을 감당하기 위해 재고를 미리 쌓는 것은 당연한 조치.
 
매출 채권 증가
DSO(매출 채권 회수 기간)가 평균 30일에서 52~53일로 증가, 고객 지불 능력 악화 우려.
과거 소수 하이퍼스케일러 중심에서 오라클, 코어위브 등 다양한 주체로 고객군이 확대되었기 때문에 발생하는 자연스러운 현상.
 
순환 거래
오픈AI와의 계약 등에서 비정상적인 거래가 발생한다는 주장.
OpenAI의 트렌치 계약 구조 때문입니다. Softbank가 엔비디아 주식을 판 것은 악재 때문이 아니라, OpenAI의 영리 기업 전환 및 IPO를 위한 **잔금(200~300억 달러)**을 2주 안에 마련하기 위한 리밸런싱이었습니다.
 
미국 우선권
GAIN Act를 발효하여 A100급 이상의 칩에 대해 미국 내 우선권을 부여.
미국의 AI 컴퓨팅 파워를 국가에서 지원하는 **제네시스 미션(Genesis Mission)**과 연결된 AI 신패권주의 전략의 일환이며, 엔비디아는 이 통합 전략으로 시장을 방어 중입니다.
 
부채 및 현금 흐름
기업들의 채무(부채 총액)가 빠르게 증가하고 있다는 우려.
부채는 증가하지만, 동시에 Free Cash Flow(FCF)도 같이 증가하고 있습니다. 이는 단기 매출이 바로 나오지 않는 투자를 위해 자본 효율성을 극대화하려는 전략입니다 (특히 메타처럼 ROE 손상을 피하기 위해 장기 채권을 발행).
 
닷컴 버블 비교
현재 AI 시장이 닷컴 버블과 유사하다는 주장.
연준 투표권을 가진 인사의 의견에 따르면, 닷컴 버블 기업은 실질 매출이 거의 없었지만, 현재 AI 관련 기업들은 잘 확립되고 성장하는 수익 흐름을 가지고 있습니다. 또한, AI 관련 기업들의 P/E(주가수익률)도 닷컴 버블의 최고치보다 훨씬 낮은 수준입니다.
 

 

 

 

관련글 더보기