빌런 TOP 20
일간 l 주간 l 월간
조텍 프래그마타 게임 번들
AI 컴퓨팅 용량이 지속적으로 증가하는 가운데, 컴퓨팅 인프라 제공업체 Nebius의 한 전문가는 AlphaSense와의 인터뷰에서 업계 현황을 설명했습니다. 성능 측면에서는 여전히 NVIDIA의 최첨단 AI GPU가 업계를 선도하고 있지만, 비용 기준이 변화하면서 대안 솔루션의 인기가 점점 높아지고 있다는 분석입니다. 또한 AI 컴퓨팅 수요는 여전히 매우 높아, 서비스 제공업체들은 100%에 가까운 가동률을 유지하며 비용을 낮추고 투자 수익을 극대화할 수 있는 상황입니다. 해당 전문가는 현재 AI 인프라 가격이 사용되는 GPU 종류와 사전 예약 여부에 따라 달라진다고 설명했습니다. 온디맨드 기준으로 NVIDIA H100은 시간당 2.95달러, H200은 3.50달러, 최신 Blackwell B200은 시간당 4.90달러에서 6.50달러 사이입니다. 한편, 사전 예약 시 가격은 낮아집니다. 최소 10,000개의 GPU를 1~2년 계약으로 예약할 경우, H100은 1.50달러, H200은 2.20달러, B200은 최소 3.50달러 수준입니다. 2025년 말, NVIDIA는 칩 스타트업 Groq과 비독점 라이선스 계약을 체결했다고 발표했습니다. 이는 당시 NVIDIA의 최대 규모 계약으로, Groq의 AI 추론 기술이 포함되었습니다. Nebius 전문가는 현재 기업 워크로드 수요의 90~95%가 추론에서 발생한다고 설명합니다. 이는 기업들이 자체 소프트웨어를 개발하기보다 사전 학습된 모델이나 API를 활용하는 경향이 강해졌기 때문입니다. AI 인프라 시장에서는 학습에서 추론으로의 전환뿐만 아니라, 비용 구조의 변화도 동시에 진행되고 있습니다. 이와 함께 NVIDIA GPU의 대안 칩에 대한 수요 역시 증가하고 있습니다. 백만 토큰당 비용 비교: NVIDIA Blackwell vs. Groq 새로운 비용 구조에서는 사용량을 토큰 단위, 또는 백만 토큰 기준으로 과금하는 방식이 확산되고 있습니다. 이에 따르면 Groq의 칩은 백만 토큰당 0.05~0.10달러 수준으로 매우 경제적인 반면, NVIDIA의 B100, B200, B300은 약 0.25달러로 약 5배 높은 비용입니다. 또한 Groq 칩은 비용뿐 아니라 속도에서도 경쟁력을 보이며, 초당 최대 800토큰을 처리할 수 있어 NVIDIA 칩의 약 450토큰 대비 거의 두 배에 달합니다. 출처 : https://wccftech.com/nvidias-ai-chips-see-alternatives-emerge-amidst-pricing-model-shift-to-cost-per-million-tokens/
2026.04.24
1
1
조텍 프래그마타 번들
  • 종합
  • 뉴스/정보
  • 커뮤니티
  • 질문/토론