뇌피셜 IT

[GPU WAR v2] 22Q4에 다시 발발할 그래픽 전쟁

easylearn 2022. 9. 27. 11:50
2019년도 RX5700XT(NAVI10/RDNA1.0)를 보고 NVIDIA 싸대기 후릴 수 있다고 설레발을 친 적이 있다
물론 거짓말처럼 ZEN2(Ryzen 3000)개발에 중소기업(당시) 예산을 다 써버렸기에...
AMD는 RX5800XT이상을 개발하기 보다, 바로 다음세대 그래픽(NAVI20/RDNA2.0)개발로 연구인력을 넘겨 버렸다
그래서 '18-19년도는 RTX2000가 개같이 비싸고 레이트레이싱(RayTracing)은 쓸데없었지만,
RTX2070Super 이상을 상대할 AMD GPU가 없어 NVIDIA GPU 천하가 되어버렸다

'20-21년도 AMD가 드디어 깡성능으로 NVIDIA와 비슷해지는 수준까지 올라왔다. QHD기준으로 RX6900XT(NAVI21 / RDNA2.0)의 깡성능은 RTX3080TI(GA102)와 비슷하거나 단 5% 뒤치는 위치에 서기까지 하였다. 최상위 플래그쉽에서 동급의 그래픽카드를 드디어 내게 된 것이다. 문제는 레이트레이싱(RayTracing)이 이제 게이머들이 쓰기에 쓸만해졌다는 것이다. 현실의 벽은 냉혹했다. RX6900XT($799)의 레이트레이싱 성능은 RTX3060TI($399)와 비슷할 뿐이었다. 그래서 NVIDIA GPU 천하는 한번 더 이어졌다.
이제는 다음 전쟁이 기다리고 있다. 동일한 TSMC 5nm공정을 사용하는 두 회사는 과연 그래픽카드의 핵심인 GPU 생산단가를 어떻게 조정할 것이고, 경쟁사보다 얼마나 더 저렴하게 제공할 수 있을 것인가? 이제 이것을 한번 추정해 보려고 한다.

1. 분석을 위한 전제조건

  TSMC SAMSUNG
공정 7nm 5nm 8nm(10nm개선)
웨이퍼 가격(2021) 9346 16988 (E)6545
Scribe Lane(H/V 동일) 0.445 0.42 (E)TSMC 7nm와 상동
Edge Loss 5 5
Defect Density 0.2456 0.2585
Wafer H Shift 0.05 0.15


아래의 단계를 통해서 칩셋 별 생산단가를 추정할 것이다. (참고) TSMC는 불량률에 상관없이 웨이퍼 단위로 주문받는 것으로 알려져 있다.

  • 동시대의 생산된 GPU 칩셋 생산단가를 비교할 것이므로 시간흐름에 따른 웨이퍼 가격 상승/하락은 고려하지 않는다
  • 삼성 8nm는 10nm 공정 개선판으로 TSMC 7nm보다 공정 난이도가 낮으므로 두 공정의 생산 수율은 동일하다고 가정한다
  • 칩셋의 사이즈만 공개되고 가로/세로 비율이 비공개된 칩셋은 정방형으로 가정한다
  • 칩셋의 성능은 유출된 루머통해서 추정한다
  • 생산단가는 실제 제조가격이 아닌 상대적인 수치로 비교해야 한다
  • GPU 칩셋에 따른 클럭 설정은 동일하다고 가정한다(실제로는 쉐이더 증가에 따른 성능에서 10~20% 성능손실 예상)
  • AMD의 MCM 칩셋의 패키징 비용은 없다고 가정한다(상대 비교로만 사용하기 때문)

2. NVIDIA GPU 칩셋 (RTX4000)

가. 제조단가

Chipset GA104 AD104 AD103 AD102
Die Size(㎟) 392 (E)295 (E)379 (E)608
가로x세로(동일)(mm) 19.798 (E)17.175 (E)19.47 (E)24.658
공정 SAMSUNG 8nm TSMC 5nm
Die per Wafer(12inch) 56 87 56 20
Price of Wafer($) (E)6545 16988
단가 116.88 195.26 303.36 849.4
단가 상승률 -
(기준)
+67% +160% +627%

나. 성능향상

그래픽카드 모델 RTX3070TI RTX4080 12GB RTX4080 16GB RTX4090
구분 GA104 Full AD104 Full AD103 Cut AD102 Cut
SM/ShadingUnit 48/6144 (E)60/7680 (E)76/9728 (E)128/16384
Architecture 개선 40%이상
전세대 대비 성능상승분 -
(기준)
+25% +58% +167%
MSRP($) 599 899 1199 1599
가격 상승률 -
(기준)
+50% +100% +167%
칩셋 단가 상승률 -
(기준)
+67% +160% +627%

NVIDIA가 발표한 신제품의 판매가는 성능상승분이 아닌, 칩셋 단가 상승률에 따른 가격을 MSRP(권장소비자가 / Manufacturer's Suggested Retail Price)에 반영한 것을 알 수 있다. 다만 의외로(?) 제조단가가 올라간 것보다는 가격을 덜 올린 것이 사실이고, RTX4090는 상대비교할 경우 가성비가 압도적으로 좋은 것(!!)을 알 수 있다

3. AMD GPU 칩셋 (RX7000XT)

가. 제조단가

Chipset NAVI22 NAVI33 NAVI32 GCD NAVI31 GCD NAVI31/32 MCD NAVI32
(GCD+4MCD)
NAVI31
(GCD+6MCD)
Die Size(㎟) 335 (E)400 (E)263 (E)369 (E)44 - -
가로x세로
(mm)
18.303(동일) (E)20.5x19.5 (E)13.1x20.1 (E)13.1x28.2 (E)4.68x9.36 - -
공정 TSMC 7nm (E)TSMC 7nm (E)TSMC 5nm (E)TSMC 7nm - -
Die per Wafer(12inch) 72 54 109 56 1110 - -
Price of
Wafer($)

9346 16988 9346 - -
단가 129.81 173.07 155.85 303.36 8.42 189.53 353.88
단가 상승률 -
(기준)
+33% - - - +46% +173%

나. 성능향상

그래픽카드 모델 RX6700XT RX7600(7700)XT RX7800XT RX7900XT
구분 NAVI22 Full NAVI33 Full NAVI32 Cut NAVI31 Cut
CU/ShadingUnit 40/3560 (E)64/4096 (E)128/8192 (E)192/12288
Architecture 개선 25%이상
전세대 대비 성능상승분 -
(기준)
60% 220% 380%
MSRP($) 479 (E)649/699/749 (E)899/999/1099 (E)1199/1299/1399
가격 상승률 -
(기준)
(E)+35/46/56% (E)+88/108/150% (E)+150/171/192%
칩셋 단가 상승률 -
(기준)
+33% +46% +173%

AMD가 발표예정인 신제품에 대한 루머를 종합하면 생산단가 억제가 NVIDIA에 비하여 압도적으로 잘 되어 있다. AMD의 최상위 칩셋(NAVI31)의 생산단가는 NVIDIA의 상위 칩셋(AD103)와 비슷하며, AMD의 하위 칩셋(NAVI33)은 NVIDIA 하위칩셋(AD104)보다 가격이 억제되어 있다. 다만 AMD의 상위 칩셋(NAVI31/32)의 경우 MCM 구성을 위한 패키징 비용을 고려해야 한다. 그래도 경쟁사보다 한 체급 아래의 가격으로 생산 가능한 것으로 추정된다
이것이 가능한 이유는 아래와 같이 추정할 수 있다

  • TSMC 7nm 공정은 5nm 공정보다 웨이퍼 가격이 45%정도 저렴하다
  • 공정이 바뀌면 동일한 아키텍쳐라 하더라도 이를 위한 공정 최적화 설계변경은 필수이다
  • AMD는 전 세대(NAVI20/RDNA2.0)를 TSMC 7nm로 생산해 왔기에 7nm공정을 위해 별도의 큰 설계변경 없이 NAVI33을 생산할 수 있다
  • NVIDIA는 전 세대(GA100/Ampare)를 SAMSUNG 8nm로 생산해 왔기에 7nm공정을 위해 AD104설계를 변경하는 것보다, 5nm로 통일하는 것이 효율적이다
  • AMD의 NAVI33이 큰 400㎟이고 NVIDIA의 AD104가 작은 295㎟이지만, TSMC 5nm공정이 너무 비싸서 NAVI33 생산단가가 더 저렴하다
  • 이와 별개로 AMD의 NAVI31/32의 경우 칩셋 크기가 경쟁사 대비 작으나 이를 위한 MCM 패키징 비용을 고려해야만 한다

4. 차세대 NVIDIA vs AMD GPU 칩셋 가성비 비교

이제 시시콜콜하고 읽기 어려운 제조단가 얘기는 그만하자. 어차피 소비자 입장에서는 가성비가 제일 중요한 법이 아니겠는가? 루머 및 NVIDIA 자료에 근거하여 성능을 추정해 보고자 한다.

  • RTX4080 12GB는 RTX3090TI와 동급이거나 5% 성능 우위가 있다 (레이트레이싱 성능은 비고려)
  • RX7600(7700)XT는 QHD에서 RX6900XT와 동급이다
  • RX7800XT, RX7900XT의 MCM 구성에 따른 성능 손실을 10%로 가정한다 (쉐이더 증가율 대비 성능 증가율×(-10~20%)은 두 회사 모두 미반영) → 물론 MCM구성에 따른 손실이 더 적을 수도 있다
  • RX6900XT는 RTX3090TI보다 7.5% 정도 성능이 구리다 (RTX3080-RTX3080TI 사이)
  AMD Reference NVIDIA
제품 RX7600XT
(RX7700XT)
RX7800XT RX7900XT RTX3090TI RTX4080 12GB RTX4080 16GB RTX4090
성능 지표 92.5% 166.5% 250% 100% 105% 126% 224%
단가(E) 173.07 189.53 353.88 - 195.26 303.36 849.4
MSRP (E)699/749 (E)999/1099 (E)1299
/1399
1999 899 1199 1599

RTX3090TI를 기준으로 차세대 그래픽카드의 성능을 추정해 보았다. 위의 표대로 생산단가를 고려한다면,

  • RX7600XT(RX7700XT)RTX4080 12GB보다 17~22%정도 저렴한 가격인데 7.5% 뒤지는 성능으로
  • RX7800XTRTX4080 16GB보다 8~25%저렴한 가격인데 32%앞서는 성능으로
  • RX7900XTRTX409019~25%저렴한 가격인데 4% 앞서는 성능으로

출시될 것이라고 추측해 볼 수 있다. 만약 위의 표가 맞다면 NVIDIA가 뜬금없이 RTX4090 생산단가가 치솟았는데 가격을 $1499로 결정한 이유로 유력해 보인다. RTX4090이 RX7900XT보다 성능이 4% 뒤진다 하더라도, 레이트레이싱 성능과 DLSS3.0은 분명 RTX4090을 선택할 이유로 충분하다
또한 양심적으로 RTX4080 12GB는 아무리봐도 RTX4070으로 나와야 할 물건이다

(수정) RTX4090 MSRP가 $1,499가 아니라 $1,599였다
(추가) NAVI31이 96CU로 나와서 전체적으로 AMD GPU의 성능은 한 체급 아래로 내려왔다
(추가2) NAVI31은 NVIDIA AD103(RTX4080 16GB) 맞상대용으로 출시했다고 공언했다. 따라서 이번세대 AMD GPU는 최상위칩이 7900XTX(96CU)가 될 예정이며, 다음세대 NAVI41에서 GCD×2구성의 플래그십이 반영될 것으로 보인다