RTX2070(TU106)과 RX5700XT(NAVI10) 칩셋 생산단가 비교

뇌피셜 IT

RTX2070(TU106)과 RX5700XT(NAVI10) 칩셋 생산단가 비교

easylearn 2019. 7. 9. 22:21

최근 AMD에서 ZEN2 기반의 라이젠 3000시리즈를 내놓으면서 큰 방향을 일으키고 있다.

인텔에게 확연하게 밀리던 게이밍에서 9900K 대비 3~7% 뒤지는 정도까지 근접하며. 이제는 AMD도 게이밍 CPU라고 이름 붙일 만하게 성장하였다. 그렇게 다들 CPU에만 관심 가지던 찰나, 같은 날 암바고가 풀렸던 AMD의 차기 아키텍처 NAVI 그래픽이 불구경하던 NVIDIA의 빰따구를 때리기 시작했다. 가성비가 NVIDIA보다 확실히 좋았던 것이다.

이해를 돕고자 제품 가격표를 덧붙인다.

제조사/가격

$349

$399

$499

$699

$999

AMD

rx5700

rx5700xt

NVIDIA

rtx2060

rtx2060super

~~rtx2070(단종수순)~~

rtx2070super

~~rtx2080(단종수순)~~

rtx2080super

rtx2080ti

이것만 보면 뭐가 문제지? 싶을 것이다. 표만 보면 아무 문제가 없다. 그런데 말이다,

https://www.pcgamer.com/amd-radeon-rx-5700-and-rx-5700-xt-review-in-progress/

RX5700XT가 $399로 RTX2070~2070SUPER사이에 ( = RTX2060SUPER 가격), RX5700이 $349로 RTX2060~2060SUPER사이를 ( = RTX2060 가격) 완벽히 메꿔버린 것이다.

결국 지금 NVIDIA는 AMD와의 경쟁을 위해서 RT코어를 통한 레이트레이싱 경험을 향상 시키던지 (현재 레이트레이싱 활성화 시 게임 프레임이 1/2~1/3정도 줄어듬) 가격을 낮추던지의 상황에 처한 것이다. RT 기술은 아직 초기 단계이므로 쉽게 게임 성능 향상을 가져오기는 힘들 것이다. 그렇다면 답은 하나다. RTX 카드의 가격을 낮추는 것이다.

하지만 필자는 그것이 젠슨 황에게는 쉽사리 내리기 어려운 선택이 아닐까라는 조심스러운 의견을 내놓고자 한다. 아무런 근거가 없진 않고, 관련 소스를 미리 정리하고서 계산을 해 보고자 한다.

TSMC 12인치 웨이퍼 칩셋 생산 수율 http://news.mydrivers.com/1/634/634825.htm
RTX2070(TU106) 칩셋 사이즈 445㎟ https://www.techpowerup.com/gpu-specs/geforce-rtx-2070.c3252
RX5700XT(NAVI10) 칩셋 사이즈 251㎟ https://www.techpowerup.com/gpu-specs/radeon-rx-5700-xt.c3339
다이 수율 계산기 https://caly-technologies.com/die-yield-calculator/
12인치 웨이퍼 Edge Loss - 3mm (SEMICON Tiwan 2013 발표 자료)

아래의 단계를 통해서 칩셋 별 생산단가를 추정할 것이다. (참고) TSMC는 불량률에 상관없이 웨이퍼 단위로 주문받는 것으로 알려져 있다.

TU106의 칩셋 가로세로 비율 & TSMC 생산 수율을 교차하여, 16nm에서의 칩셋 구분선 굵기와 불량률을 역계산할 것이다. 전제는 각 칩셋이 온전하게 100% 생산된 경우만을 추산한다. 웨이퍼 주변부 Edge Loss 및 불량률에 의한 부분 칩셋 커팅으로 하위 라인업의 그래픽 카드 칩셋으로 재활용되는 경우는 제외한다. TU106은 12nm 공정이지만, 12nm는 16nm개선 공정으로 면적은 줄어들지 않고 똑같다. TU106의 제조가격을 추정할 수 있는 근거는 위 표에서 16nm밖에 없으므로 이를 기반으로 계산한다. 계산결과 값보다 실제로 TU106(12nm)의 단가는 조금 더 비싸질 것이라 추정된다.
TU106 칩셋의 가로세로를 추정하여 1번에서 구한 값을 기반으로 수율을 추정한다. 양품 생산률을 웨이퍼 단가로 나누면 칩셋별 단가가 된다.
NAVI10의 칩셋 가로세로 비율 & TSMC 생산 수율을 교차하여, 7nm에서의 칩셋 구분선 굵기와 불량률을 역계산할 것이다. 전제는 각 칩셋이 온전하게 100% 생산된 경우만을 추산한다. 웨이퍼 주변부 Edge Loss 및 불량률에 의한 부분 칩셋 커팅으로 하위 라인업의 그래픽 카드 칩셋으로 재활용되는 경우는 제외한다.
NAVI10 칩셋의 가로세로를 추정하여 3번에서 구한 값을 기반으로 수율을 추정한다. 양품 생산률을 웨이퍼 단가로 나누면 칩셋별 단가가 된다.
2번과 4번의 단가를 비교하면 Profit! 참 쉽죠?? 히트스프레더 아래의 자세한 코어 구성은 신경 쓰지 않는다. 전문가도 아닐뿐더러 간단하게 단가만 비교하는 것이기에 그럴 필요가 없다고 여겨진다.

그림판으로 칩셋 부분만 드래그하여 픽셀 값을 구한다. 130*102px값이 나왔다. 즉 TU106은 130:102 비율의 칩셋이다.

위 표의 생산 수율표를 보면 125㎟ 면적의 칩셋은 12인치 다이에서 478개가 생산되며, 359.74개의 양품이 나온다.

(1) TU106 비율로 125㎟ 칩셋을 생산할 경우를 추정 : 125㎟ = 130x*102x = 13,260x^2 = 12.62195mm X 9.90338mm

(2) 생산 개수 : Scribe Lane = 0.36814 / 양품 개수 : Defect Density = 0.2

(1) TU106 (Die size) 445㎟ = 130x*102x = 13,260x^2 = 23.81506mm X 18.68566mm

(2) 생산 개수 : Scribe Lane = 0.36814 / 양품 개수 : Defect Density = 0.2

(3) 16nm 12인치 웨이퍼 단가 $5,912 → TU106 칩셋 단가 = $5,912/53 = $111.55

그림판으로 칩셋 부분만 드래그하여 픽셀 값을 구한다. 85*68px값이 나왔다. 즉 NAVI10은 85:68 비율의 칩셋이다.

위 표의 생산 수율표를 보면 83.27㎟ 면적의 칩셋은 12인치 다이에서 721개가 생산되며, 545.65개의 양품이 나온다.

(1) NAVI10 비율로 83.27㎟ 칩셋을 생산할 경우를 추정 : 83.27㎟ = 85x*68x = 5,780x^2 = 10.20233mm X 8.16186mm

(2) 생산 개수 : Scribe Lane = 0.37599 / 양품 개수 : Defect Density = 0.295

(1) NAVI10 (Die size) 251㎟ = 85x*68x = 5,780x^2 = 17.71299mm X 14.17039mm

(2) 생산 개수 : Scribe Lane = 0.37599 / 양품 개수 : Defect Density = 0.295

(3) 7nm 12인치 웨이퍼 단가 $9,965 → NAVI10 칩셋 단가 = $9,965/110 = $90.59

TU106 : NAVI10 = 111.55 : 90.59 ; TU106 생산 단가는 NAVI10보다 23.1% 더 비싸다

글 작성 시간만 무려 1시간 걸린 긴 게시물을 여기까지 읽어왔다면 이게 무슨 말인지 알 것이다.

RX5700XT와 같은 성능의 RTX2070이라고 해도 생산단가가 23.1% 더 비싸다. 즉 RTX2070SUPER의 가격 할인은 어렵다는 것이고, 가능한 시나리오는 RTX2060이나 RTX2060SUPER의 판매단가를 낮추는 것이다. NVIDIA의 milking time이 끝나고 이제는 경쟁의 시대가 온 것이다. 하지만 그러려면 수익률을 일부 포기하는 NVIDIA의 큰 결단이 필요할 것이다. 이에 비하여 AMD는 NVIDIA만큼의 고심은 필요하지 않을 것으로 보인다. CPU라는 캐시카우가 존재하는 한.

번외. NVIDIA가 왜 7nm로 RTX를 생산하지 않은 것인가? 보시려면 더보기를 클릭하세요.

이것을 이해하려면 2018년으로 돌아가야 한다. 2018년 8월에 발표된 RTX 시리즈는 적어도 1월에는 리스크 생산에 들어갔어야 했고, 당시의 젠슨 황의 판단을 고려해야 할 것이다.

1. 미성숙한 7nm 공정으로 비싼 비용을 치르기보다는, 성숙한 16nm 개선 공정인 12nm로 안정적인 수율로 수익을 올리기를 원했다. 이 당시 AMD의 라이젠2(ZEN+)가 12nm로 성공적으로 양산되고 있었다.

https://www.digitaltrends.com/computing/nvidia-stadia-rtx-gtc/

2. 2018년도에는 7nm 공정 생산을 이제 막 시작했다.

2018년도 초중반만 해도, 12nm 빅칩 생산 비용이 같은 성능의 (공정 감소로 스케일링 감소된) 7nm 미들칩 생산비용보다 저렴했다. 하지만 이는 2018년 후반부터 역전되기 시작해, 2019년 중반에 이르러서는 TU106과 같은 성능의 칩 생산비용이 23.1% 저렴해지는 데 까지 이르렀다. 물론 여기까지의 수율이 오르기 위해 2018년 초반부터 AMD는 TSMC에서 지속적으로 ZEN2 / NAVI10칩을 생산해 온 리스크 비용을 져 왔다는 것을 고려해야 한다.

즉 NVIDIA는 GPU전문 회사로서 리스크 비용을 최소화한 채 약 1년간 수익을 극대화시켜왔지만, 지금에 이르러 수익률이 역전되었다.

AMD는 CPU/GPU 둘 다 생산하는 회사로서 ZEN2 74㎟의 상대적으로 소형인 CPU 칩으로 7nm에서 리스크 비용을 최소화하고 수율을 최적화시켜오는 동시에, 수율이 오르면서 상대적으로 빅칩인 NAVI10 251㎟을 투입하였고, 결과적으로 생산 단가를 최적화하였다. 지금에 이르러 같은 성능의 칩셋 생산 비용이 훤씬 저렴하게 된 것이다.

사업은 선택의 연속이다. 과거에 이랬으면 어땠을까? 라는 만약은 없다. NVIDIA는 딥러닝과 게이밍에서 당시에 할 수 있는 최선의 선택을 했을 것이고, 남는 여력을 Ray Tracing이라는 새로운 RT코어 개발에 쏟았다. GPU 전문 회사로서 다른 방법은 없었다. 코인 열풍이 사그라들어 회사 실적이 반토막 나는 마당에, 빅칩인 GPU 수율이 오를 때까지 7nm에서 리스크 생산만 할 수는 없었던 이유가 있다.

NVIDIA는 과거 TSMC에서 (AMD와 더불어) 수율이 안정되지 않은 28nm 공정을 무리하게 도입하려다, AMD HD7970이 3개월간 잘 팔리는 것을 지켜보고서야 GTX680이 나올 수 있었던 경험도 있었다. 해당 칩셋 생산 수율이 판매에 지장 없을 정도로 나오기까지 (수율에 상관없이) 지불한 웨이퍼 비용은 두고두고 기억에 남았을 것이다.

※ (1차 수정) Edge Loss 관련 잘못된 추정이 있어 해당 부분 SEMICON 발표를 참고하여 3mm로 가정 & Max Dies Per Wafer = 한계 수율 =/= Gross Die , Gross Die = Wasted + Defective + Good + Partial Die

(http://www1.semi.org/en/sites/semi.org/files/docs/G450C_New_Edge_Exclusion_Proposal_by_kay_lee_FINAL.pdf)

다음 IT 게시물 예고,

(1) INTEL과 AMD 메인스트림 CPU의 격돌 - 제조단가의 추격자

(2) 왜 인텔의 Xeon 은 AMD의 EPYC보다 비쌀 수 밖에 없는가?