ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [GPU WAR v2] AMD가 헤쳐나가야 할 난관들
    뇌피셜 IT 2022. 9. 27. 14:14
    지난 글에서 22Q4에 출시되는 차세대 GPU의 성능 및 생산단가는 AMD가 우위에 설 가능성이 높다고 기술한 바 있다 
    그러나 이러한 장밋빛 전망에서 AMD가 해결해야 할 문제가 있다
    만약 이를 해결하지 못한다면, AMD의 GPU MCM 구조의 상용화 시도는 커다란 악재로 돌아올 뿐이다 

     CPU와 GPU 개발에 있어서 가장 위험한 것은 무엇일까? 물론 가장 큰 문제는 개발할 비용과 인력이 없는 것이겠지만, 이는 준비되었다고 가정하면 말이다. 그것은 바로 새로운 설계 구조(아키텍쳐; Architecture)를 반도체에 적용하는 것이다

     분명한 사실은 연구실에서 허구헌날 테스트해서 나오지 않던 새로운 아키텍쳐의 문제가, 출시하고 보니 발견되는 경우는 종종 있는 법이다. 그래서 반도체 설계회사는 의외로 도전적인 설계는 피하면서 반도체의 성능을 향상시키길 바란다. 해당 분야의 가장 큰 예시는 INTEL인데, 코어 시리즈의 린필드(i-1세대)에서부터 카비레이크(i-7세대)에 이르기까지 일반사용자에게 판매되는 제품의 최상위 라인인 i7은 4코어 8스레드를 2008-2017년, 10여년이나 유지하였다 (물론 2세대, 6세대의 경우 내부 아키텍쳐의 큰 변화가 있긴 했다만...)

     이에 반하여 AMD가 이번에 시도하는 GPU MCM구조는 그야말로 GPU 역사에서 최초로 있는 시도라고 볼 수 있겠다 (메모리 확장/공유 안 되는 단순 SLI(CrossFire)/Dual-Chip과는 다르다). 이는 역사적으로 1999년도 NVIDIA가 GeForce 256을 출시한 이래 24년만에 있는 GPU 설계구조의 가장 큰 지각변동이다. 이 말은 곧 AMD의 이번 MCM 구조는 엄청난 위험부담을 안고 있다는 말과 다름없다

     1. MCM 구조란?

     MCM(Multi Chip Module)은 다중칩 구조로 불리우는 것으로, 반도체 공정의 복잡화에 따른 생산비용은 칩셋 크기가 커질수록 선형이 아닌 지수함수로 증가하게 되는데 이를 회피하기 위한 설계 방법이다. AMD는 이러한 방법으로 CPU의 생산가격에서 INTEL에 우위에 설 수 있었다

     즉, 칩셋 제조단가의 억제를 위하여 사용하는 설계 방법이다

    2. 왜 AMD는 NVIDIA 보다 MCM을 먼저 도입하는 것인가?

     AMD는 분명 NVIDIA보다 GPU에 있어서 MCM구조를 먼저 도입하였다. 이는 CPU도 같이 설계하는 AMD의 설계 이력이 크게 관여한 것으로 보인다. 2017년 AMD는 크게 뒤쳐져 있던 CPU 시장에서 압도적인 가성비로 Ryzen1X00(ZEN1)을 출시하게 된다. INTEL이 i7에서 4C/8T로 놀던 시기에, AMD는 R7이 8C/16T로 돌아가는데 가격은 비슷하였다. 이것이 가능한 이유는 바로 MCM구조로 설계된 CPU이기에 많은 코어를 가졌지만 제조비용은 경쟁사보다 더 저렴했기 때문이다

     2019년 AMD는 3세대의 Ryzen3X00(ZEN2)를 내놓게 되고, 드디어 INTEL과 동급의 IPC를 가지는 CPU를 출시하게 된다. 물론 제조단가는 더 저렴하였다. ZEN2 아키텍쳐는 ZEN1 아키텍쳐에서 큰 부분이 바뀌었는데, 바로 CPU 모듈(Chiplet)의 조합이었던 구조에서 IO 모듈 + CPU 모듈로 분리된 것이다 (기존에는 CPU 모듈에 IO소자가 내장되어 있었다)

     위험부담이 큰 시도였지만 이는 성공적이었고 2020년 Ryzen5X00(ZEN3) 출시 후 INTEL이 2021년 엘더레이크(골든코브)가 출시되는 1년동안 압도적인 시장의 강자로 군림하였다. 여기서 가장 중요한 것은 AMD가 연산 모듈(CPU) + 입출력 모듈(IO)을 분리하는 데 성공하였다는 사실이다

     2020년도 CPU에서 크게 성공을 거둔 AMD는 해당 노하우를 GPU로 옮기게 된다

    3. AMD GPU에서 MCM의 조심스런 도입

    가. 전문가용 과학연산 GPU에서부터

     AMD는 2021년 GPU 시장 중에서 전문가용 과학연산에 특화된 그래픽카드에 먼저 MCM을 도입하기 시작한다. 이는 과거 Ryzen1X00(ZEN1)에서 사용했던 설계방식으로 GPU 모듈(Chiplet) 2개를 자사만의 초고속 데이터 버스(Data Bus)인 인피니티 패브릭(Infinity Fabric)으로 연결한 것이다. 이는 AMD Instinct MI200(CDNA2.0) 제품으로 나왔는데, 과거의 Dual-Chip구조와는 다르게 Windows/Linux 상에서 GPU는 하나로 인식되며 연산유닛과 메모리는 합쳐진 것으로 동작하였다

     경쟁사에 비하여 안정성/연구개발용 소스가 부족하나 압도적인 연산 능력과 가성비AMD는 이 MI200을 많은 슈퍼컴퓨터 제조사에게 팔아 치웠다. 개인/소규모에는 불안정한 MCM GPU이나 대규모 기업에서는 그야말로 가성비였던 것이다. 또한 출시된 이후 1년동안 AMD는 이 설계방법이 안정적이라고 판단한 것으로 보인다 

    나. 일반사용자용 게이밍 GPU까지

     AMD는 드디어 Ryzen3X00(ZEN2)에 도입하였던 연산모듈+IO모듈의 분리GPU에 도입하기에 이른다. 다만 차이가 있다면 GPU MCM구조에서 GPU모듈은 1개이며, IO모듈에 L3 캐시가 포함되었다는 점이다. IO모듈에 L3가 포함된 것은 나름의 이유가 있는데,

    • TSMC 5nm 공정에서 칩셋이 커지면 커질수록 생산비용이 너무 많아진다
    • GPU모듈은 기본적으로 CPU모듈보다 크다
    • GPU모듈의 L1/L2 캐시는 레이턴시(지연시간) 때문에 놔두더라도, L3 캐시는 빼내는 것이 유리하다
    • IO모듈로 L3를 빼는 대신 용량을 늘리면, 안 빼고 용량이 작은 것보다 유리하다

     그래서 AMD는 NAVI33은 안정적인 기존의 단일칩 구조로 출시하는 한편, NAVI31/32는 MCM구조로 출시하게 된 것이다. 이에 따라 NVIDIA 대비 저렴한 생산비용은 당연한 것이다

     또한 현재는 GPU모듈이 1개로 구성되어 있으나, 만약 RX7800XT/RX7900XT가 성공하게 될 때 2개/4개로 늘리는 구성도 고려할 수 있기에 시장에서의 첫 시도로는 현재 구조(1GCD + 4/6MCD)가 적당하다

    4. AMD가 넘어야할 큰 장벽

    가. AMD는 그래픽 드라이버에서 항상 NVIDIA보다 못하였다

     분명한 것은 AMD의 OpenGL은 NVIDIA의 CUDA 보다 전문가용 GPU 지원능력이 부족하기 때문에, 대부분의 중소규모의 연구실에서는 무조건 NVIDIA를 사용하고 있다. 이는 AMD의 지원여력 자체가 부족한 것을 여실히 드러낸다. 대기업부터는 자체적으로 문제를 해결할 수 있기에 큰 문제는 아닌 것으로 보인다

     게이밍 최적화에 있어서 AMD 그래픽카드는 성장형이라고 불리우지만 사실은, 출시 때에 제 성능을 내지 못하는 재활형 그래픽카드라는 오명을 벗기가 힘들다. 물론 GPU 개발인력이 NVIDIA의 1/10~1/30이라고 하지만 개인 소비자 입장에서는 이를 고려할 이유가 딱히 없다

      위의 두 가지 여건을 고려할 때, 새로이 도입한 개인소비자용 MCM 구조 GPU의 성능 최적화와 오류 해결이 얼마나 일찍, 얼마나 잘 되느냐에 따라 시장에서의 성공이 달려있다. 만약 이전처럼 NVIDIA를 그저 따라가는 수준의 드라이버를 제공한다면 아무리 성능이 좋아도 사용자가 구매할 이유는 없을 것이다

    나. MCM 구조에 따른 성능하락 최소화

     비용을 고려하지 않을 경우, 당연하게도 연산유닛 128개의 GPU가 연산유닛 64X2의 MCM GPU보다 성능이 좋다. 만약 이번의 새로운 시도에서 MCM구조에 따른 성능하락이 10%를 넘어 20~30%에 달한다면 기껏 MCM구조로 생산단가를 줄여놨는데, NVIDIA의 단일칩의 성능에 맞춰서 가격을 낮춰야 하는 불상사가 생길 수 있다

    다. MCM 칩셋 패키징 비용 최적화

     고집적 반도체를 패키징 할 수 있는 업체는 많지 않다. 아마도 TSMC의 멀티 패키징 서비스를 이용하게 될 것인데, 향후 해당 서비스의 비용이 과도하게 오르지 않도록 관리해야 한다. 어이없게 패키징 비용이 너무 비싸지면 MCM 구조의 장점은 사라진다

     

    <내용 요약>
    1. MCM 구조를 처음 시도하면서, 이에 따른 그래픽 드라이버 최적화는 빨라야 한다
    2. MCM 구조에 따른 하드웨어 성능하락이 적어야 한다 (10%내외)
    3. MCM 패키징 비용은 지속적으로 최적화해야 한다

    댓글

Designed by Tistory.