
Inside the Scorpio Engine: the processor architecture deep dive(Eurogamer)
다음 엑스박스를 구동하는 칩이 어떻게 만들어졌는가 살펴본다
편집자 주: 이것은 하드코어 매니아를 위한 것이다. 우리는 이미 프로젝트 스콜피오의 하드웨어 스펙을 폭넓게 다룬 바 있으며, 우리가 실제로 본 것에 대한 심층분석도 올렸다. 하지만 우리가 알고 있는 모든 걸 알고 싶어하는, 디테일에 굶주린 이들을 위해 이 글을 작성하였다. 우리는 내일 제품판 콘솔의 제작에 대해서도 내일 비슷한 기사를 낼 것이다.
프로젝트 스콜피오의 새 프로세서의 설계자들과 이야기를 나눌 때 되풀이된 테마는 바로 커스터마이제이션이었다. 공평성을 기하자면 플레이스테이션4 시스템 아키텍트인 마크 써니도 작년 PS4 프로에 대해 논할 때 거의 같은 점을 지적했다. "AMD를 불러다가 이거, 이거, 이거를 쓰고싶다는 식으로 이뤄지는 게 아닙니다." 엑스박스 코어 플랫폼의 그룹 프로그램 매니저인 케빈 갬밀이 말했다. "훨씬 많은 구체적인 커스텀 작업이 투입되는 것입니다."
물론 스콜피오의 SoC에 들어가는 다양한 부속과 블럭들의 기본 하드웨어 디자인은 AMD가 이미 가진 기술에 기반한다. CPU 기술은 MS가 더잇아 재규어 아키텍쳐라고 부르고 싶지 않다고 할 정도로 커스텀 되었다고 하지만, 분명히 재규어가 설계의 시작점이다. 마찬가지로, 스콜피오의 라데온 그래픽 코어는 AMD의 최신 폴라리스 아키텍쳐에서 기능들을 가져왔다. 하지만 PC용 제품과 동일한 것은 아니다. 우리는 PS4와 엑스박스원의 상대적으로 PC용 부품과 비슷하던 GPU 설계에서 더 멀리 나오게 되었다.
"완전히 독자적인 디자인입니다...이런 걸 다른 데서는 살 수 없을 겁니다. 우리는 AMD와의 협업으로 이를 만들어내었고, 스콜피오에만 쓰이는 좋은 물건입니다." 실리콘 엔지니어 닉 베이커가 말했다.
"몇가지 고차원적인 기준과 목표이 있었는데, 간단히 말하자면 우리는 가장 강력한 4K 게이밍 콘솔을 원했습니다. 다른 핵심영역은 엑스박스원 및 엑스박스원S와 완전한 하위호환이며, 또한 엑스박스360 호환성과 같이 기존 기종에 추가한 기능들을 유지하는 것이었습니다. 우리가 어떻게 지금의 아키텍쳐에 도달하게 되었는지 살펴보기 전, 이것들이 가장 중요한 목표였다는 걸 먼저 염두해두시기 바랍니다." 베이커가 말을 이었다. "우리가 유지하고 싶었던, 그리고 확장하고 싶었던 엑스박스의 차별화요소는 CPU/CPU의 밸런스, GPU 가상화 지원, 공간오디오를 위한 프로세싱이었습니다. 우리는 강력하고 유연성 있는 영상출력을 통해 가령 1080p에선 슈퍼샘플링을 할 수 있고, 게임DVR 기능도 유지하는데 그치지 않고 향상시켰습니다."
거대 칩 제조회사 TSMC에서 실제로 만들어지기 수년 전부터 엑스박스 팀은 광범위한 시뮬레이션과 분석을 실시했다. 프로젝트 스콜피오는 실질적으로 중간세대 리프레시-기존 콘솔을 4K 스크린에 맞도록 향상시키는-이며, 기존 게임들은 PIX(엑스박스 퍼포먼스 분석기, Performance Investigator for Xbox)를 거쳐서 AMD로 실제 일이 넘겨지기 전부터 가상의 하드웨어에서 어떻게 돌아갈지 시험될 수 있었다.
"우리는 퍼포먼스 목표와 하위호환, 그리고 설계를 제대로 했는지 확인하기 위해 시뮬레이션을 하고 싶었습니다." 닉 베이커가 말했다. "사내에 완전한 디자인 데이터베이스를 구축했습니다. 시뮬레이션을 원활하게 해줄 몇가지 하드웨어 에뮬레이터도 있습니다. 일반적으로 보통 시뮬레이터에서는 1Hz, 혹은 초당 한번 연산이 처리됩니다. 이것들이 이제는 0.5Mhz, 초당 50만회 가능해졌습니다. 몇달동안 이런 시뮬레이션을 24시간 일주일 내내 가동했고, 100조 사이클 정도는돌았을 겁니다. 이걸 달성할 수 있다는 것 자체가 대단한 일이죠. 온전히 MS 내에서 디자인 된 부품들이 존재합니다. 그리고 MS 엔지니어가 이 회로를 AMD에 통합시켜달라고 건내는거죠."
리치가 프로젝트 스콜피오의 최종 스펙을 전반적으로 다룬다.

우리는 모든 타이틀을 여러번 PIX에 투입했고 에뮬레이터에서 구동했습니다." 그래픽 전문가 앤드류 구센이 말했다. 이 과정은 스콜피오의 하위호환 성능을 평가하는데 더없이 값진 것으로 드러났다. "3만회 이상의 에뮬레이터 구동을 했는데, 이는 닉이 말했던 전체 시뮬레이션 횟수에 큰 분량을 차지하게 되었죠. 우리는 엑스박스원과 100% 호환성을 달성하고 싶었기 때문입니다."
스콜피오의 핵심 하드웨어 설계 프레젠테이션을 더 깊이 파고들면서, 칩의 기본 레이아웃이 회의실에 나타났다. 전체 설계를 구성하는 60개의 레이어 중 2개만 보여졌지만, 전체 프로세서의 전반적인 면모를 보여주었다. 360mm^2 사이즈로, 이는 엑스박스원과 매우 비슷하지만 구조는 매우, 매우 달랐다. 28nm 공정에서 TSMC의 16nm FinFET으로의 전환, 그리고 ESRAM의 부재가 큰 변화를 이끌었다. 같은 면적에 더 많은 부품과 4묶음의 라데온 CU이 들어갔다. GPU 블럭 왼쪽에, 훨씬 작아진 2개의 쿼드코어 CPU 블럭은 오른쪽에 아주 적은 면적만 차지하였다. CPU의 전체 L2 캐시는 4MB이다.
"우리는 설계 측면에서 CPU에서 달성해야 하는 게 무엇인지 알아내려고 상당한 시뮬레이션을 해야 했습니다." 베이커가 말했다. "완전한 커스텀 CPU 디자인은, 그냥 '이걸 졸라 쎄게 해주세요' 라는 식으로 되는 게 아닙니다. 그런 식으로 하다가는 높은 확률로 어딘가에서 부작용과 마주치게 되어있죠. 우리는 우리가 실제 원하는 걸 달성하고 싶었습니다."
프레젠테이션이 이 단계에 와서야 진정한 하드코어 유저들의 희망은 이뤄지지 않을 거란 게 분명해졌다. 프로젝트 스콜피오엔 라이젠 기술이 들어가지 않는다. 스케쥴, 비용, 다이의 면적, 그리고 두말할 것도 없이 작년 MS가 8코어일 거라고 못박은 점에서 라이젠은 현실성이 없었다. 그래도 희망은 GDC의 라이젠 부스에 나타난 스콜피오 등으로 이어졌다.
"CPU 측면에서 우리가 실시한 커스텀 만으로 목표치를 달성할 수 있었습니다. 결국 엑스박스는 대중상품입니다. 소비자들이 사고싶어하는 가격대를 맞춰야 합니다. 가격과 성능의 밸런싱이 문제이죠." 케빈 갬밀이 말했다.
하드웨어 기술이 얼마나 진보하든 간에, 결국 '돈 쓴 만큼 나온다'는 격언은 새 콘솔 프로세서의 물리적 측면에서 중대한 요인으로 남아있다는 걸 상기시켜 주었다. MS 설계자들은 엑스박스원의 기존 커스텀 디자인과 작별하고, 분명한 성능향상을 얻을 수 있는 부분에 집중하기로 하였다.
"CPU에서 일반적으로 가장 중요한 것은 주파수와 메모리 레이턴시입니다. CPU가 데이터를 갖고 있다면 빠르게 돌릴 수록 더 빨리 결과가 나옵니다. 하지만 데이터가 없다면 앉아서 놀게 되므로, 레이턴시가 큰 역할을 합니다. 주파수 면에서 우리는 2.3Ghz까지 올렸습니다." 베이커가 설명했다. "레이턴시 측면에서, 우리가 파고든 것 중 하나는 메모리 인터페이스의 반환대기였으며, 우리는 이를 더 빠르게 만들었습니다. 더 구체적으로는 우리가 가상화 OS 환경이기 때문에 코어 내에서 메모리 변환 과정을 최적화하고 싶었으므로 그 부분에서 개선이 이뤄졌습니다. 그 결과 CPU는 더 빠를 뿐만 아니라 더 효율적으로 돌아가므로, 더 나은 체감성능을 줄 것입니다."

스콜피오의 엔진. 왼쪽에 전원부가 있다. MS는 효율을 위해 각 프로세서 별로 독자적으로 전원을 조절하였다.
개선사항 목록에 덧붙여, MS는 GPU의 속도를 향상시키고 CPU의 업무를 분산하도록 하여 CPU/GPU 밸런스 면에서도 향상시켰다. 특히 DirectX 12 엔진에서 말이다. 하지만 스콜피오 엔진의 레이아웃을 보면, GPU 영역이 CPU를 압도하는 걸 알 수 있다. GPU의 비율은 엑스박스원이나 PS4보다 훨씬 크다.
"스콜피오에는 4개의 쉐이더 엔진이 있으며, 각각 10개의 CU를 가집니다." 베이커가 설명했다. "AMD의 설계는 SE, CU, 렌더백엔드 드으이 숫자에 큰 유연성을 줬습니다. 그리고 우리는 이를 무작정 늘리기보다는 한계 내에서 최선의 선택을 알아내야 했습니다...그 외에도 60개 혹은 그 이상의 목표나 커스텀이 있었습니다. 메모리 사이즈, 대기열 사이즈, 하위호환을 가능한 잘 돌아가게 만들기 위한 기능들 같은 것들요."
사실 각 쉐이더 유닛에는 11개의 컴퓨트 유닛이 들어간다. 하지만 각 SE에서 한개의 CU는 비활성화 되어있다. 덕분에 약간의 불량으로도 최종 제품을 만들 수 있는 것이다.(완전히 활성화된 칩은 개발자용 킷에만 들어간다.) 스콜피오 엔진의 GPU는 UHD 텍스쳐로 4K 렌더링을 목표로 했으며, HDR과 광색역 지원도 포함하였다. MS의 기본 원칙은 개발자들로 하여금 하드웨어의 완전한 성능을 가능한 쉽게 활요하게 하자는 것이다.
"이 원칙은 모든 부분에 반영되었습니다. 우리가 개발자들에게 나눠준 개발킷에서도, 퍼포먼스 목표에서도 이를 눈치챌 겁니다. 우리는 개발자들이 진정한 4K 퀄리티를 가능한 쉽게 구현하도록 하고 싶습니다." 앤드류 구센이 말했다. "다른 원칙은 기능 측면에서 부담을 최소화하자는 것이었습니다. 개발자들로 하여금 새 콘솔에만 존재하는 이상한 기능을 이용해야 퍼포먼스를 얻을 수 있도록 하고 싶지 않았습니다. 우리의 원칙은 개발자들이 스콜피오의 성능과 퍼포먼스를 최대한 쉽게 발휘하는 것입니다."
하위호환성의 기준은 엑스박스원에 맞춰졌으나, 소니의 PS4 프로와 마찬가지로 MS는 최신 라데온 아키텍쳐의 기술을 활용할 기회가 있었다. 두 플랫폼 홀더의 커스텀 디자인에는 몇가지 공통점도 있지만, 차이점도 많다.
"우리는 스콜피오에 폴라리스를 선택했습니다. 큰 개선점 중 하나는 델타 컬러 컴프레션으로, 4K 텍스쳐와 렌더링 양쪽에 대역폭을 졀약해 가능하게 해줍니다." 구센이 말했다. "DCC는 개발자들이 사용하기 매우 쉬우며, 그 외에도 지오메트리나 쿼드 스케쥴 개선과 같은 폴리리스 기술도 들어갔습니다."
구센에 따르면, 스콜피오의 설계에 출시 예정인 AMD 베가의 기술들도 일부 들어갔지만, PS4 프로에는 있는 2배속 FP16 프로세싱 같은 것들은 빠졌다고 한다. 하지만 다른 부분에서 대신 커스텀이 들어갔다. MS의 DX12 대응 GPU 커맨드 프로세서는 엑스박스원 개발자들에게 큰 이득을 주었으며, 스콜피오에선 더 확장되었다.
"GPU에 더 많은 일을 시킴에도 불구하고, 사실 우리 GPU는 더 빨라졌습니다. 이렇게 생각할지도 모릅니다. '오, GPU에 더 많은 명령을 보낸다고? 그럼 GPU가 느려질텐데' 커맨드 프로세서가 드로우콜에 병목에 걸리는 경우는 매우 드뭅니다. 그리고 심지어 드로우콜에 병목이 걸린다 하더라도, 전용유닛이 들어가면서 GPU의 효율은 더 나아졌습니다. 특별히 크고 복잡한 인터페이스가 필요하진 않습니다. 그저 커맨드 프로세서 자체에 회로를 추가함으로써, 드라이버에서 가능한 것보다 더 많은 최적화를 일궈냈습니다."
기존 엑스박스원 타이틀의 심층분석은 하위호환 면에서도 득을 보게 되었다.
기존 타이틀들이 스콜피오에서 어떻게 더 잘 돌아가게 될지 이 영상을 보라.
하지만 현세대 타이틀을 4K로 구동하게 한다는 프로젝트 스콜피오의 존재의의가 실리콘 설계에 가장 큰 영향을 미쳤다. 일반적으로 플랫폼 홀더가 하드웨어를 만들면, 개발자들이 최선의 활용법을 찾아야 했다. 이번에는 MS가 게임엔진을 스콜피오에서 돌아가는 상황을 프로파일링하고 컨텐츠에서 최선의 최적화를 일궈낸다.
"우리는 최고의 타이틀들을 PIX에 투입해 분석했습니다." 구센이 말했다. "그 후 전수작업으로 우리는 특정 게임이 4K 해상도를 구현하는데 어떤 작업이 필요한지 분석해낼 수 있었습니다. 우리는 모든 게임에 그저 단순한 업스케일을 적용하고 싶지 않았습니다. 제대로 스케일링 되지 않는 여러 중간 렌더링들이 있기 때문이죠. 그리고 DCC와 같이 자동적으로 처리되는 것들도 정리했습니다."
최종 제품에 들어갈 라데온 GPU 아키텍쳐는 여러 옵션이 있었고, 이 프로파일링 데이터로 무장함으로써 구센과 그의 팀은 AMD에 목표 스펙을 가져가기 전에 예상 설계에서 코드를 효과적으로 테스트할 수 있었다.
"이제 우리는 모든 인기 엑스박스원 타이틀의 모델을 갖고서 CU 갯수, 클럭, 메모리 대역폭, 렌더백엔드 갯수, SE 갯수, 캐시 사이즈 등을 바꿔가며 테스트할 수 있었습니다. 설계를 바꿔가며 무엇이 가장 최적화된 구성일지 알아낼 수 있었죠. 이는 하드웨어에서 트레이드오프를 할 때 대단히 가치있는 것이었는데, 궁극적으로 이 엑스박스원 타이틀들이 우리가 4K로 돌리고 싶은 것들이기 때문입니다."
최종 스콜피오 하드웨어는 이 퍼포먼스 목표를 6테라플롭의 렌더링 파워로 달성하였다. 그리고 우리가 여태껏 보아온 어떤 AMD 기술의 콘솔 하드웨어보다 높은 주파수의 GPU가 명백히 드러났다.
"제가 보기에 여기엔 두가지 환상적인 장점이 있습니다. 알다시피, 클럭은 파이프라인의 여러 부품들을 동시에 가속시키기 때문에 전체 성능을 향상시킵니다." 앤드류 구센이 말했다. "클럭 향상은 새로운 병목이나 밸런스 문제 없이 성능을 향상시킵니다. 두번째는 높은 클럭 덕분에 CU 갯수를 줄일 수 있어서 면적을 아낄 수 있다는 것입니다. 다이 면적 절감은 매우 중요한 고려사항이었습니다. 엑스박스원은 853Mhz였으며, 스콜피오는 1172Mhz에 달합니다. 클럭 면에서 37%의 향상인데, CPU 클럭 향상분보다 더 크죠. 그리고 또 큰 게 있습니다. 이젠 CU가 40개지요. 1172*40*64에 한번에 2플롭이 처리되니까 정확히 6테라플롭이 됩니다."
엑스박스원과 비교해, 쉐이더 엔진은 2배가 되었으며, 클럭향상과 합쳐저 삼각형 및 버텍스 성능은 2.7배가 되었다. GPU의 L2 캐시는 4배 늘어났으며, 이것도 4K 퍼포먼스를 위한 것이라고 구센은 말했다.
"이런 하드웨어적 개선도 큰 부분이지만, AMD 아키텍쳐와 우리 게임들이 구동되는 것을 더 잘 이해하게 된 것에서도 득을 보았습니다. 우리는 이 깊은 파이프라인들을 구성하는 대기열, 버퍼, 캐시, FIFO를 분석할 수 있었고, 어디서 병목이 생기는지 발견하여 그 작은 부분만 개선함으로써 큰 효과를 볼 수 있었습니다. 이는 우리의 분석과정에서 매우 큰 초점이었으며, 수년 간 엑스박스원의 퍼포먼스를 살펴본 결실입니다."

엑스박스 팀은 4K 게이밍에 300GB/s이 필요했고 그에 따라 384비트 인터페이스와 12GB의 GDDR5에 도달했다.
분명 PC에서는 GPU 퍼포먼스는 대역폭과 함께 올라가는 경향이 있다. 더 강력한 처리성능이 발휘되려면 더 빠른 메모리가 필요하다. 이 부분은 소니가 PS4 프로를 만들면서 제약받은 부분이기도 하다. 8GB 메모리를 고수함으로써, 대역폭을 향상시키면서도 호환성을 유지할 방법은 메모리 클럭을 올리는 것 뿐이었다. 컴퓨트 성능이 2.3배가 되었지만, 대역폭은 겨우 24%만 나아졌다. 스콜피오에서 MS는 DDR3와 ESRAM의 조합을 버리고 GDDR5로 이행했다.
"4K를 위해선 텍스쳐가 커지며, 렌더 타겟도 더 커집니다. 이것은 두가지를 의미합니다. 더 많은 용량, 그리고 더 큰 대역폭입니다." 닉 베이커가 설명했다. "문제는 얼마나이죠. 우리는 이렇게 좋은 GPU를 만들고 메모리에 굶주리게 하고싶지 않습니다. 앤드류가 얘기한 그 모든 분석들에서 우리는 여러 다른 메모리 대역폭의 영향을 볼 수 있었으며, 재빠르게 300GB/s 이상이 필요하다고 결론내렸습니다. 결국 우리는 326GB/s로 결론지었죠. 스콜피오는 384비트 GDDR5 인터페이스를 씁니다. 12채널에 각 채널은 32비트이며, 6.8Ghz의 주파수로 이를 곱하면 326GB/s이 나옵니다.
베이커는 이런 변수들을 고려할 때 스콜피오가 탑재해야할 메모리 용량은 뻔하며, 우리의 E3 2016 스콜피오 예상에서도 같은 논리로 12GB일 것이라고 결론내렸다. 4GB는 시스템용(현재의 3GB에 추가 1GB는 4K 대시보드용이다), 8GB는 개발자들에게 남겨진다. 엑스박스원의 5GB보다 크게 늘어났으며, PS4 프로보다도 많다.
"메모리 인터페이스 자체만이 아니라 데이터가 메모리 인터페이스에서 처리장치로 효과적으로 이동하도록 만들어야 합니다." 베이커가 덧붙였다. "이미 CPU 레이턴시에 대해서 말했지요. 하지만 실시간 영상 출력을 할 때 다뤄야 하는 다른 영역들도 있으며 그곳들이 문제가 생기지 않도록 해야합니다. 그래서 대역폭을 효과적으로 뽑아내기 위해 칩 내에서 일어나는 일들을 면밀히 살폈습니다. 또한 렌더타겟과 텍스쳐가 더 커지면서 GPU의 페이지 테이블도 조정했습니다."
"우리는 이 메모리 구성이 매우 마음에 드는데, 4K 렌더 타겟과 4K 텍스쳐라는 두가지 과제를 해결했기 때문입니다. 다른 옵션들도 검토했지만 384비트 12GB가 제일 적절했습니다." 구센이 말했다.
"그리고 DCC도 있죠." 베이커가 덧붙였다.
ESRAM은 엑스박스원에서 스콜피오의 GDDR5로 가면서 남겨지게 되었지만, 32MB의 ESRAM이 레이턴시 면에서는 더 유리하다는 점은 분명한 사실이다. 하지만 새 설계의 밸런스가 그 문제도 해소한다.
"우리 메모리 시스템은 ESRAM을 커버하기 충분한 대역폭입니다." 베이커가 말했다. "우리는 단순히 가상 메모리 시스템에 32MB의 물리주소를 할당하여 오래된 게임들이 이를 사용하게 만듭니다. 레이턴시는 분명 ESRAM보다 높지만, 전체 퍼포먼스 면에서 향상된 대역폭과 GPU 퍼포먼스 덕분에 어떤 문제도 생기지 않을 겁니다."

포르자 모터스포츠 같은 퍼스트파티 게임의 초기 성과를 통해 MS는 스콜피오가 목표치를 상회했다고 생각한다. 더 많은 게임이 나오면 시간이 답해줄 것이다.
또한 SoC에는 엑스박스원의 오디오 처리 블록이 호환성을 위해 여전히 남아있지만, 더 강화되어 돌비 애트모스 애트모스 헤드폰, 그리고 MS의 윈도우 소닉 포 헤드폰 같은 기술들을 처리할 수 있게 하였다. 새 스콜피오는 또한 AMD의 최신 GPU 가속 미디어 하드웨어도 가져왔다. 게임 DVR은 4K 60fps 녹화를 지원하며, HEVC 인코딩은 같은 비트레이트에서 더 높은 품질을 약속한다. 게임 DVR의 HDR 지원은 심지어 외부 캡쳐장비보다 우위에 있다. 적어도 지금은 말이다.
"스콜피오는 게임 DVR에서 4K60 체험을 높은 비트레이트로 온전히 녹화할 수 있습니다." 앤드류 구센이 말했다. "고품질로 기기에서 재생할 수도 있고, 유투브로 올릴 때는 자동으로 트랜스코드 되어 H.264로 올라가게 됩니다. 우리는 또한 HDR 녹화도 지원해서 완전한 HDR 체험을 즐길 수 있도록 했습니다. 게임기 자체만이 아니라 더 많은 플랫폼에서 제대로 볼 수 있는 것입니다. 엑스박스원S 유저들도 스콜피오의 HDR 녹화를 볼 수 있으며, 이를 통해 업계가 HDR 비디오로 진전하길 바랍니다."
프로젝트 스콜피오의 설계 목표는 두가지 구체적인 목표로 압축될 수 있다. 900p 및 1080p 엑스박스원 타이틀을 네이티브 4K로 스케일업 하는 것이다. 사실 이는 작년 E3에서 MS가 약속한 것보다 더 나아진 것으로, 당시에는 엑스박스원용 1080p 타이틀을 4K로 돌릴 수 있을 것이라고 했다. 이제 그 범위는 더 넓어져서, 900p 타이틀들도 가능해졌는데, 이는 PS4 1080p 타이틀을 4K로 올리는 것과 같은 수준이다.
"우리는 (1080p 엑스박스원 게임을) 풀 네이티브 4K에 안정적인 해상도로 돌리고 싶었으며, 거기에 해상도 이상의 비주얼 향상도 추가할 수 있도록 했습니다." 앤드류 구센이 말했다. "그 다음 목표는 900p 게임을 네이티브 4K로 돌아가게 하는 것이었습니다. 초기 900p 게임들은 성능을 충분히 발휘하지 않았기에 2160p로 무난하게 올릴 수 있었습니다. 다른 게임들은 일반적인 콘솔 최적화보다 더 많은 작업이 필요했지만, 그래도 900p 게임을 2160p로 돌리고 싶었습니다."
엑스박스팀은 이런 계산을 통해 표준화된 제안을 내놓았지만, 이를 활용하는 것은 개발자들의 자유이다.
"모든 게임, 모든 개발자들이 서로 다릅니다. 개발자들이 자신들의 게임에 가장 효과적인 방법을 가장 잘 압니다." 구센이 설명했다. "개발자들이 다른 기법을 이용한다고 해도 우리는 아주 만족합니다. 스콜피오에는 체커보딩 기법을 효과적으로 해줄 하드웨어가 있습니다. 만약 개발자들이 체커보딩을 쓰려고 한다면, 그것도 좋습니다. 또한 몇몇 개발자들은 체커보딩보다 TAA로 업스케일 하는 걸 선호한다고 하더군요. 그것도 좋습니다. 우리는 어떤 강요도 하지 않습니다."
턴10 스튜디오에서 프로젝트 스콜피오에 대해 본 것에 대한 리치의 심층 비디오 리포트
하지만 PS4 프로와 마찬가지로 MS도 개발자들에게 엑스박스원 버전과 동일 혹은 더 나은 프레임을 구현하라는 요구조건은 있다. 그리고 고프레임 혹은 고해상도 모드는 TV 사양과 무관하게 모든 게이머들이 선택할 수 있어야 한다.
"개발자들은 여러 해상도를 지원하는데 아무 문제가 없지만, 게이머들에게 선택할 수 있게 해야합니다. 개발자들의 디폴트가 있겠지만, 다른 것으로 바꿀 수 있도록 물어도 보아야합니다." 구센이 말했다. 물론 이는 좋은 소식이지만, 우리의 추가적인 희망은 개발자들이 게임 중 설정을 바꿀 수 있게 하는 것이다.
"스콜피오 대응 측면에서 저는 상당히 다양한 경우를 만나리라 예상합니다. 엑스박스원에서 1080p인 게임이 4K 네이티브로 가는 대신 체커보딩을 쓰고 남는 GPU 파워를 퀄리티를 높이는데 쓴다고 해도 놀라지 않을 겁니다." 구센이 이어갔다.
"오늘날 매우 소수의 720p로 돌아가는 타이틀들이 있는데, 이들은 체커보드로 4K로 올리리라 예상합니다. 또한 지금 엑스박스원에서 900p 30fps인 타이틀들이 CPU의 31% 클럭향상과 D3D12의 분담으로 1080p60까지 최적화될 수도 있습니다. 모든 건 개발자에게 달렸습니다."
MS는 스콜피오가 하드웨어 레벨에서 지원하는 체커보딩 기술에 대해 너무 깊게 말하려 하진 않았다. 하지만 앤드류 구센은 스콜피오의 GPU가 깊이와 ID 버퍼는 풀해상도로 구현하면서, 컬러 버퍼는 절반으로 구동하는 확장기능이 있다고 말했다. 작년 마크 써니와의 대화를 바탕으로 본다면 PS4 프로와 일맥상통하는 면이 있지만, 커스텀에서의 차이는 있으리라 예상해본다. 양자가 모두 AMD와 일하긴 하지만 우리는 소니나 MS 어느 쪽도 실제 하드웨어가 공개되기 전엔 상대방이 무얼 하는지 알 수 없다고 들었다.
프로젝트 스콜피오는 가변주사율 디스플레이를 지원한다. 중요한 미래 디스플레이 기술이다.
분명한 것은 두 회사가 매우 다른 컨셉을 갖고 있다는 것이다. 소니는 하드웨어 레벨에서 체커보딩 지원을 크게 강화했는데, 사실 다른 방법이 없었기 때문이다: 2.3배의 컴퓨트 향상과 약간의 메모리 대역폭 개선으로는 네이티브 4K AAA 타이틀은 불가능했다. MS의 초점은 분명 더 높은 네이티브 해상도에 있다. 그 종착점이 메모리 대역폭과 프로세싱 파워, 그리고 그들의 커스텀 설계이다.
하지만 그 커스텀들이 스콜피오를 커스텀되지 않았지만 같은 테라플롭인 PC 하드웨어에 비해 어느정도 향상을 가져오는지는 알 수 없다. 그게 바로 우리가 프레젠테이션 후 물어보았던 질문이다.
"우리 퍼포먼스 분석과 모델링이 전체 최적화와 디자인 조정 과정을 좌우했기 때문에, 구체적으로 말할 수는 없습니다." 앤드류 구센이 말했다. "우리는 모델에 상상할 수 있는 모든 조건들을 넣었습니다. 하지만 '테라플롭에서 더 많은 것'이라고 묻는다면, 저는 스콜피오가 PC에 비해 상당한 퍼포먼스 이점을 가진다고 말하고 싶습니다."
"첫째, MS는 쉐이더 컴파일러에 꾸준한 개선을 이뤄왔습니다. 우리는 PC의 같은 쉐이더에 비해 엑스박스원에서 큰 개선을 이루어냈습니다. 둘째, '메탈' API와 쉐이더 확장기능들이 개발자로 하여금 PC 그래픽카드에선 불가능한 최적화를 가능하게 해줍니다. 마지막으로, PIX는 로우레벨 분석을 제공하며 이를 통해 '메탈'을 이용해 개발자들이 콘솔 GPU에서 최대한 끌어낼 방법을 알려줍니다. 이런 기술들은 이미 성숙되었으며 개발자들에게 친숙하므로, 스콜피오 게임은 출시 즉시 혜택을 볼 것입니다."
이미 우리는 이 접근법의 결과물을 포르자 모터스포츠를 통해 목격한 바 있다. 데모는 더 고성능인 엔비디아 GPU와 동급의 안정적인 4K로 구현되었지만, 그래도 매우 짧은 한순간의 비교에 불과했다. 서드파티 타이틀이 스콜피오로 나오기 시작하면 우리는 개발자들이 프로세서의 성능을 활용하기 얼마나 쉬운지 더 잘 알게 될 것이다. 그 때가 되면 우린 완전한 분석을 갖고 돌아올 것이다.
우리는 엑스박스 본부의 독점 브리핑을 통해 프로젝트 스콜피오에 대해 들었다. MS가 교통과 숙박비를 지불하였다.
덧글
라데온은 전통적으로 ROP 갯수가 딸려서 문제입니다. 보통 동급 지포스의 1/2 정도만 들어갑니다. 이 문제가 계속 지적되는데도, 지포스만큼 안 늘리는 까닭을 모르겠습니다. 플스4프로와 스콜피오 둘 다 ROP는 안 늘린 듯 합니다.
탓이라 보는 사람이 많습니다. 2/3 까지만 늘려도 지금보다 나아질 겁니다.