[IT동아 남시현 기자] AMD가 FPGA(Field programmable gate array, 프로그래밍을 지원하는 반도체) 대신 ASIC(Application Specific Integrated Circuit, 주문형 반도체)를 기반으로 하는 미디어 가속기, 알베오 MA35D(Alveo MA35D)를 선보인다. 미디어 가속기는 비디오 프로세싱 및 스트리밍 등에 사용되는 데이터 서버용 하드웨어며, 미디어 가속기에 5나노 공정 기반의 ASIC 반도체가 탑재되는 것은 업계 최초다.
FPGA는 특수한 하드웨어 기술 언어를 통해 모든 신호를 실시간으로 변경·처리하는 반도체로, 투입하는 작업과 용도에 맞춰 논리를 구축해서 사용한다. 반면 ASIC은 특정 목적에 맞춰 설계된 집적 회로로, 특정 수요와 활용도에 맞춰 구성을 설계하고 제작한다.
AMD가 FPGA 대신 ASIC를 활용한 알베오 MA35D 미디어 가속기를 출시했다. 출처=AMD
ASIC는 특정 목적만 수행하므로 전력 소모대 성능비가 우수하다는 장점이 있지만, 규모의 경제 실현이 어려워 가격대가 높다. 또한 실시간으로 논리를 수정할 수 있는 FPGA와 다르게, ASIC는 추후에 수정 및 변조를 가할 수 없다. 이 때문에 ASIC는 양산 목적의 제품보다는 군사, 우주 등 특수 목적에 주로 쓰이는데, 미디어 시장의 기술적 트렌드가 바뀌면서 FPGA 대신 ASIC가 사용됐다.
AMD, 미디어 시장 성장세에 고도의 관심
미디어 가속기는 스포츠 중계나 라이브 이벤트 중계, 원격 의료, 소셜 미디어 스트리밍, 클라우드 게이밍 스트리밍 등 영상 콘텐츠를 취급하는 데이터 서버 혹은 중계 기기 등에서 미디어를 송출할 때 활용하는 기기다. 예를 들어 넷플릭스나 유튜브 등에서 서버에 저장된 영상을 시청자에게 전달할 때 이런 미디어 가속기를 거쳐서 데이터를 전달하게 된다. 하지만 최근에는 라이브 스트리밍의 비중이 커지고, 초저지연의 중요도도 높아지고 있다.
블루웨이브 컨설팅 앤 리서치가 조사한 글로벌 비디오 스트리밍 시장 조사에 따르면, 2021년 글로벌 스트리밍 시장 규모는 601억 달러(약 79조 3천억 원)였지만, 매년 19.9%씩 성장해 2028년에는 2천131억 달러(약 281조 4천억 원) 규모의 시장으로 성장할 것으로 보고 있다. 주목할만한 사실은 2021년 재생 비디오 유형에서 기록 영상인 온디멘드 영상의 비중은 30%인 반면, 유튜브 라이브, 페이스북 라이브, 트위치 등 실시간 영상 비중이 시장의 70%를 차지하고 있다. 이미 라이브 스트리밍 데이터가 영상 콘텐츠의 과반을 넘긴 상태다.
축구 경기나 방송 등에 대응하는 전통적인 방송 스트리밍 모델. 출처=AMD
전통적인 미디어 송출 인프라는 온디멘드 영상을 전달하거나, 일대 수십~수백만 명이 동시 관람하는 스포츠 경기 등에 초점이 맞춰져 있다. 소수의 장치에서 영상 데이터가 처리되고, 클라우드 센터를 거친 뒤 각지의 콘텐츠 전송 네트워크로 퍼지고, 그다음 지역별로 형성된 에지 서버를 거쳐 분산 처리된다. 시청자가 많더라도 송출을 시작하는 단계에서는 부하가 크지 않았다.
실시간 라이브 스트리밍 등이 산개된 형태의 차세대 양방향 스트리밍 모델. 출처=AMD
하지만 사용자들의 콘텐츠 이용 추세가 화상 업무나 협업, 브이로그나 개인방송 등으로 분산되기 시작하면서 상황이 바뀌었다. 다수의 이용자가 데이터를 생산한 다음, 이것이 역으로 데이터 센터로 올라갔다가 다시 다른 지역의 이용자에게 전달된다. 한 국가에서만 수백만 명이 데이터를 생산하고 수백만 명이 영상을 시청하면서 구조적인 변화가 필요해진 것이다. 물론 미디어 가속기를 많이 사용하면 해결할 수 있지만 근본적인 해답이 아니기 때문에 인프라에 대한 구조적인 변화가 필요한 시점이다.
FPGA에서 ASIC로 전환, ‘성능은 올리고 전력 소모는 내리고’
여기서 AMD가 제안하는 방식이 바로 ASIC 기반의 미디어 가속기다. 알베오 MA35D 미디어 가속기는 AV1 및 주요 표준 인코딩 및 AV1, HEVC, H.264, VP9 디코딩을 지원하며, 인식되는 시각적 품질을 인공지능으로 끌어올리거나 일관된 시각적 품질을 유지하도록 돕는 QoS(Quality of Service, 서비스 품질) 엔진 등을 탑재한다. 또한 비디오 프로세싱 기능을 하드웨어 형태로 구현하고, 처리 파이프라인을 디코딩-확장-AI-인코딩으로 축약해 지연 시간을 더욱 줄였다.
AMD 알베오 MA35D는 FPGA 기반인 U30대비 우수한 성능 향상점을 보여준다. 출처=AMD
덕분에 이전 세대인 알베오 U30과 비교해 최대 4배 증가된 채널 밀도와 4배에 가까운 저지연 성능, 최대 1.8배 향상된 압축 성능을 갖추면서도 소비전력은 35W 수준이다. 총 열설계 전력은 50W다. 비디오 처리 스트림은 카드당 최대 32개의 1080p60, 8개의 4K60, 4개의 8K30 스트림의 채널 밀도를 제공하며, 8개의 가속기를 장착해 1U 렉(Rack) 서버당 최대 256개의 스트림을 확보한다. 아울러 통합 인공지능 프로세서와 전용 비디오 품질 엔진을 활용해 콘텐츠를 프레임 단위로 평가하고 시각적 품질을 개선하는 기능도 탑재했다.
ASIC 기반 반도체라서 비용과 소비전력은 낮추고, 성능 효율은 높아졌다. 출처=AMD
기존 FPGA 기반인 알베오 U30을 대신해 ASIC 기반 알베오 MA35D를 사용할 경우, 대규모 양방향 스트리밍에서 1080p60 채널당 전력 소모는 1와트 수준이며, AV1 트랜스코더 엔진을 통해 비트레이트를 동급 소프트웨어 구현 대비 최대 52%까지 줄일 수 있다. 이때 채널당 비용은 U30 대비 절반인 50달러 수준이다.
공개 소프트웨어 모델로 동일한 영상을 처리한 결과, 소프트웨어 구현 대비 비트레이트가 최대 52% 감소했다. 출처=AMD
H.264, H.265, AV1 등 다양한 코덱 표준에 대한 압축을 지원으로 동작 효율을 끌어올린 점도 주목할만한 성과다. 오픈소스로 활용할 수 있는 소프트웨어 모델과 MA35D에 각각 13개의 다양한 해상도 및 비트레이트 영상을 X264 매우 빠름 설정으로 전달한 뒤, 넷플릭스의 VMAF(Video Multimethod Assessment Fusion) 영상 품질 평가 알고리즘으로 BD-RATE(Bjontegaard-Delta Rate)를 비교한 결과, MA35D는 오픈소스 소프트웨어 대비 H.264 모델에서 약 24% 앞선 압축 효율을 보여주었으며, H.265와 AV1에서는 각각 47%, 52% 앞선 처리 속도를 보여주었다.
포트폴리오 쌓아가는 AMD, 시장 확장에 초점
AMD 알베오 MA35D 공개를 통해 AMD는 데이터센터용 미디어 및 엔터테인먼트 포트폴리오 구성을 더욱 탄탄히 하는 모양새다. 프로세서 측면에서는 지난해 11월 공개한 AMD 에픽(EPYC) 프로세서를 앞세우고 있으며, 올해 1월에는 CPU와 GPU를 합친 인스팅트 MI300 데이터센터 가속기를 공개하는 등 기업용 GPU 시장 확장도 노리고 있다. FPGA가 세대인 미디어 가속기를 ASIC로 전환하는 것 역시 시장 변화에 발을 맞추고 선점하기 위한 노력이다. AMD 알베오 MA35D는 현재 샘플을 공급하고 있으며, 2023년 3분기 중에 생산이 시작될 예정이다. 제품 공식 출시가격은 32배 1080p60 스트림을 지원하는 제품 기준 1천595달러(약 210만 원대)다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.