‘연 단위 출시, 네트워크 대역 확장’ 인공지능 가속기 경쟁 달아오른다

IT동아

2024.06.04 22:04:55

조회 175 추천 0 댓글 0

[IT동아 강형석 기자] 인공지능 가속기 경쟁이 뜨거워진다. 엔비디아와 AMD가 신제품을 주기적으로 투입, 기업의 인공지능 학습ㆍ추론 수요에 대응하기로 입을 모았기 때문이다. 심지어 폭발적으로 증가하는 인공지능의 데이터 처리량을 처리하기 위한 네트워크 시스템 구축 경쟁도 함께 이뤄질 전망이다. 단순히 보면 인공지능 장비를 시작으로 넓게 보면 데이터센터 인프라 전반에 걸친 경쟁이 시작되는 것이다. 여기에 가우디 제품군으로 경쟁을 선언한 인텔까지 가세할 경우 경쟁은 과열될 가능성이 높다.

인공지능 시장을 놓고 반도체 기업이 치열한 경쟁을 펼칠 예정이다. / 출처=IT동아

2024년 6월 2일, 엔비디아는 컴퓨텍스 2024를 앞두고 기조연설을 진행했다. 젠슨 황 엔비디아 최고경영자(CEO)는 자사의 인공지능 시장 리더십을 강조했다. 동시에 인공지능 가속기와 관련한 청사진까지 제시했다. 현재 시장의 인기를 얻고 있는 호퍼(Hopper) 플랫폼의 뒤를 이어 블랙웰(Blackwell), 그리고 그 다음 플랫폼인 루빈(Rubin)까지 공개했다. 그 사이에는 ‘울트라(Ultra)’로 명명된 성능 개선 제품군을 투입한다는 계획도 언급했다.

AMD도 마찬가지다. 2024년 6월 3일에 진행한 기조연설에서 리사 수 AMD CEO는 현행 인스팅트(Instint) MI300X에 뒤를 이어 올해에는 MI325X를 선보이고 이어 MI350과 MI400 등을 차례로 선보인다. MI300 계열 제품의 성능을 꾸준히 높이고 2026년에는 새로운 반도체 설계 구조를 앞세워 세대교체를 이뤄가는 식이다.

인텔은 가우디 인공지능 가속기로 시장을 공략한다. / 출처=IT동아

인텔은 2024년 6월 4일에 진행한 2일차 기조연설에서 가우디 인공지능 가속기의 ‘경제성’을 강조하며 틈새시장을 공략할 예정이다. 경쟁사 대비 최대 1/3 수준의 가격 우위를 가짐에도 성능은 경쟁사 못지 않다는 입장이다. 특히 가우디 3 인공지능 가속기는 8192개의 연산 클러스터로 동급 규모의 엔비디아 H100 플랫폼 대비 학습 시간을 최대 40% 정도 단축 가능하다고 강조했다. 다만 이후의 구체적인 제품 청사진은 언급되지 않았다.

2년마다 새 반도체 설계 적용하고 그 사이에 성능 개선 제품 투입

엔비디아와 AMD의 인공지능 가속기 전략의 핵심은 ‘1년마다 신제품 투입’에 있다. 이는 과거 인텔이 썼던 전략과 유사하다. 인텔은 틱-톡(Tick-Tock)이라는 이름으로 한 번은 반도체 설계를, 그 다음에는 미세공정을 바꾸며 제품을 선보였다. 1년에 한 번 신제품을 출시할 수 있고 상황에 따라 제품 개발과 구성을 유연하게 가져갈 수 있었다.

엔비디아는 블랙웰 다음 루빈을 공개하며 시장의 주목을 받았다. 그 사이에 성능을 개선한 제품을 선보인다. 출시 주기는 1년이다. / 출처=IT동아

두 기업도 완전히 같다고 볼 수 없지만, 비슷한 면이 있다. 2년 주기로 새로운 반도체 설계를 적용하고 그 사이에 성능 개선을 이룬 제품을 투입하는 식이다. 엔비디아는 올해 호퍼에서 설계를 바꾼 블랙웰을 선보인다. 호퍼 출시 2년 만이다. 블랙웰 다음 출시될 루빈(Rubin)은 2년 뒤인 2026년에 출시될 예정이다. 그 사이에 울트라가 투입된다.

AMD는 조금 다르지만 2024년 이후 행보는 엔비디아와 같다. 먼저 2023년 하반기에 공개한 MI300X에서 1년 단위로 업그레이드를 단행한다. MI325X와 MI350이 그 예다. 올해 4분기 중 출시될 MI325X는 HBM3e 모듈을 채택해 데이터 처리량을 늘리고, 내년 하반기에 출시할 MI350에서는 성능을 더 끌어낸다는 계획이다. 마지막 2026년에는 새로운 반도체 설계를 적용한 신제품을 내놓는다. 이 때 AMD는 엔비디아 루빈 플랫폼과 경쟁하게 된다.

AMD도 1년 주기로 인공지능 가속기를 선보일 예정이다. / 출처=IT동아

두 기업은 1년 단위 제품 출시 흐름을 가지고 치열하게 눈치 싸움을 벌일 전망이지만, 당분간은 직접 경쟁하지 않을 가능성이 높다. 엔비디아는 높은 시장 점유율과 뛰어난 성능을 강점으로 내세우지만, 공급에 대한 우려가 남아 있다. AMD는 성능과 함께 제품 도입 공백 문제를 해결할 대안이라는 점을 내세우며 빈틈을 노리는 전략이 유리하다.

과거 2년 주기가 아닌 1년 주기로 제품을 선보이기로 결정한 데에는 수요가 그만큼 증가할 것이라는 것을 예상한 결과다. 실제 인공지능 서비스 기업은 데이터센터 확대를 진행 중이다. 마이크로소프트는 미국 위스콘신주, 구글은 영국에 데이터센터 구축을 위한 투자를 시작했다. 테슬라와 아마존 등도 인공지능 패권 경쟁을 위해 데이터센터 및 기존 장비 업그레이드 등에 심혈을 기울이고 있다. 이 과정에서 많은 물량의 장비가 필요하기 때문에 자연스레 1년 단위 출시가 이뤄져도 소화에 문제가 없다고 판단했을 것이다.

엄청난 속도로 증가 중인 데이터, 네트워크 속도 경쟁도 뜨거워진다

네트워크 시스템과 관련 인프라 구축에 대한 기업의 관심도 높아지는 중이다. 점점 방대해지는 인공지능 관련 데이터를 시스템간 주고받는 것은 물론이고 일반에게 제공하려면 결국 빠르고 유연한 네트워크 전송 구조를 갖춰야 한다. 이 부분에서 엔비디아와 AMD는 다른 길로 접근했다.

엔비디아의 데이터센터 네트워크 장비는 인공지능 가속기 솔루션들과 짝을 이루는 식이다. / 출처=IT동아

엔비디아는 스펙트럼(Spectrum)-X로 대응하고 있다. 블랙웰 플랫폼에는 스펙트럼-X800 이더넷 스위치와 퀀텀(Quantum)-X800 스위치가 호흡을 맞춘다. 스펙트럼-X는 인공지능 가속기가 처리한 데이터를 순차적으로 처리했던 기존 네트워크 전송 방식이 아닌 가속기간 상호 연동을 통해 속도를 높인다. 빠른 데이터 전송을 위해 블루필드(BlueField)-3 네트워크 가속기(SuperNIC)를 쓴다. 이 장치는 1초에 400Gb를 전송할 수 있다. 또한 스펙트럼-X800 스위치 장비는 64개 네트워크 단자를 제공하며 단자당 초당 800Gb 데이터 전송을 지원한다.

현재 사양을 끌어 올리면서 루빈 플랫폼이 적용되는 시점에는 데이터 전송량을 최대 2배 끌어 올리는 것이 엔비디아의 계획이다. 기기간 데이터 전송을 지원하는 NV링크(NVLink)도 6세대에 와서는 초당 3600GB를 전송하는 게 목표다.

AMD는 인공지능 처리용 네트워크 구성을 위해 여러 기업들과 손을 잡는 것을 선택했다. / 출처=IT동아

AMD도 인공지능 가속기에서 처리되는 데이터 전송 속도를 높이기 위해 초 가속 연결(Ultra Accelerator Link) 그룹을 결성했다. 인텔, 브로드컴, 마이크로소프트, 메타, 구글, HP 등 8개 기업이 참여해 데이터센터 내 인공지능 시스템을 위한 고속ㆍ저지연 통신 기술을 논의한다. 이미 울트라 이더넷 컨소시엄(UE Consortium)을 통해 초기 기술을 개발한 것으로 알려졌다. 기본적으로 인공지능 시스템 내에서 최대 1024개 가속 연결을 지원하고 각 장치간 메모리 접근과 저장이 가능하다. 이 기술은 2024년 3분기 이후부터 적용될 예정이다.

인공지능 가속기 시장을 둘러싼 하드웨어와 인프라 경쟁은 이미 시작됐다. 시장이 빠르게 흘러갈수록 관련 기업도 발 빠르게 움직일 것으로 예상된다.

글 / IT동아 강형석 (redbk@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)

▶ 인텔 컴퓨텍스 2024 부스 가보니··· 'AI PC 사례·제온 6 공개 눈길'▶ 컴퓨텍스 2024 MSI 부스, ‘클로’ 8인치와 ‘AMG’ 노트북 공개로 ‘북적’▶ 펫 겔싱어, "2030년 세계 2위 파운드리 목표··· 다음 주 18A 칩 구동"

고정닉 0

원본 첨부파일 6본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	제목	글쓴이	작성일	조회	추천
설문	기 세보여도 실제로는 멘탈 약할 것 같은 스타는?	운영자	24/11/04	-	-
4384	[신차공개] 페라리 ‘테일러 메이드 로마 스파이더’·롤스로이스 ‘고스트 시리즈 II’ 공개	IT동아	10.14	2191	2
4383	카드사 연락 없이 클릭 한 번에 내 카드 찾고 안 쓰는 카드 취소까지 된다면? [이럴땐 이렇게!]	IT동아	10.14	215	0
4382	[스타트업리뷰] 소통과 AI 더한 스타트업 재무 회계의 혁신, '그랜터'	IT동아	10.14	159	0
4381	말랑탱크 “간편하고 위생적인 눈 가습기, 닥터아이” [동국대학교 캠퍼스타운] [13]	IT동아	10.14	5778	0
4380	로봇 산업 모든 것 담은 ‘2024 로보월드’, 역대 최대규모로 열린다	IT동아	10.11	211	0
4379	[창업도약+경북대] 틀루토 “생성형 인공지능으로 학술정보 대중화와 지식 불균형 해소 나설 것”	IT동아	10.11	207	0
4378	애플, DMA 압박에 독점 생태계 무너지나	IT동아	10.11	265	0
4377	[스케일업] 파나띠꼬 [3] 마이샵온샵 “향기를 강조하기 위한 영업전략을 펼쳐라”	IT동아	10.11	256	0
4376	[생성 AI 길라잡이] 간단한 설정으로 고품질 로고 제작 ‘루카’	IT동아	10.11	183	0
4375	인텔, 애로우레이크 S 공식 출시··· AI 데스크톱 시장 연다 [1]	IT동아	10.11	1235	0
4374	아토피 원인 규명 및 치료법 도출 이끄는 ‘특화 DB 구축’	IT동아	10.11	183	0
4373	[스케일업] 두디스 [3] 한국벤처컨설팅 "서비스·솔루션, 가능성 아닌 명확함으로 승부해야"	IT동아	10.11	163	0
4372	[스케일업] 운약근답올핏 [3] 린밸류업 “IR 자료는 투자자 입장에서 작성하라”	IT동아	10.11	159	0
4371	AMD 인스팅트로 분주해진 서버 파트너사, 주요 신제품은?	IT동아	10.11	163	0
4370	AMD, 인스팅트 MI325X·5세대 에픽 정식 출시··· 'AI 슈퍼사이클 잡는다'	IT동아	10.11	798	0
4369	단속카메라 종류와 원리 살펴보니	IT동아	10.10	176	0
4368	기업들이 오픈소스 정책을 추구하는 이유	IT동아	10.10	171	0
4367	[리뷰] 토너 값 무서운 SMB 위한 레이저 복합기, 브라더 DCP-B7640DW 토너세이브	IT동아	10.10	1048	0
4366	[스케일업] 스크램블러 [3] 유장준 스타트업세일즈연구소장 “유통, 기초부터 천천히”	IT동아	10.10	143	0
4365	[스타트업리뷰] 브이디컴퍼니 산업용 청소기 클리버 SH1	IT동아	10.10	304	0
4364	일릭서 “저렴하고 빠른 고품질 데이터 분석 솔루션, 스탯업AI” [동국대학교 캠퍼스타운]	IT동아	10.10	136	0
4363	디캠프 ‘양보다 질’ 강조한 배치 프로그램 도입, 스타트업 성장 길잡이 역할 강화 나선다	IT동아	10.08	185	0
4362	창업-BuS 연합 IR "아이 키우듯 스타트업 특성 파악해 맞춤형 지원"	IT동아	10.08	182	0
4361	‘연중 상시 지원’으로 육성한 초격차 스타트업 한자리에 ‘창업-BuS 연합 IR’	IT동아	10.08	187	0
4360	[IT기획자의 탄생] 1. '기획' 없는 스타트업이 실패할 수 밖에 없는 이유	IT동아	10.08	166	0
4359	[스케일업] 반프 [2] 안재열 센터장 “자율적·수평적 조직 문화, 비결은 ‘존중’”	IT동아	10.08	166	0
4358	[자동차와 法] 자율주행자동차법 관련 핵심 내용과 개선사항에 대하여	IT동아	10.08	824	0
4357	‘서울시 핀테크 스타트업이 한 자리에’ 서울 핀테크 위크 2024 개최	IT동아	10.08	175	0
4356	RTX 40 시리즈 단종 초읽기, 앞으로의 그래픽 카드 선택지는? [24]	IT동아	10.07	4610	5
4355	서울과기대, ‘제조창업 제품 개발’ 고도화로 제조창업 초석 쌓는다	IT동아	10.07	177	0
4354	주요 OTT 서비스 가격 비교, 조금 더 저렴하게 보는 방법은? [1]	IT동아	10.07	2961	0
4353	예열은 길게 할수록 좋다? 자동차 상식 헷갈릴 땐 이렇게! [이럴땐 이렇게]	IT동아	10.07	164	0
4352	'단풍잎돼지풀로 일궈낸 순환경제'··· 뷰티 브랜드 '우트'의 접근법은?	IT동아	10.07	155	0
4351	[주간투자동향] 위밋모빌리티, 200억 원 규모 시리즈B 투자 유치 外	IT동아	10.07	153	0
4350	이통 3사, AI 도약 위해 누구와 손잡았나	IT동아	10.04	269	0
4349	[투자를IT다] 2024년 10월 1주차 IT기업 주요 소식과 주가 흐름	IT동아	10.04	323	0
4348	각양각색, 최신 폴더블 스마트폰 비교 한 눈에	IT동아	10.04	309	0
4347	차트분석 도구 ‘트레이딩뷰’ 파고들기 - 27	IT동아	10.04	229	0
4346	[생성 AI 길라잡이] 생성형AI의 양면성 '딥페이크', 왜 문제인가?	IT동아	10.04	223	0
4345	[뉴스줌인] 삼성전자의 PCIe 5.0 SSD, 양산 늦었지만 성능은 최고?	IT동아	10.04	297	0
4344	시흥도시공사도 도입한 NHN두레이, "협업 툴 넘어 전자결재까지 다재다능"	IT동아	10.04	209	0
4343	[스타트업-ing] 제주오늘 배송 기사 “이동 경로 알려주니 배송 업무가 수월합니다”	IT동아	10.04	1051	1
4342	수원대 “세르파 프로그램, 스타트업 문제해결 실전 코치 육성”	IT동아	10.04	219	0
4341	[스케일업] 캠터[3] 프리핀스 “하나의 메시지만 명확히 전달해도 성공적인 마케팅”	IT동아	10.04	193	0
4340	국내 초기투자기관이 한 자리에 모이는 '2024 초기 스타트업 투자자 서밋' 개최	IT동아	10.03	228	0
4339	[IT애정남] 012 번호로 자꾸 이상한 문자 메시지가? 어쩌죠?	IT동아	10.02	255	0
4338	車 제조사, 연말 성수기 맞아 신차 연이어 출시 [13]	IT동아	10.02	8022	0
4337	네이버 AI 검색 서비스, 어디까지 써봤니	IT동아	10.02	228	0
4336	글로벌 스타트업 페스티벌, '부산 바운스 2024' 개최 [1]	IT동아	10.02	1073	0
4335	한국쓰리엠, 전 세계 기후문제 다룬 '그린 웍스' 다큐멘터리 공개	IT동아	10.02	202	0