‘NPU+GPU 성능 개선’ AMD 라이젠 AI 300 프로세서의 핵심 요소는?

IT동아 · 2024.07.17 13:19:42

[IT동아 강형석 기자] AMD가 코드명 ‘스트릭스 포인트(Strix Point)’로 알려진 3세대 라이젠 AI 프로세서로 인공지능(AI) PC 시장 선점에 나선다. 에이수스, 게이머 공화국(Republic Of Gamers – ROG), 레노버, HP, 엠에스아이(MSI) 등 주요 노트북 제조사와 협력 중이며 약 150개 이상 AI 노트북 PC 제품을 시장에 선보인다는 계획이다. 출시는 2024년 3분기 내에 이뤄질 것으로 보인다.

잭 후인(Jack Huynh) AMD 수석 부사장 및 컴퓨팅ㆍ그래픽스 총괄 관리자는 2024년 7월 9일(미국 현지 시간), 미국 로스앤젤레스 웨스틴 보나벤처 호텔에서 개최된 AMD 테크데이 연단에 올라 3세대 라이젠 AI 프로세서를 소개하고 PC 시장 변화에 대한 AMD의 기술 전략을 언급했다.

AMD는 라이젠 AI 300 시리즈 탑재 노트북을 150개 이상 확대한다는 방침이다. / 출처=IT동아

“젠(Zen) 반도체 설계의 중앙처리장치는 세상을 놀라게 했다. 클럭 사이클당 명령어 처리 수(IPC) 성능을 한 단계 높였고 이후에는 7나노미터 칩과 14나노미터 입출력 칩을 결합하는 ‘트리플렛(Triplelet)’ 기술을 적용했다. 구리 대 구리 하이브리드 본딩 기술을 적용한 3D 시스템-온-칩(SoC)은 설계의 경계를 허물었다. 최고의 게이밍 프로세서를 추구한 그래나이트 릿지(Granite Ridge)는 밀도 높은 내부 상호연결 기술로 캐시 용량을 확보했다. 지난해에는 처음으로 전용 신경망 처리장치(NPU)를 가속처리장치(APU)에 통합, AI PC의 전환을 주도 중이다.”

AMD가 라이젠 프로세서에 적용해 온 기술들을 나열한 잭 후인 수석 부사장은 3세대 라이젠 AI 프로세서에 3가지 핵심 요소가 있음을 강조했다. 하나는 차세대 반도체 설계인 5세대 젠(Zen) 설계를 적용한 것이고 다음은 모바일 환경에 맞춰 조율한 그래픽 처리장치(GPU), 마지막은 50 TOPS 연산 능력을 가진 신경망 처리장치(NPU)다.

8비트 정수 연산의 속도와 반정밀도 부동소수점의 정교함 더한 NPU

신경망 처리장치에는 2세대 XDNA 설계가 적용됐다. AMD가 인수한 자일링스(Xilinx) 기술에 뿌리를 두고 있다는 점이 특징이다. 라이젠 AI 300 프로세서에 적용된 신경망 처리장치는 50 TOPS(초당 1조회 정수연산) 사양이다. 이는 마이크로소프트가 코파일럿+ PC 구동에 적합하다고 강조한 40 TOPS를 뛰어넘는 수치다. 2024년 하반기 해당 칩을 탑재한 노트북 PC는 온-디바이스(On-Device) AI 처리 능력을 충분히 갖췄다고 봐도 무방하다.

1세대 XDNA 설계 기반 신경망 처리장치는 10 TOPS 사양에 불과했다. 이 칩 안에는 인공지능 엔진 타일(이하 AI 타일)이 20개가 배치됐다. 2세대는 이를 32개로 늘렸다. 중요한 것은 인공지능 관련 데이터 구조에 따라 AI 타일을 운용하는 방법이 달라졌다. 기본적으로 각각의 AI 타일이 유연하게 대응하지만, 큰 데이터를 처리할 때는 8개씩 4개 구역으로 나눠 처리한다.

2세대 XDNA 설계는 AI 타일이 상황에 따라 유연하게 대응하도록 만들어 성능을 높였다. / 출처=IT동아

예로 작은 크기의 데이터는 각 AI 타일이 처리하다가 인공지능 기반 영상과 음성 데이터가 등장하면 8개 AI 타일이 하나처럼 뭉쳐 영상과 음성을 처리한다. 추가로 콘텐츠 생성 애플리케이션에서 인공지능 데이터 처리를 요구하면 8+8 형태로 뭉쳐 운영될 수 있다. 작은 데이터는 32개 AI 타일이 각각, 큰 데이터는 1~4개 AI 타일처럼 작동하는 셈이다.

AMD는 2세대 XDNA 설계를 적용하며 기존 대비 타일당 다중누적연산(MACs) 능력을 2배 높였다. AI 타일이 빠르게 메모리에 접근할 수 있도록 용량도 1.6배 늘리는 등 성능 개선에 집중했다. 이 외에도 라이젠 7040 시리즈 대비 컴퓨팅 처리 능력은 5배, 전력 효율은 2배 개선되는 효과를 가져왔다.

2세대 XDNA 설계는 라이젠 7040 대비 처리 능력은 5배, 전력 효율은 2배 개선됐다. / 출처=IT동아

또 다른 핵심 요소는 블록 반정밀도(Block FP16) 기술이다. 8비트 정수 연산과 반정밀도(FP16) 부동소수점 연산을 더한 것이다. 8비트 정수 연산은 속도는 빠르지만 정확도는 낮고, 반정밀도 부동소수점 연산은 느리지만 높은 정확도를 갖췄다. 두 장점을 더함으로써 16비트 정확도로 8비트 처리 능력을 제공할 수 있다는 입장이다.

밤시 보파나(Vamsi Bopanna) AMD 인공지능 그룹 수석 부사장은 “자체 역량을 갖춘 소프트웨어 개발사들은 언어 모델을 빨리 처리하는 것을 원한다. 이번에 개발한 블록 반정밀도 부동소수점은 매우 가치 있는 일이 될 것이라 생각한다. 타 신경망 처리장치와 차별화가 된다고 본다”고 말했다.

그래픽 성능 개선 이룬 RDNA 3.5 내장 그래픽 처리장치

온-디바이스 인공지능 시대가 와도 PC라는 사실은 변함이 없다. 인공지능 외에도 생산성 작업이나 게이밍 등 기본기도 갖춰야 한다는 이야기다. AMD는 라이젠 AI 300 프로세서의 내장 그래픽 처리장치(iGPU) 성능 향상을 통해 여러 작업에 대응하도록 준비했다. 특히 기존 3세대 RDNA 설계를 개선한 3.5세대 RDNA 설계로 전력 소모와 성능의 균형을 맞췄다.

3.5세대 RDNA 설계에서는 샘플링 속도를 두 배 높였다. 3D 뼈대 위에 재질, 색상 등을 입히는 텍스처의 샘플 단위를 두 배 높인 형태인데 병렬 처리 구조를 더해 속도를 높였다. 이 외에도 보간과 비교율도 두 배 높였다. 2차 예비 메모리(L2 캐시)와 주 메모리 등에 접근하는 구조도 최적화한 점도 눈길을 끈다.

3.5세대 RDNA 설계 기반 그래픽 처리장치는 처리 구조를 개선해 성능과 전력 효율을 높였다. / 출처=IT동아

최종 내장 그래픽 처리장치의 성능은 크게 향상됐다. 이전 세대 동급 제품에 15W 열설계전력(TDP)을 적용한 결과, 3D마크 타임 스파이 테스트에서 최대 32%, 나이트 레이드 테스트에서 19% 성능 향상을 이뤄냈다. 전기를 적게 쓰면서 최대 성능을 낸다는 점은 노트북의 운용 시간에 영향을 주기에 긍정적인 변화라 할 수 있다.

마크 페이퍼마스터(Mark Papermaster) AMD 부사장 및 최고기술책임자는 “3.5세대 RDNA 설계는 모바일 환경에 이상적인 구조다. 감소된 전력 소비로 높은 효율을 구현했다. 최근에는 삼성과 협력해 갤럭시 스마트폰에 맞춰 최적화하고 라이선스를 부여한 바 있다. 다른 시장이지만, 라데온 그래픽 처리장치의 이상적 경험이 가능할 것”이라고 말했다.

에이수스를 포함해 여러 노트북 PC 제조사에서 라이젠 AI 300 탑재 제품을 선보일 예정이다. / 출처=IT동아

AMD는 라이젠 AI 300 프로세서가 적용된 노트북 PC를 여럿 소개했다. 에이수스(ASUS)는 젠북(Zenbook) S16, 터프 게이밍(TUF Gaming) A14, 프로아트(ProArt) P16 등을 공개했다. MSI도 프레스티지(Prestige) 노트북이 전시됐다. 이 외에 레노버, 레이저 등 여러 노트북 제조사를 통해 향후 몇 개월 안으로 150여 이상 제품을 출시할 예정이다. 모두 마이크로소프트 코파일럿+ PC에 대응한다.

글 / IT동아 강형석 (redbk@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)

번호	제목	글쓴이	작성일	조회	추천
설문	축의금 적게 내면 눈치 줄 것 같은 스타는?	운영자	24/11/11	-	-
4310	소상공인 우수 스마트모델 보급사업 모집 시작…매장의 ‘인공지능 전환’ 돕는다	IT동아	09.26	214	0
4309	[IT기획자의 탄생] '기획' 연재를 시작하며...	IT동아	09.26	217	0
4308	메타, 사양 조정하고 가격 낮춘 ‘메타 퀘스트 3Sㆍ오리온 AR 안경’ 공개 [2]	IT동아	09.26	1193	0
4307	[월간자동차] 24년 8월, 신차·중고차 거래량 모두 큰 폭으로 줄어	IT동아	09.25	231	0
4306	유엔협회세계연맹 “세계 스타트업·시민 사회와 지속가능 생태계 구축”	IT동아	09.25	240	0
4305	쉐어맥스 글로벌 “해외 진출 꿈꾸는 국내 기업들의 가교 역할 할 것”	IT동아	09.25	245	0
4304	서울창경 “민관협력 오픈 이노베이션, 스타트업 생태계 활력”	IT동아	09.25	230	0
4303	AI 번역기/서비스 선택할 때 고려할 기준은...? [3]	IT동아	09.25	2699	1
4302	케어포유 “반려동물 모니터링 솔루션으로 돌봄 공백 최소화” [동국대학교 캠퍼스타운]	IT동아	09.25	261	0
4301	서울과기대, '2024 K-벤처 르네상스 포럼' 개최··· 벤처 생태계 확장에 기여	IT동아	09.25	258	0
4300	차트분석 도구 ‘트레이딩뷰’ 파고들기 - 26	IT동아	09.25	193	0
4299	슬랙, 에이전트포스 품고 'AI 업무 운영체제'로 발전	IT동아	09.25	183	0
4298	[리뷰] 새로움으로 채운 신개념 PC, 에이수스 프로아트 PZ13 [6]	IT동아	09.25	2861	0
4297	래블업, 기술 콘퍼런스 lab \| up > /conf/4 개최··· 'AI 기술 확장에 역점'	IT동아	09.24	201	0
4296	[스케일업] 스크램블러 [2] 매드해터 “브랜딩과 마케팅의 모든 답은 고객에게 있다”	IT동아	09.24	5710	0
4295	파나띠꼬 “브랜드와 공간의 향기 마케팅을 지원합니다” [동국대학교 캠퍼스타운]	IT동아	09.24	200	0
4294	지향성 스피커, 새로운 콘텐츠·문화예술 세계 마중물	IT동아	09.24	208	0
4293	트윈피그바이오랩, 포스트 팁스로 차세대 항암 기술 TB551 고도화 [1]	IT동아	09.24	2231	2
4292	[주간투자동향] 뷰런테크놀로지, 220억 원 규모 시리즈A 투자 유치	IT동아	09.23	220	0
4291	[IT’s 가성비] 소박하지만 준수한 구성, HP 14-ep0165TU 노트북 [2]	IT동아	09.23	2426	0
4290	[투자를IT다] 2024년 9월 3주차 IT기업 주요 소식과 주가 흐름	IT동아	09.22	291	0
4289	[SBA x IT동아] 큐빅 “민감정보 노출 위험 없는 고품질 합성 데이터, AI 혁신 앞당길 것”	IT동아	09.20	301	0
4288	‘내장 그래픽 성능 강화’한 인텔ㆍAMD 차세대 CPU, 게이밍 UMPC에 다시 힘 실릴까?	IT동아	09.20	322	0
4287	[크립토 퀵서치] 블록체인 콘퍼런스 어떤 것이 있나요?	IT동아	09.20	4547	0
4286	세일즈포스, 엔비디아·구글·IBM 손잡고 '혁신 선도'의 길 간다 [1]	IT동아	09.20	2137	0
4285	[뉴스줌인] AI 담은 비스포크 김치냉장고, 뭐가 달라졌을까?	IT동아	09.19	363	0
4284	가족 실종 걱정 '안전 Dream - 사전등록제도'로 대비	IT동아	09.19	300	0
4283	LG전자, 복합기 강자 리코와 손잡고 B2B 부문 강화 [10]	IT동아	09.19	5647	2
4282	추석 연휴인데 아프면? 문 여는 약국∙병원은 어디?	IT동아	09.18	309	0
4281	추석 선물, 중고거래 전에 주의할 점은?	IT동아	09.18	302	0
4280	차트분석 도구 ‘트레이딩뷰’ 파고들기 - 25 [1]	IT동아	09.17	487	0
4279	추석 나들이 '나만의 국가유산 해설사'와 함께	IT동아	09.17	5133	0
4278	제품 리콜 여부 확인하고 싶을 땐 이렇게! [이럴땐 이렇게]	IT동아	09.16	8138	0
4277	추석 연휴 사이버사기 주의 ‘출처 불명의 URL 클릭 금지’ [1]	IT동아	09.16	2806	0
4276	추석 연휴 안전한 장거리 운전 위해 확인할 사항	IT동아	09.16	360	0
4275	[투자를IT다] 2024년 9월 2주차 IT기업 주요 소식과 주가 흐름	IT동아	09.16	363	0
4274	[생성 AI 길라잡이] 갤럭시 AI 활용하기 – 포토 어시스트	IT동아	09.13	526	0
4273	[SBA x IT동아] 위드인넷 “실감형 체험 콘텐츠 ‘팁스비’로 글로벌 교육 격차 해소”	IT동아	09.13	467	0
4272	RWA 활성화 위해 ‘전통 금융기관·정부 협력 필요’	IT동아	09.13	421	0
4271	메조미디어 “AX로 인공지능 광고 시대 연다”	IT동아	09.13	2246	0
4270	삼성전자, 업계 최초 'QLC 9세대 V낸드' 양산한다	IT동아	09.12	637	0
4269	[IT애정남] 커피 캡슐, 호환이 되는 것과 그렇지 않은 것은?	IT동아	09.12	2407	0
4268	창경센터협의회+동아닷컴+아이티동아, 국내 우수 스타트업 글로벌 홍보 위해 상호 협력 체결	IT동아	09.12	389	0
4267	[시승기] 3000만 원대 전기차 ‘기아 EV3’…캐즘 돌파 가능할까	IT동아	09.11	1768	0
4266	서울, 딥테크 혁신 중심지로…스타트업 축제 '트라이 에브리싱 2024' 개막 [2]	IT동아	09.11	2016	0
4265	[리뷰] ‘폰카’처럼 쉽게 쓰는 브이로그용 드론, ‘DJI 네오(Neo)’	IT동아	09.11	486	0
4264	인텔ㆍAMDㆍ퀄컴 ‘AI PC 삼각구도’ 완성, 반도체 시장에 힘 실릴까?	IT동아	09.11	1118	0
4263	車 제조사·보험사 등 추석 연휴 맞아 차량 무상점검	IT동아	09.10	403	0
4262	업그레이드보다 AI 택한 아이폰 16, 아이폰 15와 어떻게 다른가?	IT동아	09.10	1071	0
4261	체이널리시스 “가상자산 시장 활성화, 가상자산 범죄도 증가”	IT동아	09.10	5405	1

최근 방문

즐겨찾기

즐겨찾기 갤러리

갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

개념글 리스트

차단하기

[IT동아 갤러리]

갤러리 본문 영역

8비트 정수 연산의 속도와 반정밀도 부동소수점의 정교함 더한 NPU

그래픽 성능 개선 이룬 RDNA 3.5 내장 그래픽 처리장치

▶ 코파일럿+PC가 연 'AI PC 시대', 제조사 별 시장 전략은?▶ ‘AI PC 경쟁 이제부터’ AMD, 라이젠 AI 300ㆍ라이젠 9000 시리즈 CPU 공개▶ 그래프코어, 소프트뱅크에 인수·· 왜 왕년의 기대주는 추락했나

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘

지갑 연결

▶ 코파일럿+PC가 연 'AI PC 시대', 제조사 별 시장 전략은?▶ ‘AI PC 경쟁 이제부터’ AMD, 라이젠 AI 300ㆍ라이젠 9000 시리즈 CPU 공개 ▶ 그래프코어, 소프트뱅크에 인수·· 왜 왕년의 기대주는 추락했나