디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 중 AI 기업들, 칩금지에 맞서 영리하게 혁신

시타갤로그로 이동합니다. 2024.09.21 15:27:07
조회 82 추천 2 댓글 0

https://www.economist.com/science-and-technology/2024/09/19/chinas-ai-firms-are-cleverly-innovating-around-chip-bans

중국 AI 기업들은 칩 금지에 맞서 영리하게 혁신하고 있다


강력한 하드웨어의 부족을 무디게 하는 소프트웨어 트윅


2024 2024년 9월 19일

-

-


오늘날 최고의 인공지능(AI) 모델은 그래픽 처리 장치(GPU)로 알려진 수많은 최첨단 프로세서에 의존한다. 대부분의 서구 기업들은 이를 확보하는 데 어려움이 없다. 소셜 미디어 대기업인 Meta의 최신 모델인 Llama 3는 미국 칩 제조업체인 Nvidia의 H100 GPU 16,000개로 훈련되었다. Meta는 연말까지 60만 개를 더 비축할 계획이다. 

엘론 머스크가 투자한 스타트업인 XAI는 멤피스에 100,000개의 H100으로 구동되는 데이터 센터를 구축했다. 또 다른 대형 모델 제조업체인 OpenAI는 GPU 보유량에 대해 함구하고 있지만, 지난 4월 Nvidia의 사장인 젠슨 황이 직접 최신 프로세서를 전달한 바 있다.


이런 종류의 접근은 대부분의 중국 기술 기업에게는 먼 꿈일 뿐이다. 미국은 2022년 10월부터 고성능 프로세서의 중국 판매를 차단했다. 일부 중국 기업들은 이 탐나는 칩을 손에 넣기 위해 암시장으로 눈을 돌리고 있다는 소문이 돌고 있다. 그러나 대다수는 제한된 자원을 최대한 활용하는 데 초점을 맞추고 있다. 그들의 결과는 서구 기업들에게 생각할 거리를 제공하고 있다.


항저우에 본사를 둔 중국 스타트업인 DeepSeek도 혁신 기업 중 하나이다. 9월 초에 출시된 최신 모델인 DeepSeek-v2.5는 영어와 중국어로 된 코딩 과제뿐만 아니라 다른 오픈 소스 모델과 비교해도 손색이 없다. 이러한 성과는 규모에 그치지 않는다:  DeepSeek는 중국 회사로서는 큰 규모이지만 미국 경쟁사 기준으로 보면 적은 수인 Nvidia의 구형 GPU를 10,000개 이상 보유하고 있는 것으로 알려져 있다.


DeepSeek는 여러 가지 방식으로 이러한 부족함을 보완한다. 첫 번째는 각기 다른 문제에 가장 적합한 여러 가지 네트워크로 구성되어 있다는 점이다. 이러한 '전문가 혼합' 접근 방식을 통해 모델은 각 작업을 적절한 네트워크에 위임하여 속도를 개선하고 처리 시간을 단축할 수 있다. 


DeepSeek는 서로 다른 데이터 비트를 연결하는 가상 연결인 2360억 개의 '매개변수'를 가지고 있지만, 처리하는 새로운 정보 덩어리마다 한 번에 10분의 1도 채 사용하지 않는다. 또한 이 모델은 새로운 데이터를 처리하기 전에 압축한다. 이를 통해 대용량 입력을 보다 효율적으로 처리할 수 있다.


GPU 부족에 대한 창의적인 해결책을 찾는 것은  DeepSeek만이 아니다. 칭화대학교와 AI 스타트업인 ModelBest가 개발한 오픈 소스 모델인 MiniCPM은 각각 24억 개와 12억 개의 매개 변수를 가진 다양한 종류가 있다. 작은 크기에도 불구하고 언어 관련 작업에 대한 MiniCPM의 성능은 70억~130억 개의 파라미터를 사용하는 대규모 언어 모델(LLM)과 비슷하다. DeepSeek의 모델과 마찬가지로 전문가 혼합 접근 방식과 입력 압축을 결합한다. 그러나 매개 변수가 적은 다른 소형 모델과 마찬가지로 MiniCPM도 특정 학습 분야 외의 영역에서는 그다지 높은 성능을 발휘하지 못할 수 있다.


MiniCPM은 크기가 작기 때문에 개인용 기기에 적합하다. 지난 8월에는 여러 언어를 지원하고 텍스트, 이미지, 오디오 등 다양한 유형의 데이터와 함께 작동하는 휴대폰용 버전을 출시했다.


다른 곳에서도 비슷한 접근 방식이 시도되고 있다. Together.ai, Meta, Nvidia의 연구원들이 개발한 알고리즘인 FlashAttention-3은 Nvidia의 H100 GPU에 맞게 설계하여 LLM의 훈련 및 실행 속도를 높인다. Google DeepMind에서 7월에 발표한 또 다른 알고리즘인 JEST는 초기 학습을 위해 소량의 고품질 데이터를 제공한 후 더 큰 규모의 저품질 데이터 세트에 투입한다. 이 방식은 다른 방식보다 13배 빠르고 10배 더 효율적이라고 구글은 주장한다. OpenAI를 지원하는 Microsoft의 연구원들도 약 40억 개의 매개 변수가 있는 Phi-3 mini라는 소형 언어 모델을 출시했다.


서구 기업들과 달리 중국 기업들에게 적은 자원으로 더 많은 일을 하는 것은 선택 사항이 아니다[필수 사항이다]. 하지만 이것이 나쁘지 않을 수도 있다. AI 투자 펀드인 Air Street Capital의 Nathan Benaich는 “희소성 사고방식은 확실히 효율성 향상에 인센티브를 제공한다.”라고 말한다. ■


추천 비추천

2

고정닉 1

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2944 설문 축의금 적게 내면 눈치 줄 것 같은 스타는? 운영자 24/11/11 - -
815837 일반 쵸센 골든타임 미쳤노 ㅋㅋ 러갤러(117.111) 11.10 67 1
815836 일반 그러고 보니 박원숭 시장도 러갤러(112.162) 11.10 45 0
815835 일반 쵸센 이대녀 멋지노 러갤러(117.111) 11.10 28 0
815834 정보 우크라이나에 지원하는게 병신짓인 이유 [5] 러갤러(121.150) 11.10 119 1
815833 일반 가뭄으로 인해 피해가 많은 미국 [4] ㅇㅇㅇ(218.238) 11.10 72 1
815832 일반 군사갤 응원합니다 러갤러(112.162) 11.10 32 0
815831 일반 트럼프 제안 무시하면 군머갤 지들이 뭘 할 수 있노? 러갤러(112.162) 11.10 35 2
815830 일반 트럼프는 러우전을 한국처럼 [2] 러갤러(149.50) 11.10 98 2
815829 일반 미국은 망할래야 망할수가없음 [4] ㅇㅇ(124.56) 11.10 86 1
815828 일반 유대금권이 네오콘 버리는건가?? ㅇㅇㅇ(218.238) 11.10 79 3
815827 일반 중국인 관광객이 드론으로 국정원 촬영…경찰, 현행범 체포 [1] ㅇㅇ(118.41) 11.10 70 0
815826 일반 트럼프 행보 보니 암살 조심해야할듯.. ㅇㅇㅇ(218.238) 11.10 77 2
815825 일반 트럼프에게 버림 당하는 폼페이오 [4] ㅇㅇㅇ(218.238) 11.10 222 4
815824 일반 트럼프 태권도복입고 단증받는 영상보니 "훌륭한 스포츠, 한국 사랑해" [1] ㅇㅇ(118.41) 11.10 90 1
815823 일반 [로이터] 미졷국 대만 TSMC에 7나노급 그래픽칩과 AI칩 중국수출금지 [1] ㅇㅇ갤로그로 이동합니다. 11.10 72 2
815822 일반 트럼프-캘리포니아 정면충돌…"미친 정책 때문에 사람들 떠나" ㅇㅇ(118.41) 11.10 118 2
815821 일반 김영호 "北도발 세계 평화 직접 위협…다양한 해법 모색 필요" ㅇㅇ(118.41) 11.10 52 0
815820 일반 우크라 난민지원 (고아원) by 통일교 ㅇㅇ(112.72) 11.10 53 2
815819 일반 러시아 우구라에 대한 솔직한 감정은 이렇다 [5] ㅇㅇ(124.111) 11.10 74 0
815818 일반 우크라이나 구호활동 done by 통일교 ㅇㅇ(112.72) 11.10 42 2
815817 일반 러시아 역사에 이런 협정을 맺은 적이 없다 [1] ㅇㅇ갤로그로 이동합니다. 11.10 70 2
815816 일반 우크라이나를 평화의 땅으로 ㅇㅇ(112.72) 11.10 35 1
815815 일반 미러 관계 회복은 필연적인 길 [1] ㅇㅇ(124.111) 11.10 42 2
815814 일반 민주 가치동맹 이지랄 기득권 탐욕 때문 EE갤로그로 이동합니다. 11.10 36 1
815813 일반 우구낙지 색휘들이 지속적으로 자포리자 원전 외부 전력망을 공격하는 이유 ㅇㅇ갤로그로 이동합니다. 11.10 60 4
815812 일반 이란의 우유부단한 태도는 나중에 후회할 것 [2] 러갤러(149.50) 11.10 92 3
815811 일반 오늘의 메세지다 다들 숙지하도록 ㅇㅇ(112.72) 11.10 25 0
815810 일반 무기에 '짝퉁' 프레임 씌우는 찌꺼기들 (박종익 기레기) [3] ㅇㅇ(103.254) 11.10 70 3
815808 일반 시르스키 입을 통해 듣는 북한군 참전여부 [1] ㅇㅇ갤로그로 이동합니다. 11.10 71 3
815807 일반 짱깨새끼들 하이~♥ ㅇㅇ(223.39) 11.10 18 0
815806 일반 11월7일 남한군 파병 대대적인 살상무기 지원 발표하는 날이었는데 [1] 러갤러(106.101) 11.10 63 2
815805 일반 걍 한국은 좆망 멸망이 맞음 뉴욕워싱턴불바다(1.241) 11.10 58 3
815804 일반 군갤 요즘 초상집 분위기네 EE갤로그로 이동합니다. 11.10 99 5
815803 일반 우크라이나 자폭드론 중국산이네 [3] 러갤러(180.64) 11.10 113 1
815802 일반 중국역사보면 별의별 희한한 일들 다 겪고 성장해서 [3] ㅇㅇ(61.106) 11.10 82 3
815801 일반 뱀독 피격된 애들은 걍 보약이라고 믿고 살아라 ㅋ 러갤러(91.207) 11.10 59 4
815800 일반 중국이 인구당출생률은 일본 한국보다 더 높지 ㅇㅇ(61.106) 11.10 44 0
815799 일반 윤석렬 대통령, 파병 신중하게 검토하는 사진 공개 러갤러(175.120) 11.10 96 0
815798 일반 불쌍한 너네들에게 당장 필요한거 ㅇㅇ(112.72) 11.10 48 1
815796 일반 ㅋㅋ Hospitaller갤로그로 이동합니다. 11.10 22 1
815794 일반 이번에 트럼프가 승리할 수 있었던 가장 결정적인 이유를 알려준다 [1] 러갤러(115.137) 11.10 119 5
815793 일반 냥이도 아침 물 먹는다 Hospitaller갤로그로 이동합니다. 11.10 36 0
815790 일반 송파, 16억 부동산 --- 5억됨 ㅎ [1] Hospitaller갤로그로 이동합니다. 11.10 113 0
815789 일반 러시아 지원에 올인하는 중국의 속셈 [3] ㅇㅇ갤로그로 이동합니다. 11.10 129 0
815788 일반 트럼프 아들 배런 좋아하는 연령대와 성별을 보자 [2] ㅇㅇㅇ(218.238) 11.10 224 1
815787 일반 수박 좀 므그바 Hospitaller갤로그로 이동합니다. 11.10 14 0
815786 일반 짱깨새끼들 하이~♥ ㅇㅇ(223.39) 11.10 32 2
815785 일반 케네디 주니어 들어온다니까 똥꼬 탄 한국언론 그리고 반대되는 댓글 ㅇㅇㅇ(218.238) 11.10 111 5
815783 정보 조센징새끼들 케네디주니어가 뭐할 위업자인지도 모르잖아ㅋㅋ [1] ㅇㅇ(212.102) 11.10 71 5
815782 일반 미국 쇠퇴해가는 데 [1] EE갤로그로 이동합니다. 11.10 61 3
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2