디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 중 AI 기업들, 칩금지에 맞서 영리하게 혁신

시타갤로그로 이동합니다. 2024.09.21 15:27:07
조회 81 추천 2 댓글 0

https://www.economist.com/science-and-technology/2024/09/19/chinas-ai-firms-are-cleverly-innovating-around-chip-bans

중국 AI 기업들은 칩 금지에 맞서 영리하게 혁신하고 있다


강력한 하드웨어의 부족을 무디게 하는 소프트웨어 트윅


2024 2024년 9월 19일

-

-


오늘날 최고의 인공지능(AI) 모델은 그래픽 처리 장치(GPU)로 알려진 수많은 최첨단 프로세서에 의존한다. 대부분의 서구 기업들은 이를 확보하는 데 어려움이 없다. 소셜 미디어 대기업인 Meta의 최신 모델인 Llama 3는 미국 칩 제조업체인 Nvidia의 H100 GPU 16,000개로 훈련되었다. Meta는 연말까지 60만 개를 더 비축할 계획이다. 

엘론 머스크가 투자한 스타트업인 XAI는 멤피스에 100,000개의 H100으로 구동되는 데이터 센터를 구축했다. 또 다른 대형 모델 제조업체인 OpenAI는 GPU 보유량에 대해 함구하고 있지만, 지난 4월 Nvidia의 사장인 젠슨 황이 직접 최신 프로세서를 전달한 바 있다.


이런 종류의 접근은 대부분의 중국 기술 기업에게는 먼 꿈일 뿐이다. 미국은 2022년 10월부터 고성능 프로세서의 중국 판매를 차단했다. 일부 중국 기업들은 이 탐나는 칩을 손에 넣기 위해 암시장으로 눈을 돌리고 있다는 소문이 돌고 있다. 그러나 대다수는 제한된 자원을 최대한 활용하는 데 초점을 맞추고 있다. 그들의 결과는 서구 기업들에게 생각할 거리를 제공하고 있다.


항저우에 본사를 둔 중국 스타트업인 DeepSeek도 혁신 기업 중 하나이다. 9월 초에 출시된 최신 모델인 DeepSeek-v2.5는 영어와 중국어로 된 코딩 과제뿐만 아니라 다른 오픈 소스 모델과 비교해도 손색이 없다. 이러한 성과는 규모에 그치지 않는다:  DeepSeek는 중국 회사로서는 큰 규모이지만 미국 경쟁사 기준으로 보면 적은 수인 Nvidia의 구형 GPU를 10,000개 이상 보유하고 있는 것으로 알려져 있다.


DeepSeek는 여러 가지 방식으로 이러한 부족함을 보완한다. 첫 번째는 각기 다른 문제에 가장 적합한 여러 가지 네트워크로 구성되어 있다는 점이다. 이러한 '전문가 혼합' 접근 방식을 통해 모델은 각 작업을 적절한 네트워크에 위임하여 속도를 개선하고 처리 시간을 단축할 수 있다. 


DeepSeek는 서로 다른 데이터 비트를 연결하는 가상 연결인 2360억 개의 '매개변수'를 가지고 있지만, 처리하는 새로운 정보 덩어리마다 한 번에 10분의 1도 채 사용하지 않는다. 또한 이 모델은 새로운 데이터를 처리하기 전에 압축한다. 이를 통해 대용량 입력을 보다 효율적으로 처리할 수 있다.


GPU 부족에 대한 창의적인 해결책을 찾는 것은  DeepSeek만이 아니다. 칭화대학교와 AI 스타트업인 ModelBest가 개발한 오픈 소스 모델인 MiniCPM은 각각 24억 개와 12억 개의 매개 변수를 가진 다양한 종류가 있다. 작은 크기에도 불구하고 언어 관련 작업에 대한 MiniCPM의 성능은 70억~130억 개의 파라미터를 사용하는 대규모 언어 모델(LLM)과 비슷하다. DeepSeek의 모델과 마찬가지로 전문가 혼합 접근 방식과 입력 압축을 결합한다. 그러나 매개 변수가 적은 다른 소형 모델과 마찬가지로 MiniCPM도 특정 학습 분야 외의 영역에서는 그다지 높은 성능을 발휘하지 못할 수 있다.


MiniCPM은 크기가 작기 때문에 개인용 기기에 적합하다. 지난 8월에는 여러 언어를 지원하고 텍스트, 이미지, 오디오 등 다양한 유형의 데이터와 함께 작동하는 휴대폰용 버전을 출시했다.


다른 곳에서도 비슷한 접근 방식이 시도되고 있다. Together.ai, Meta, Nvidia의 연구원들이 개발한 알고리즘인 FlashAttention-3은 Nvidia의 H100 GPU에 맞게 설계하여 LLM의 훈련 및 실행 속도를 높인다. Google DeepMind에서 7월에 발표한 또 다른 알고리즘인 JEST는 초기 학습을 위해 소량의 고품질 데이터를 제공한 후 더 큰 규모의 저품질 데이터 세트에 투입한다. 이 방식은 다른 방식보다 13배 빠르고 10배 더 효율적이라고 구글은 주장한다. OpenAI를 지원하는 Microsoft의 연구원들도 약 40억 개의 매개 변수가 있는 Phi-3 mini라는 소형 언어 모델을 출시했다.


서구 기업들과 달리 중국 기업들에게 적은 자원으로 더 많은 일을 하는 것은 선택 사항이 아니다[필수 사항이다]. 하지만 이것이 나쁘지 않을 수도 있다. AI 투자 펀드인 Air Street Capital의 Nathan Benaich는 “희소성 사고방식은 확실히 효율성 향상에 인센티브를 제공한다.”라고 말한다. ■


추천 비추천

2

고정닉 1

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2944 설문 축의금 적게 내면 눈치 줄 것 같은 스타는? 운영자 24/11/11 - -
815915 일반 트럼프 당선 적중한 예언가, 대선이후 대공황 예측 [7] ㅇㅇㅇ(218.238) 11.10 218 1
815914 일반 중국·인니, 남중국해 분쟁지역 공동개발 [1] 시타갤로그로 이동합니다. 11.10 77 2
815913 일반 예전처럼 미정갤발 미러동맹 운운은 줄었네 [1] 러갤러(106.101) 11.10 54 0
815912 일반 “김건희 특검 내달 14일 표결…여당 이탈표 더 늘어날 것” [1] ㅇㅇ(101.96) 11.10 105 0
815911 일반 이란 "트럼프 '최대 압박 정책' 실패…재고해야" [2] ㅇㅇ(118.41) 11.10 76 0
815910 일반 똥꼬메리카가 러시아를 공격해? [3] ㅇㅇ(194.195) 11.10 144 4
815909 일반 美도 말리지 못했다…이스라엘, 시리아·北 합작 핵시설 때리던 그날 [1] ㅇㅇ(118.41) 11.10 149 0
815907 일반 찐페미는 우크라가 보여줌 ㅇㅇㅇ(218.238) 11.10 76 4
815906 일반 미 공화당, 브릭스는 나무심기에 진심임 [1] ㅇㅇㅇ(218.238) 11.10 133 2
815905 일반 호요버스 겜들은 90프로가 pc에서 돌아감. [2] 러갤러(115.137) 11.10 110 2
815904 일반 중국 기술로 만들어진 아우디의 새로운 전기차 ㅇㅇㅈ(99.238) 11.10 104 1
815903 일반 젤렌스키 존나 멋지지 않음? [2] 러갤러(125.182) 11.10 131 1
815901 일반 결국은 중국이 한반도, 러시아, 동남아를 지배하는 아시아 패권국이 된다. [2] 러갤러(118.235) 11.10 91 0
815900 일반 여자요리사도 전동 소총병으로 최전선에 투입하는 우크라 [6] ㅇㅇㅇ(218.238) 11.10 130 3
815899 일반 과거 이란의 비밀 핵개발 [1] ㅇㅇ(118.41) 11.10 60 0
815898 일반 [외국] 기업들이 중국을 보는 시각이 바뀌었다 [1] 시타갤로그로 이동합니다. 11.10 94 3
815895 일반 한국인은 트럼프를 잘 모르는듯 [1] 츄럼프형님(211.234) 11.10 112 0
815894 일반 "한국, 2000년 우라늄 농축실험 때 日특허기술 이용 의혹" ㅇㅇ(118.41) 11.10 74 0
815893 일반 트럼프가 개극혐하는게 리버럴, ESG인데 ㅋㅋㅋㅋㅋㅋ [1] ㅇㅇㅇ(218.238) 11.10 67 1
815892 일반 중국 롤 마라탕 원신 그딴거 전부 합쳐봐야 [13] 러갤러(114.203) 11.10 567 41
815891 일반 사실 센징토벌은 취소되거나 미뤄졌음 ㅇㅇ(165.22) 11.10 85 1
815890 일반 찢빠는 느그 재명이 ESG, 리버럴이나 얼케하고 트럼프랑 비교해 ㅇㅇㅇ(218.238) 11.10 35 2
815887 일반 트럼프 하는걸 보니 휴전은 커녕 전쟁이 더 격화되겠네 [7] ㅇㅇ(121.175) 11.10 192 1
815886 일반 이긴 사실 [1] Hospitaller갤로그로 이동합니다. 11.10 45 2
815885 일반 한국 원자력 안전규제, IAEA 기준으로 검토받는다 ㅇㅇ(118.41) 11.10 40 0
815882 일반 유용원 "트럼프 시대, 한미원자력협정 개정해 핵무장 잠재력 확보를" ㅇㅇ(118.41) 11.10 76 0
815880 일반 카타르, 미국 요청 수용해 하마스 지도부 추방 합의 러갤러(175.120) 11.10 50 1
815879 일반 트럼프가 당선됐거나 말거나 트럼프의 범죄가 사라지진 않습니다 [3] ㅇㅇ(194.195) 11.10 97 0
815878 일반 김기현, 북 핵실험 대비 '자위권적 핵무장' 촉구결의안 발의 ㅇㅇ(118.41) 11.10 37 1
815877 일반 바재앙이 대선패배 독박 쓰는 분위기네 [2] ㅇㅇ(194.195) 11.10 137 3
815875 일반 법카로 소고기 사먹은 상년이 민졷당 대표 마누라였어? ㅇㅇ갤로그로 이동합니다. 11.10 41 0
815874 일반 청와대 실세의 본격적인 반격 shoveit갤로그로 이동합니다. 11.10 92 1
815871 일반 트럼프 선거인단 312명 vs 해리스 226명 압승, 7개 경합주도 석권 [3] ㅇㅇ(118.41) 11.10 117 2
815870 일반 틀극기가 곱창을 땄으니 닭근혜는 훌륭한 대통령? [3] ㅇㅇ(194.195) 11.10 47 2
815869 일반 국내 언론 제끼는 이유 [1] ㅇㅇ(121.129) 11.10 56 4
815868 일반 짱깨새끼들 하이~♥ ㅇㅇ(223.39) 11.10 18 1
815867 일반 다음 털릴 지역 [2] ㅇㅇ(121.129) 11.10 110 2
815866 일반 트럼프랑 머스크는 왜 한편인거? [3] ㅇㅇ(1.243) 11.10 91 0
815865 일반 대만매체, 트럼프에 '중범죄자' 지칭 논란…"사안 엄중" [3] ㅇㅇ(118.41) 11.10 108 1
815864 일반 고종과 윤석열? ㅎㅎ [2] 러갤러(149.50) 11.10 53 0
815863 정보 폼페이오. 니키헤일리 아웃 [1] 러갤러(180.66) 11.10 116 2
815862 일반 남의 마누라는 법카로 소고기 초밥 사먹었다고 지랄하던 새끼가 [1] 러갤러(175.223) 11.10 57 2
815860 일반 이재명만 없어지면 된단다 [1] ㅇㅇ(121.88) 11.10 54 0
815859 일반 엉뚱한 소리하는 애가 있는데 [3] 러갤러(149.50) 11.10 54 0
815858 일반 윤두창을 하야시킬 가장 확실한 방법 [2] ㅇㅇ(194.195) 11.10 113 0
815857 일반 러우전에 대만용병도 와서 죽고 있는데 한일용병은 안보임 [7] ㅇㅇㅇ(218.238) 11.10 96 1
815856 일반 북러 협정의 의미를 아직도 모르냐 [1] ㅇㅇ(124.111) 11.10 91 1
815854 일반 이번에 리버럴 청소당하겠네 [1] ㅇㅇㅇ(218.238) 11.10 109 4
815852 일반 푸틴이 발다이 클럽에서 한 말 [4] 러갤러(149.50) 11.10 179 2
815851 일반 어제 이재명 방탄집회 3000명 모였더라 ㅇㅇ(121.88) 11.10 64 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2