디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 중 AI 기업들, 칩금지에 맞서 영리하게 혁신

시타갤로그로 이동합니다. 2024.09.21 15:27:07
조회 85 추천 2 댓글 0

https://www.economist.com/science-and-technology/2024/09/19/chinas-ai-firms-are-cleverly-innovating-around-chip-bans

중국 AI 기업들은 칩 금지에 맞서 영리하게 혁신하고 있다


강력한 하드웨어의 부족을 무디게 하는 소프트웨어 트윅


2024 2024년 9월 19일

-

-


오늘날 최고의 인공지능(AI) 모델은 그래픽 처리 장치(GPU)로 알려진 수많은 최첨단 프로세서에 의존한다. 대부분의 서구 기업들은 이를 확보하는 데 어려움이 없다. 소셜 미디어 대기업인 Meta의 최신 모델인 Llama 3는 미국 칩 제조업체인 Nvidia의 H100 GPU 16,000개로 훈련되었다. Meta는 연말까지 60만 개를 더 비축할 계획이다. 

엘론 머스크가 투자한 스타트업인 XAI는 멤피스에 100,000개의 H100으로 구동되는 데이터 센터를 구축했다. 또 다른 대형 모델 제조업체인 OpenAI는 GPU 보유량에 대해 함구하고 있지만, 지난 4월 Nvidia의 사장인 젠슨 황이 직접 최신 프로세서를 전달한 바 있다.


이런 종류의 접근은 대부분의 중국 기술 기업에게는 먼 꿈일 뿐이다. 미국은 2022년 10월부터 고성능 프로세서의 중국 판매를 차단했다. 일부 중국 기업들은 이 탐나는 칩을 손에 넣기 위해 암시장으로 눈을 돌리고 있다는 소문이 돌고 있다. 그러나 대다수는 제한된 자원을 최대한 활용하는 데 초점을 맞추고 있다. 그들의 결과는 서구 기업들에게 생각할 거리를 제공하고 있다.


항저우에 본사를 둔 중국 스타트업인 DeepSeek도 혁신 기업 중 하나이다. 9월 초에 출시된 최신 모델인 DeepSeek-v2.5는 영어와 중국어로 된 코딩 과제뿐만 아니라 다른 오픈 소스 모델과 비교해도 손색이 없다. 이러한 성과는 규모에 그치지 않는다:  DeepSeek는 중국 회사로서는 큰 규모이지만 미국 경쟁사 기준으로 보면 적은 수인 Nvidia의 구형 GPU를 10,000개 이상 보유하고 있는 것으로 알려져 있다.


DeepSeek는 여러 가지 방식으로 이러한 부족함을 보완한다. 첫 번째는 각기 다른 문제에 가장 적합한 여러 가지 네트워크로 구성되어 있다는 점이다. 이러한 '전문가 혼합' 접근 방식을 통해 모델은 각 작업을 적절한 네트워크에 위임하여 속도를 개선하고 처리 시간을 단축할 수 있다. 


DeepSeek는 서로 다른 데이터 비트를 연결하는 가상 연결인 2360억 개의 '매개변수'를 가지고 있지만, 처리하는 새로운 정보 덩어리마다 한 번에 10분의 1도 채 사용하지 않는다. 또한 이 모델은 새로운 데이터를 처리하기 전에 압축한다. 이를 통해 대용량 입력을 보다 효율적으로 처리할 수 있다.


GPU 부족에 대한 창의적인 해결책을 찾는 것은  DeepSeek만이 아니다. 칭화대학교와 AI 스타트업인 ModelBest가 개발한 오픈 소스 모델인 MiniCPM은 각각 24억 개와 12억 개의 매개 변수를 가진 다양한 종류가 있다. 작은 크기에도 불구하고 언어 관련 작업에 대한 MiniCPM의 성능은 70억~130억 개의 파라미터를 사용하는 대규모 언어 모델(LLM)과 비슷하다. DeepSeek의 모델과 마찬가지로 전문가 혼합 접근 방식과 입력 압축을 결합한다. 그러나 매개 변수가 적은 다른 소형 모델과 마찬가지로 MiniCPM도 특정 학습 분야 외의 영역에서는 그다지 높은 성능을 발휘하지 못할 수 있다.


MiniCPM은 크기가 작기 때문에 개인용 기기에 적합하다. 지난 8월에는 여러 언어를 지원하고 텍스트, 이미지, 오디오 등 다양한 유형의 데이터와 함께 작동하는 휴대폰용 버전을 출시했다.


다른 곳에서도 비슷한 접근 방식이 시도되고 있다. Together.ai, Meta, Nvidia의 연구원들이 개발한 알고리즘인 FlashAttention-3은 Nvidia의 H100 GPU에 맞게 설계하여 LLM의 훈련 및 실행 속도를 높인다. Google DeepMind에서 7월에 발표한 또 다른 알고리즘인 JEST는 초기 학습을 위해 소량의 고품질 데이터를 제공한 후 더 큰 규모의 저품질 데이터 세트에 투입한다. 이 방식은 다른 방식보다 13배 빠르고 10배 더 효율적이라고 구글은 주장한다. OpenAI를 지원하는 Microsoft의 연구원들도 약 40억 개의 매개 변수가 있는 Phi-3 mini라는 소형 언어 모델을 출시했다.


서구 기업들과 달리 중국 기업들에게 적은 자원으로 더 많은 일을 하는 것은 선택 사항이 아니다[필수 사항이다]. 하지만 이것이 나쁘지 않을 수도 있다. AI 투자 펀드인 Air Street Capital의 Nathan Benaich는 “희소성 사고방식은 확실히 효율성 향상에 인센티브를 제공한다.”라고 말한다. ■


추천 비추천

2

고정닉 1

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2944 설문 축의금 적게 내면 눈치 줄 것 같은 스타는? 운영자 24/11/11 - -
816061 일반 친일 반중 반역자 쓰레기는 능지처참이 답임 [2] 러갤러(39.7) 11.11 65 2
816060 일반 친북친중 매국노 집단이 이재명에 사활을 걸고 있는 이유 [1] 레오(106.102) 11.11 63 2
816059 일반 근데 한국서 애국자들이 제일 한국국민 많이괴롭히지않냐 [2] ㄷㄷ(112.165) 11.11 57 2
816058 일반 박독수리 박독수리 나 돼지 다섯수신 할랄포크갤로그로 이동합니다. 11.11 50 0
816057 일반 한빨망 한까흥은 조롱이 아닌 사이언스임 [3] 러갤러(149.40) 11.11 75 10
816056 일반 소니가 한까흥 레전드임 진짜 ㄷㄷ(112.165) 11.11 52 1
816055 일반 빈부격차 심화와 저출산으로 망해가는 나라 근황ㄷㄷㄷ [2] ㅇㅇ(106.243) 11.11 129 3
816054 일반 미국멸망은 지표로 판단하는게 아니다 [4] 러갤러(212.8) 11.11 111 8
816053 일반 이미 서구는 실패한 체제 [4] EE갤로그로 이동합니다. 11.11 77 2
816052 일반 자본주의가 사회주의 보다 우월하다는 인식도 세뇌 결과임 [1] 러갤러(121.162) 11.11 65 2
816051 일반 실베서 봣는데 미국,유럽은 토요코키즈같은거 상상도못하는 ㄷㄷ(112.165) 11.11 46 0
816050 일반 한국도 20년만에 중국한테 추월당함 EE갤로그로 이동합니다. 11.11 72 2
816049 일반 미국 좆망 지표 [3] EE갤로그로 이동합니다. 11.11 108 2
816048 일반 우구라군에 강제징집당하면 살수있는팁 러갤러(118.235) 11.11 46 0
816047 일반 서구는 이제 좆퇴물 [2] EE갤로그로 이동합니다. 11.11 84 3
816046 일반 진짜 미친놈들이네 ㅋㅋㅋ [9] 러갤러(180.66) 11.11 151 7
816045 일반 러, 北에 '화성-19형' 엔진 통째로 줬나…군 "엔진시험 안해" ㅇㅇ(118.41) 11.11 59 0
816044 일반 한국이 개시아 따위 헌신짝 버리듯 버려도 되는 이유 ㅇㅇ [3] ㅇㅇ(118.235) 11.11 78 2
816043 일반 미국힘 떨어지면 이스라엘 단독으로 사는게 가능함?? [5] ㅇㅇㅇ(218.238) 11.11 102 1
816042 일반 김정은 이 북한에 러시아군대 주둔시키면 어떻게 됨? [1] 러갤러(118.235) 11.11 48 0
816041 일반 lgbt시위도 대중이 일상서 시비처거니까 하는거아냐 ㄷㄷ(112.165) 11.11 29 0
816040 일반 암스테르담에 비상사태 선언 연장.. 14일까지 시위 금지 50명 체포 ㅇㅇ(118.41) 11.11 86 0
816039 일반 유럽복지 쩐다고 다큐까지나온거 ㄷㄷ(112.165) 11.11 47 0
816038 일반 쿠바, 허리케인 끝나자 이번엔 규모 6.8 지진…"이런 지진은 처음" [1] ㅇㅇ(118.41) 11.11 89 0
816037 일반 우뽕 새끼들은 부끄러운줄 알고 짜져있어야지 [3] EE갤로그로 이동합니다. 11.11 62 2
816035 일반 "나 물개 수신! 기다려라"…우크라, 북한군 암호 감청 공개 ㅇㅇ(118.41) 11.11 73 0
816034 일반 록펠러캐피탈은 제이콥 로스차일드와 견해가 같네 [1] ㅇㅇㅇ(218.238) 11.11 88 1
816033 일반 제이콥 로스차일드의 RIT 캐피털, 록펠러지분 매각 (17년 기사) ㅇㅇㅇ(218.238) 11.11 72 2
816032 일반 반일하면 지구상에서 좋아할나라가 하나도 없음 [2] ㄷㄷ(112.165) 11.11 37 0
816030 일반 러는미래에 극동국들과BRICS에준하는 단체를만들것. ㅇㅇ(220.116) 11.11 33 0
816029 일반 우뽕은 자기기만 인지부조화의 달인 EE갤로그로 이동합니다. 11.11 30 3
816028 일반 러시아가 무서운 이유는 EE갤로그로 이동합니다. 11.11 59 1
816027 일반 조센징의 90%가 가진 역겨운 인식수준www ㅇㅇ(194.195) 11.11 82 5
816026 일반 경제난에 할 것과 말 것들 [5] Hospitaller갤로그로 이동합니다. 11.11 78 1
816025 일반 아직도 정신못차리는 내선일체 동조선언론 ㅇㅇ(212.102) 11.11 47 2
816024 일반 "北, 최대 10만명 파병"…"트럼프 취임전 공세 커질 듯" [1] ㅇㅇ(118.41) 11.11 113 0
816023 일반 비트코인으로 대박난 '부탄'..."고맙다, 트럼프?" [1] ㅇㅇ(118.41) 11.11 155 1
816022 일반 아프리카, 다극세계 중심 중 하나가 될 것 ㅇㅇㅇ(218.238) 11.11 53 3
816021 일반 트럼프 안됬으면 다음 전쟁터는 한반도였음 [4] 러갤러(118.235) 11.11 138 9
816020 일반 민중은 개새끼다. [1] 러갤러(175.215) 11.11 42 2
816019 일반 곰팡이와 해조류도 서로 장점합쳐서 사기로 탄생하는데 ㅅㅂ(112.165) 11.11 31 0
816018 일반 도널드 트럼프 주니어 "네오콘 단한명도 기용하지 않을것" [2] 777(175.120) 11.11 155 6
816017 일반 phonk는 왜 한국서만 인기가 없는거냐 ㅅㅂ(112.165) 11.11 42 0
816015 일반 요즘 한국은 영국식민지정책칭송이 대세임 ㅅㅂ(112.165) 11.11 32 0
816014 일반 응 미군=게이섹스+한사능+계속 기어들어오며 뒤짖 [5] ㅇㅇ(212.102) 11.11 58 2
816011 일반 우크라 전쟁은 미국의 전략적 승리 [22] 러갤러(218.150) 11.11 1041 38
816010 일반 [속보] 이스라엘, 가자공습으로 이슬람 지하드 지도자 아부 사킬 살해했다 ㅇㅇ(118.41) 11.11 70 0
816009 일반 두바이 드랙경주에서 닛산, 람보기니 박살내는 샤오미 ㅇㅇㅈ(99.238) 11.11 76 1
816008 일반 미국한테 고마워할 필요없는이유 [1] 얀데레유빈갤로그로 이동합니다. 11.11 75 0
816007 일반 아조프나치曰,싸우기싫으면 시민권포기해라..그런데? [1] ㅇㅇ갤로그로 이동합니다. 11.11 101 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2