디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 중 AI 기업들, 칩금지에 맞서 영리하게 혁신

시타갤로그로 이동합니다. 2024.09.21 15:27:07
조회 83 추천 2 댓글 0

https://www.economist.com/science-and-technology/2024/09/19/chinas-ai-firms-are-cleverly-innovating-around-chip-bans

중국 AI 기업들은 칩 금지에 맞서 영리하게 혁신하고 있다


강력한 하드웨어의 부족을 무디게 하는 소프트웨어 트윅


2024 2024년 9월 19일

-

-


오늘날 최고의 인공지능(AI) 모델은 그래픽 처리 장치(GPU)로 알려진 수많은 최첨단 프로세서에 의존한다. 대부분의 서구 기업들은 이를 확보하는 데 어려움이 없다. 소셜 미디어 대기업인 Meta의 최신 모델인 Llama 3는 미국 칩 제조업체인 Nvidia의 H100 GPU 16,000개로 훈련되었다. Meta는 연말까지 60만 개를 더 비축할 계획이다. 

엘론 머스크가 투자한 스타트업인 XAI는 멤피스에 100,000개의 H100으로 구동되는 데이터 센터를 구축했다. 또 다른 대형 모델 제조업체인 OpenAI는 GPU 보유량에 대해 함구하고 있지만, 지난 4월 Nvidia의 사장인 젠슨 황이 직접 최신 프로세서를 전달한 바 있다.


이런 종류의 접근은 대부분의 중국 기술 기업에게는 먼 꿈일 뿐이다. 미국은 2022년 10월부터 고성능 프로세서의 중국 판매를 차단했다. 일부 중국 기업들은 이 탐나는 칩을 손에 넣기 위해 암시장으로 눈을 돌리고 있다는 소문이 돌고 있다. 그러나 대다수는 제한된 자원을 최대한 활용하는 데 초점을 맞추고 있다. 그들의 결과는 서구 기업들에게 생각할 거리를 제공하고 있다.


항저우에 본사를 둔 중국 스타트업인 DeepSeek도 혁신 기업 중 하나이다. 9월 초에 출시된 최신 모델인 DeepSeek-v2.5는 영어와 중국어로 된 코딩 과제뿐만 아니라 다른 오픈 소스 모델과 비교해도 손색이 없다. 이러한 성과는 규모에 그치지 않는다:  DeepSeek는 중국 회사로서는 큰 규모이지만 미국 경쟁사 기준으로 보면 적은 수인 Nvidia의 구형 GPU를 10,000개 이상 보유하고 있는 것으로 알려져 있다.


DeepSeek는 여러 가지 방식으로 이러한 부족함을 보완한다. 첫 번째는 각기 다른 문제에 가장 적합한 여러 가지 네트워크로 구성되어 있다는 점이다. 이러한 '전문가 혼합' 접근 방식을 통해 모델은 각 작업을 적절한 네트워크에 위임하여 속도를 개선하고 처리 시간을 단축할 수 있다. 


DeepSeek는 서로 다른 데이터 비트를 연결하는 가상 연결인 2360억 개의 '매개변수'를 가지고 있지만, 처리하는 새로운 정보 덩어리마다 한 번에 10분의 1도 채 사용하지 않는다. 또한 이 모델은 새로운 데이터를 처리하기 전에 압축한다. 이를 통해 대용량 입력을 보다 효율적으로 처리할 수 있다.


GPU 부족에 대한 창의적인 해결책을 찾는 것은  DeepSeek만이 아니다. 칭화대학교와 AI 스타트업인 ModelBest가 개발한 오픈 소스 모델인 MiniCPM은 각각 24억 개와 12억 개의 매개 변수를 가진 다양한 종류가 있다. 작은 크기에도 불구하고 언어 관련 작업에 대한 MiniCPM의 성능은 70억~130억 개의 파라미터를 사용하는 대규모 언어 모델(LLM)과 비슷하다. DeepSeek의 모델과 마찬가지로 전문가 혼합 접근 방식과 입력 압축을 결합한다. 그러나 매개 변수가 적은 다른 소형 모델과 마찬가지로 MiniCPM도 특정 학습 분야 외의 영역에서는 그다지 높은 성능을 발휘하지 못할 수 있다.


MiniCPM은 크기가 작기 때문에 개인용 기기에 적합하다. 지난 8월에는 여러 언어를 지원하고 텍스트, 이미지, 오디오 등 다양한 유형의 데이터와 함께 작동하는 휴대폰용 버전을 출시했다.


다른 곳에서도 비슷한 접근 방식이 시도되고 있다. Together.ai, Meta, Nvidia의 연구원들이 개발한 알고리즘인 FlashAttention-3은 Nvidia의 H100 GPU에 맞게 설계하여 LLM의 훈련 및 실행 속도를 높인다. Google DeepMind에서 7월에 발표한 또 다른 알고리즘인 JEST는 초기 학습을 위해 소량의 고품질 데이터를 제공한 후 더 큰 규모의 저품질 데이터 세트에 투입한다. 이 방식은 다른 방식보다 13배 빠르고 10배 더 효율적이라고 구글은 주장한다. OpenAI를 지원하는 Microsoft의 연구원들도 약 40억 개의 매개 변수가 있는 Phi-3 mini라는 소형 언어 모델을 출시했다.


서구 기업들과 달리 중국 기업들에게 적은 자원으로 더 많은 일을 하는 것은 선택 사항이 아니다[필수 사항이다]. 하지만 이것이 나쁘지 않을 수도 있다. AI 투자 펀드인 Air Street Capital의 Nathan Benaich는 “희소성 사고방식은 확실히 효율성 향상에 인센티브를 제공한다.”라고 말한다. ■


추천 비추천

2

고정닉 1

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2944 설문 축의금 적게 내면 눈치 줄 것 같은 스타는? 운영자 24/11/11 - -
815794 일반 이번에 트럼프가 승리할 수 있었던 가장 결정적인 이유를 알려준다 [1] 러갤러(115.137) 11.10 119 5
815793 일반 냥이도 아침 물 먹는다 Hospitaller갤로그로 이동합니다. 11.10 36 0
815790 일반 송파, 16억 부동산 --- 5억됨 ㅎ [1] Hospitaller갤로그로 이동합니다. 11.10 113 0
815789 일반 러시아 지원에 올인하는 중국의 속셈 [3] ㅇㅇ갤로그로 이동합니다. 11.10 129 0
815788 일반 트럼프 아들 배런 좋아하는 연령대와 성별을 보자 [2] ㅇㅇㅇ(218.238) 11.10 225 1
815787 일반 수박 좀 므그바 Hospitaller갤로그로 이동합니다. 11.10 14 0
815786 일반 짱깨새끼들 하이~♥ ㅇㅇ(223.39) 11.10 32 2
815785 일반 케네디 주니어 들어온다니까 똥꼬 탄 한국언론 그리고 반대되는 댓글 ㅇㅇㅇ(218.238) 11.10 111 5
815783 정보 조센징새끼들 케네디주니어가 뭐할 위업자인지도 모르잖아ㅋㅋ [1] ㅇㅇ(212.102) 11.10 71 5
815782 일반 미국 쇠퇴해가는 데 [1] EE갤로그로 이동합니다. 11.10 61 3
815781 일반 케네디 주니어 들어오면 약팔이들 긴장하겠노ㅋ [2] ㅇㅇㅇ(218.238) 11.10 93 2
815780 일반 영국 제2의 도시 버밍엄 파산후 1년이 지난 현재 상황 [1] ㅇㅇ갤로그로 이동합니다. 11.10 103 1
815779 일반 BBC, 우크라이나는 크림반도를 잃었다 [2] 러갤러(175.120) 11.10 131 2
815778 일반 중국같은 국가는 진짜 인구가 줄어드는게 축복이지 [4] 러갤러(115.137) 11.10 118 0
815777 일반 독일 자동차 산업 몰락을 조명하는 폴란드 언론 댓글 [2] 러갤러(175.120) 11.10 124 2
815776 일반 ㅅㅂ 우크라군 모럴 와해중이네 [2] ㅇㅇ(121.129) 11.10 120 4
815775 일반 트럼프 귀환에 북미대화 시간문제…고민 깊어지는 한국 [2] ㅇㅇ(118.41) 11.10 102 0
815772 일반 예멘 합동 군사훈련중 사우디군 2명 사망, 1명 부상 [1] 러갤러(175.120) 11.10 77 1
815771 일반 폴란드는 이제 와서 발뺌해도 소용 없지 싶은데 [8] ㅇㅇ(194.195) 11.10 160 2
815770 일반 우크라이나, 키예프 민간공항 재가항 결정 [1] 러갤러(175.120) 11.10 66 0
815769 일반 포스코 포항제철소 3파이넥스공장서 큰 불…주민 "3차례 폭발" [1] ㅇㅇ(118.41) 11.10 135 0
815768 일반 [속보] 미영 연합군, 주말 예멘 수도에 3차례 폭격 [3] ㅇㅇ(118.41) 11.10 97 0
815767 일반 중국 출산율)"매년 죽는 노인 숫자가 신생아의 6배 될것" [17] ㅇㅇ(1.237) 11.10 517 20
815766 일반 [속보] 포스코 "포항제철소 3파이넥스서 불" ㅇㅇ(118.41) 11.10 71 0
815765 일반 최근 전황 이것만 보면 됨 [3] ㅇㅇ(121.129) 11.10 113 4
815764 일반 북한 군인 참수 ㅇㅇ(211.235) 11.10 93 0
815762 일반 이마트 직원이 대학생 알바에게 보낸 문자,, 러갤러(116.121) 11.10 68 0
815761 일반 계속되는 우구라 길거리 강제 징집 [3] ㅇㅇ갤로그로 이동합니다. 11.10 120 2
815760 일반 푸틴, '전쟁 처하면 군사원조' 북러조약 서명…발효 눈앞 ㅇㅇ(118.41) 11.10 89 2
815758 일반 부정선거 없다던 저능아들 토벌 시작이 되었습니다. [1] 러갤러(211.218) 11.10 64 2
815757 일반 슬로바키아 피코총리!! 폴란드 총리!! 러갤러(180.66) 11.10 83 0
815756 일반 트럼프, 불법이민자 추방에 군 동원하나...비상사태 선포 검토 [3] ㅇㅇ(118.41) 11.10 146 1
815754 일반 트럼프뽕들이 머저리인 이유 [7] ㅇㅇㅈ(99.238) 11.10 111 5
815753 일반 나.모스크바 왓음 [6] 뜬구름잡냐갤로그로 이동합니다. 11.10 127 1
815752 일반 트황상을 반대하는 것들의 정체 [1] ㅇㅇ(112.72) 11.10 57 1
815750 일반 "윤석열 검찰독재 정권에게 국민은 제압의 대상" 진짜 많이 모였네 [1] ㅇㅇ(101.96) 11.10 70 2
815749 일반 “윤석열 퇴진” 집회로 세종대로 마비…현행범 체포 10명 [3] ㅇㅇ(101.96) 11.10 115 0
815748 일반 미국이랑 FTA 한 나라가 별루 없네 [1] 할랄포크갤로그로 이동합니다. 11.10 111 1
815745 일반 정말 윤두창 지지율이 바닥이라면... [12] ㅇㅇ(194.195) 11.10 127 3
815744 일반 펨코 개틀딱 병신 사이트 증명했네 중국여행4배올랐다고 이대남깜 [7] ㅇㅇ(140.248) 11.10 431 21
815742 일반 트럼프 "모스크바를 침공해서 푸틴을 때릴 것이다" [3] ㅇㅇ(194.195) 11.10 205 8
815741 일반 네타냐후, 차기 미 대사에 '팔 서안 점령 지지' 강경 우파 임명 ㅇㅇ(118.41) 11.10 51 1
815740 일반 하마스가 협상을 거부한다면 전쟁을 지속한다는 거자나? [4] 13567(39.117) 11.10 58 0
815739 일반 카타르 "이스라엘·하마스 중재 그만두겠다" [1] ㅇㅇ(118.41) 11.10 108 0
815738 일반 디시 수준낮은 정치글 이제 못보겠네 ㅇㅇ(118.235) 11.10 42 0
815737 일반 당장 쥴리 단고기글 댓글만 봐도 견적 안나오냐? [1] ㅇㅇ(194.195) 11.10 88 4
815736 일반 윤두창을 수호하기 위해 모인 조센징의 90% [1] ㅇㅇ(194.195) 11.10 47 1
815735 일반 남대문 집회 "30만 모였다" 탄핵 띄운 北 [6] ㅇㅇ(101.96) 11.10 115 0
815734 일반 거리로 나온 시민들 "윤석열 퇴진하라"..경찰, 집회 참가자 11명 체포 [6] ㅇㅇ(101.96) 11.10 98 0
815733 일반 탄핵 직전 닭근혜 vs 범국민적 지지를 받는 윤두창 [2] ㅇㅇ(194.195) 11.10 69 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2