OpenAI의 AI 모델을 능가하는 DeepSeek의.. - 러시아-우크라이나 갤러리

러시아-우크라이나 갤러리

1/3

싱글벙글 동양인이 바라보는 세상 ㅇㅇ
너 때문에 차 긁었잖아…이중 주차했다고 목 조른 男, 쌍방 폭행 주장 감돌
강도가 집에 침입했을 때 보고싶지 않은 것은? 대한민국인디언
오래된 한옥 주택서 불길, 80대 할머니와 7살 손자 숨져.jpg ㅇㅇ
승객, 가족에 "유언 해야하나" 카톡 후 연락두절 포만한
24시간내로 안하면 죽는 만화...cli-MAX 기계인간양가람
부동산 까페 근황(feat. 찢재명) 유애사랑은역시
소방당국 “생존자 2명 외에 전원 사망 추정” ㅇㅇ
훌쩍훌쩍 일본에서 변화한 오타쿠 취급 흰콩
민주당, 무안 항공사고 "정부 탓" ㅇㅇ
푸틴, 아제르 대통령에게 사과 백수야붕이
싱글벙글 욕망가득 중세 성지자의 삶 ㅇㅇ
미국의 마이너 격투게임 대회 CEOTAKU 2024 참가 - 2(스압) 오카다
눈이 오길래 뛰쳐나가서 찍어옴 njnd
낚시 보드게임 2화 sgtHwang

한국인들이 공장일하러가면 겪는 일 밥먹는데 조선족이 밥 위에 몇번 씹은듯한 돈까스 던지고 감 ㅋㅋ버려야하는 반찬이 있으니 먹으러 오라고해서 가면 옆에서 돼지새끼 소새끼 욕설하며 지랄함 ㅋㅋ이런저런 수모를 겪으며 버텨봤자 아무도 너를 필요로 하지 않는다며 개지랄을 함 ㅋㅋ이 나라는 이런식으로 모든 비숙련 노동직이 조선족들에게 접수되었으며, 그 결과는 현재의 경제파탄임 ㅎㅎ영상 출처: https://youtu.be/MmrebL2QjeU?si=87A_XFVfLzyqFTBm 작성자 : 부갤러

[일반] OpenAI의 AI 모델을 능가하는 DeepSeek의..

시타

2024.12.28 15:56:33

조회 71 추천 2 댓글 1

https://www.scmp.com/tech/tech-trends/article/3292507/chinese-start-deepseek-launches-ai-model-outperforms-meta-openai-products

중국 스타트업 DeepSeek, Meta, OpenAI 제품보다 뛰어난 성능의 AI 모델 공개

DeepSeek의 V3 모델은 경쟁사보다 훨씬 적은 컴퓨팅 리소스를 사용하여 558만 달러의 비용으로 2개월 동안 훈련되었다

베이징에서 벤장
게시됨: 2024년 12월 27일 오후 6시 45분
-
-
중국 스타트업 DeepSeek의 새로운 대규모 언어 모델(LLM) 공개가 전 세계 인공지능(AI) 업계에 파장을 일으켰는데, 벤치마크 테스트 결과 Meta Platforms와 ChatGPT 제작자 OpenAI의 언어 모델들을 능가하는 것으로 나타났다.

항저우에 본사를 둔 이 회사는 목요일 위챗 게시물에서 자사의 이름을 딴 LLM인 DeepSeek V3가 671억 개의 파라미터를 포함하고 있으며, 대형 기술 회사에서 개발한 모델보다 훨씬 적은 컴퓨팅 리소스를 사용하여 약 2개월 만에 558만 달러의 비용으로 훈련을 완료했다고 발표했다.

LLM은 ChatGPT와 같은 생성형 AI 서비스의 기반이 되는 기술을 말한다. AI에서, 많은 수의 파라미터는 LLM이 더 복잡한 데이터 패턴에 적응하고 정확한 예측을 할 수 있도록 하는 데 핵심적인 역할을 한다.

OpenAI의 창립 팀원인 컴퓨터 과학자 안드레이 카르파시는 소셜 미디어 플랫폼 X에 올린 글에서 이 중국 스타트업의 새로운 AI 모델에 대한 기술 보고서에 대해 “DeepSeek는 오늘 저예산으로 훈련된 프론티어급 LLM을 오픈 웨이트 Open weights 공개했다.”라고 말했다.

**********
https://x.com/karpathy/status/1872362712958906460

Andrej Karpathy
@karpathy

DeepSeek(중국 AI 공동 개발사)는 오늘 저예산(2개월간 2048개의 GPU, 600만 달러)으로 훈련된 프론티어급 LLM을 오픈 웨이트 공개했다.

참고로, 이 수준의 성능을 구현하려면 1만 6천개에 가까운 GPU 클러스터가 필요하다고들 하지만, 현재 나오고 있는 것들은 그 이상 약 10만 개의 GPU가 필요하다. 예를 들어 Llama 3 405B는 3080만 GPU 시간을 사용했다. 그런데 DeepSeek V3는 280만 GPU 시간(약 11배 적은 컴퓨팅)만 들었는데도 더 강력한 모델인 것 같다. 이 모델이 vibe checks (예: LLM 아레나 랭킹이 진행 중이며 지금까지 몇 가지 간단한 테스트가 잘 진행되었다)도 통과한다면, 그것은 리소스 제약 하에서의 연구 및 엔지니어링의 매우 인상적인 제시일 것이다.

이것은 프론티어 LLM을 위해 대규모 GPU 클러스터가 필요하지 않다는 것을 의미하는가? 필요하지 않다, 하지만 가지고 있는 것을 낭비하지 않아야 하며, 이것은 데이터와 알고리즘 모두에서 아직 해결해야 할 일이 많다는 것을 보여주는 좋은 예시처럼 보인다. 매우 훌륭하고 상세한 기술 보고서도 읽어보았다.

4:23 AM · Dec 27, 2024
**********

오픈 웨이트란 AI 모델의 사전 학습된 파라미터 또는 웨이트만 공개하는 것으로, 제3자가 추론과 미세 조정에만 모델을 사용할 수 있도록 허용하는 것을 말한다. 모델의 학습 코드, 원본 데이터 세트, 아키텍처 세부 정보 및 학습 방법론은 제공되지 않는다.

Meta나 OpenAI와 같은 대기업이 일반적으로 투자하는 비용의 일부만으로 강력한 LLM을 개발한 DeepSeek의 사례는 모델 학습에 사용되는 고급 반도체에 대한 접근을 차단한 미국의 제재에도 불구하고 중국 AI 기업이 얼마나 발전해왔는지 보여준다.

DeepSeek는 비용 효율적인 학습을 위해 설계된 새로운 아키텍처를 활용하여 V3 모델에 278만 GPU 시간(그래픽 처리 장치가 LLM을 학습하는 데 사용되는 총 시간)만 필요했다. 이 스타트업의 훈련 프로세스에는 중국 맞춤형 Nvidia의 H800 GPU가 사용되었다.

이 프로세스는 중국으로 수출할 수 없는 엔비디아의 고급 H100 칩으로 Llama 3.1 모델을 훈련하는 데 필요한 3,080만 GPU 시간보다 훨씬 적은 양이었다. 카파티는 자신의 X 게시물에서 “DeepSeek V3는 280만 GPU 시간만 들었는데도 더 강력한 모델인 것 같다.”라고 썼다.

DeepSeek가 게시한 V3에 대한 기술 보고서에 따르면, 텍스트 이해 및 생성, 도메인 전문 지식, 코딩 및 수학 문제 해결 등 AI 시스템의 능력을 평가하는 일련의 벤치마크 테스트에서 DeepSeek의 LLM이 Meta의 Llama 3.1과 알리바바 그룹 홀딩의 Qwen 2.5보다 뛰어난 성능을 보인 것으로 나타났다. 알리바바는 사우스차이나모닝포스트를 소유하고 있다.

동일한 벤치마크 테스트에서 V3의 결과는 OpenAI의 GPT-4o 및 Amazon.com이 지원하는 Anthropic의 Claude 3.5 Sonnet의 결과와 일치하는 것으로 나타났다.

DeepSeek는 작년 7월 중국 본토에서 가장 큰 퀀트 헤지펀드 중 하나를 운영하기 위해 AI를 사용하는 하이플라이어 퀀트(High-Flyer Quant)에서 분사했다.

항저우에 본사를 둔 하이플라이어는 2019년부터 2020년까지 2억 위안(2,740만 달러)을 들여 AI 클러스터인 파이어플라이어 1을 개발한 데 이어 10억 위안을 더 들여 파이어플라이어 2를 구축했다고 회사 웹사이트에 밝혔다.

지난 4월 발표에서, 하이-플라이어는 DeepSeek의 개발 목표가 “모든 인류에게 도움이 되는 AI”를 만드는 것이라고 말했다. 앞서 DeepSeek는 개발자가 써드 파티 애플리케이션을 개발하는 데 사용하는 일련의 AI 모델과 자체 챗봇을 출시한 바 있다.

고정닉 1

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2959	설문	2024년 가장 기억에 남는 인터넷 이슈는?	운영자	24/12/23	-	-
829389	일반	킹제임스 성경 읽어라	케말파샤	14:35	14	0
829387	일반	종의기원 한권만 읽어도 지식수준이 깊어진다	ㅇㅇ(175.214)	14:33	23	0
829386	일반	러뽕 됐다가 졸지에 중뽕, 북뽕까지 되어버리 러뽕 새끼들 ㅋㅋㅋ [1]	ㅇㅎ(124.49)	14:33	28	2
829385	일반	성경 하나만 읽어도 어휘력과 지식이 확 올라간다	케말파샤	14:31	13	0
829384	일반	웃기는 병맛 광고 ㅋㅋㅋ [1]	Hospitaller	14:20	15	0
829383	일반	일본 만화계에서 원피스 작가 위상 vs 미술사에서 클로드 모네 위상 [1]	ㅇㅇ(118.235)	14:09	17	0
829382	일반	씨부랄 넘들 게엄쇼를 뱅기 추락쇼로 방향 트는 것 보소 ㅋ [6]	러갤러(49.246)	14:00	57	0
829380	일반	사실인가요?	러갤러(61.101)	13:52	23	0
829379	일반	진화론 믿는게 진짜 보수 [4]	ㅇㅇ(175.214)	13:51	27	0
829376	일반	샤를세환피셜 : 중국 6세대 전투기 기술 상당한 수준인것 같다 [12]	러갤러(1.254)	13:41	79	0
829375	일반	2찍 ㄷㅅ들 [1]	러갤러(211.219)	13:28	27	0
829374	일반	재앙이를 위해 두창이는 하야한다	ㅇㅇㅇ(218.238)	13:24	26	1
829373	일반	예측 하나도 못하는 ㅂㅅ들이 찢빠되었노	ㅇㅇㅇ(218.238)	13:21	27	2
829372	일반	한국에 보수가 어디 있노	ㅇㅇㅇ(223.39)	13:19	27	2
829371	일반	두창이보고 보수정권이라 말하노 [1]	ㅇㅇㅇ(218.238)	13:18	34	1
829370	일반	머스크는 리버럴 개싫어함	ㅇㅇㅇ(218.238)	13:17	22	1
829369	일반	보수정권마다 사람이 죽어나가네 너무 슬프다 [1]	ㅇㅇ(118.235)	13:10	29	0
829368	일반	동양에도 여왕있었다면서 왜 서양 빅토리아시대가 역사에 많이나옴?	러갤러(1.230)	13:08	10	0
829367	일반	역적 찢죄명 하프앤하프 케말이를 지금 당장 능지처사 하고 [1]	냠냠꾼(77.111)	13:07	15	0
829365	일반	ㅅㅂ 무안 뭐냐 이거	러갤러(211.219)	13:02	52	0
829364	일반	무안 여객기 사고는 당연히 케말이 하고 하프앤하프가 책임 져야지! [1]	냠냠꾼(77.111)	12:55	33	0
829362	일반	찐보수는 러시아지	ㅇㅇㅇ(218.238)	12:54	24	1
829361	일반	두창이도 재앙이하고 한편이라 군인동성애 ㅇㅈ	ㅇㅇㅇ(218.238)	12:53	21	1
829360	일반	게이커플이 입양한 아들 성폭행	ㅇㅇㅇ(218.238)	12:51	20	1
829359	일반	여기 찢빠들 동성애 얘기만 나오면 인정안하노	ㅇㅇㅇ(218.238)	12:48	21	1
829358	일반	박정희가 일본군대있던 시절에 남자랑 많이 했다던데 [1]	ㅇㅇ(121.163)	12:48	41	3
829357	일반	이재명, 케말이는 신 한테 선택 받았다. [1]	냠냠꾼(77.111)	12:47	17	0
829356	일반	민좃당이 리버럴하고 한팀이잖아	ㅇㅇㅇ(218.238)	12:46	19	1
829355	일반	민주당이 차별금지법 제정하는 리버럴 당이다? [1]	ㅇㅇ(118.235)	12:46	42	4
829354	일반	미군 f18 격추랑 비슷함	ㅇㅇ(118.235)	12:45	33	0
829353	일반	민좃당이 차별금지법제정에 진심이지	ㅇㅇㅇ(218.238)	12:44	19	1
829352	일반	너네 솔직히 다음대선 이 재 명 뽑을거잖아 [2]	하프앤하프	12:44	31	2
829351	일반	똥꼬만 보면 좋다고 하고 싶어하는 리버럴놈들은 소아성애가 취미임 [4]	ㅇㅇㅇ(218.238)	12:43	43	1
829350	일반	비행기 사고로 보수집권은 이제 절대없다 [1]	ㅇㅇ(118.235)	12:42	32	0
829349	일반	또 왔노 리버럴팀들 [1]	ㅇㅇㅇ(218.238)	12:42	31	1
829348	일반	국힘 뽑지마라 사람 죽일려고 작정한 새끼들이다	ㅇㅇ(121.163)	12:42	15	0
829347	일반	드론언급=정상참작 좀 해줘라	ㅇㅇ(118.235)	12:41	20	0
829346	일반	일본군 박정희가 죽인 독립군 숫자 200명	ㅇㅇ(121.163)	12:41	17	0
829345	일반	박정희도 사람 죽이는거 좋아하던데	ㅇㅇ(121.163)	12:40	13	0
829344	일반	러시아 진짜 대단하네 [3]	ㅇㅇ(106.102)	12:40	77	3
829343	일반	보수정권 = 인신공양 좋아하는 마야문명	ㅇㅇ(121.163)	12:40	19	0
829342	일반	윤석열 비행기 인신공양으로 200명 죽이네 [1]	ㅇㅇ(121.163)	12:38	34	0
829341	일반	박근혜 세월호 인신공양으로 300명 죽이고	ㅇㅇ(121.163)	12:38	17	0
829340	일반	러시아는 우크라를 일어나지 못할정도로 밟아놔야 함	ㅇㅇㅇ(218.238)	12:37	21	1
829339	일반	러시아가 시리아 쳐발리고 아제르 민항기에 분풀이한거지 [1]	ㅇㅇ	12:37	48	2
829338	일반	일뽕들이랑 꼴페미들이랑 둘이 전쟁 좀 해	러갤러(118.235)	12:37	14	1
829337	일반	드론이랑 방공망이 동시에 조졌을 확률은 있음	ㅇㅇ(118.235)	12:36	23	0
829336	일반	우크라이나가 드론 더 보내야 한다	케말파샤	12:36	27	1
829335	일반	박근혜>>세월호 인신공양 윤석열>> 비행기 인신공양	ㅇㅇ(121.163)	12:36	22	0
829334	일반	일뽕 = 인셀	러갤러(118.235)	12:36	15	1
	뉴스	스테이씨 윤, ‘스타라이트 보이즈’ 최종화까지 든든하게 채웠다	디시트렌드	10:00