디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

오픈AI, 텍스트를 통해 비디오 생성하는 AI 모델 'Sora' 발표

GPTMAGAZINE갤로그로 이동합니다. 2024.02.16 15:26:11
조회 1650 추천 1 댓글 5



🔼 텍스트에서 비디오로의 창의적 변환

🔼 비주얼 아티스트와 디자이너를 위한 새로운 가능성

🔼 AI 기반 비디오 제작의 변화









OpenAI가 텍스트 지시를 통해 현실적이며 상상력 넘치는 장면을 창조할 수 있는 새로운 AI 모델인 Sora를 소개했습니다. 이 혁신적인 텍스트-비디오 모델은 최대 1분 길이의 비디오를 생성할 수 있으며, 높은 시각적 품질과 사용자의 프롬프트에 대한 충실도를 유지합니다. 현재, Sora는 잠재적 위험성을 평가하기 위해 레드 팀에 의해 평가되고 있으며, 선택된 시각 예술가, 디자이너, 그리고 영화 제작자들에게도 접근성을 제공하여 창의적 전문가들에게 가장 유용하게 모델을 발전시킬 수 있는 피드백을 얻고 있습니다.

Sora는 여러 캐릭터가 포함된 복잡한 장면, 다양한 종류의 움직임, 그리고 주제와 배경의 정확한 세부 사항을 생성할 수 있는 능력으로 눈에 띕니다. 모델은 사용자가 프롬프트에서 요청한 것뿐만 아니라 그러한 것들이 물리적 세계에서 어떻게 존재하는지를 이해합니다.

모델은 언어에 대한 깊은 이해를 가지고 있어, 프롬프트를 정확하게 해석하고 생동감 있는 감정을 표현하는 매력적인 캐릭터들을 생성할 수 있습니다. Sora는 또한 단일 생성 비디오 내에서 캐릭터와 시각적 스타일을 정확하게 유지하는 여러 장면을 만들 수 있습니다.

그러나, Sora에는 한계가 있습니다. 복잡한 장면의 물리학을 정확하게 시뮬레이션하는 데 어려움이 있으며, 특정 원인과 결과의 인스턴스를 이해하지 못할 수 있습니다. 예를 들어, 누군가 쿠키를 한 입 물었지만, 그 후에 쿠키에 물린 자국이 나타나지 않을 수 있습니다.

모델은 또한 프롬프트의 공간적 세부 사항을 혼동할 수 있으며, 시간이 지남에 따라 발생하는 특정 이벤트의 정확한 설명, 예를 들어 특정 카메라 궤적을 따르는 것과 같은 문제에 어려움을 겪을 수 있습니다.

OpenAI 제품에 Sora를 통합하기 전에 여러 중요한 안전 조치를 취하고 있습니다. 오해의 소지가 있는 콘텐츠를 탐지하는 도구를 개발하고, DALL·E 3에서 구축한 기존의 안전 방법을 활용하여, 오용 가능성을 완화합니다.

Sora의 기술은 확산 모델에 기반을 두고 있으며, 정적 노이즈처럼 보이는 비디오에서 시작하여 많은 단계를 거쳐 노이즈를 제거함으로써 명확한 비디오로 변환합니다. 이 모델은 GPT 모델과 유사한 트랜스포머 아키텍처를 사용하여 우수한 확장 성능을 제공합니다.

이 모델은 텍스트 지시만으로 비디오를 생성할 수 있을 뿐만 아니라, 기존의 정지 이미지를 가져와 그 내용을 정확하게 애니메이션화하거나 기존 비디오를 확장하거나 누락된 프레임을 채울 수 있습니다. Sora는 실제 세계를 이해하고 시뮬레이션할 수 있는 모델을 위한 기초를 제공하며, 이는 인공 일반 지능(AGI)을 달성하기 위한 중요한 이정표가 될 것으로 믿습니다.

Sora와 그 기능에 대한 자세한 내용은 OpenAI가 발표한 기술 보고서에서 확인할 수 있습니다.












◎GPT매거진 (https://www.gptmagazine.net)

지피티 기자 : gptmagazinebiz@gmail.com

카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf

페이스북 그룹 : https://www.facebook.com/groups/392367786704067


추천 비추천

1

고정닉 0

2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
315 애플, 1100억 달러 규모 자사주 매입 결정.. AI 탑재 신제품 예고 [5] GPTMAGAZINE갤로그로 이동합니다. 05.03 5386 3
314 애플, AI 개발 위해 스위스에 비공개 연구소 구축 [4] GPTMAGAZINE갤로그로 이동합니다. 05.02 1817 3
313 SKT, 통신 분야 최적화된 'AI 멀티엔진' 개발 착수 GPTMAGAZINE갤로그로 이동합니다. 05.02 118 0
312 마이크로소프트, AI 전력 확보 위해 재생에너지에 14조 투자 [5] GPTMAGAZINE갤로그로 이동합니다. 05.02 5205 4
311 깃허브, 개발자의 코드 작성부터 테스트까지 지원하는 AI 발표 [3] GPTMAGAZINE갤로그로 이동합니다. 04.30 2504 3
310 인텔, 삼성, 네이버의 연합으로 새로운 AI 생태계의 출범 [36] GPTMAGAZINE갤로그로 이동합니다. 04.29 5564 19
309 메타, ‘라마 3’ 와 ‘메타 AI’ 오픈소스 공개 [6] GPTMAGAZINE갤로그로 이동합니다. 04.25 2611 1
308 어도비, 창의적 AI 모델인 'Firefly Image 3' 공개 [14] GPTMAGAZINE갤로그로 이동합니다. 04.24 5689 2
307 업스테이지, 1000억 원 투자 유치로 글로벌 AI 시장 진출 가속화 [3] GPTMAGAZINE갤로그로 이동합니다. 04.23 2140 1
306 일본 소프트뱅크, '챗GPT 잡기' 위한 통큰 투자 전략 공개 [13] GPTMAGAZINE갤로그로 이동합니다. 04.23 5522 7
305 중국 바이두, 챗GPT 넘어서기 위한 대규모 개발 도전 GPTMAGAZINE갤로그로 이동합니다. 04.23 264 0
304 영국 작가협회, 번역 AI로 인한 번역가 일자리 감소 및 소득 하락 [16] GPTMAGAZINE갤로그로 이동합니다. 04.23 2847 7
303 텐센트AI, 3조 토큰의 파워로 오픈AI 압도하나 [3] GPTMAGAZINE갤로그로 이동합니다. 04.22 2249 0
302 마이크로소프트, 사람 얼굴 이미지를 말하는 동영상으로 변환 [14] GPTMAGAZINE갤로그로 이동합니다. 04.22 6672 6
301 구글, 코카콜라와 로레알 AI광고 파트너십 체결 GPTMAGAZINE갤로그로 이동합니다. 04.15 1986 1
300 구글 , 신형 ‘제미나이 1.5 프로' 도입으로 개발시간 40% 단축 GPTMAGAZINE갤로그로 이동합니다. 04.11 599 3
299 오픈AI, 챗GPT 내 DALL-E 이미지 편집 기능 업데이트 발표 [1] GPTMAGAZINE갤로그로 이동합니다. 04.04 4780 3
295 챗GPT 이제 계정 없이도 자유롭게! 오픈AI의 대대적 접근성 향상 전략 [5] GPTMAGAZINE갤로그로 이동합니다. 04.03 6272 9
294 오픈AI, 이달 일본 도쿄에 아시아 첫 거점 개설 [6] GPTMAGAZINE갤로그로 이동합니다. 04.02 1124 5
293 MS-오픈AI, 슈퍼컴퓨터 구축에 135조 원 투자 [5] GPTMAGAZINE갤로그로 이동합니다. 04.01 4953 9
292 실리콘밸리 최상급 AI 전문가, 연봉 13억 이상으로 급상승 GPTMAGAZINE갤로그로 이동합니다. 03.28 1417 2
291 오픈AI, Sora를 통한 크리에이터들의 첫 작품 공개 [4] GPTMAGAZINE갤로그로 이동합니다. 03.27 1233 2
290 청소년, 음란 AI 챗봇에 쉽게 접근 무방비 노출 [39] GPTMAGAZINE갤로그로 이동합니다. 03.26 2679 0
289 애플, 바이두 AI 기술 도입 검토 [31] GPTMAGAZINE갤로그로 이동합니다. 03.26 2702 11
288 오픈AI, 새로운 AI 음성 비서 출시 예정 [6] GPTMAGAZINE갤로그로 이동합니다. 03.25 4889 0
287 블랙웰의 등장과 AI의 확장, 기독교적 복음의 전달 [1] GPTMAGAZINE갤로그로 이동합니다. 03.22 580 0
286 오픈AI, GPT-5 올 여름 출시 예정 [11] GPTMAGAZINE갤로그로 이동합니다. 03.21 3166 9
285 애플, 구글과 차세대 아이폰에 생성 AI 탑재를 위한 협력 모색 [8] GPTMAGAZINE갤로그로 이동합니다. 03.20 4739 4
284 xAI, 새로운 AI 모델 Grok-1 발표 [2] GPTMAGAZINE갤로그로 이동합니다. 03.18 1068 0
283 MS, 전 세계 코파일럿 프로 출시와 함께 1개월 무료 체험 제공 [18] GPTMAGAZINE갤로그로 이동합니다. 03.15 5454 5
282 오픈AI, 소라AI 올해 안에 공개 예정 [18] GPTMAGAZINE갤로그로 이동합니다. 03.14 2739 4
281 국내 AI 대체 가능 일자리 327만개…60%는 전문직 집중 포진 [27] GPTMAGAZINE갤로그로 이동합니다. 03.13 2104 5
280 일론 머스크, xAI의 챗봇 '그록' 오픈소스로 공개 예정 [15] GPTMAGAZINE갤로그로 이동합니다. 03.12 4993 6
279 가상 인간 아나운서, 제주도 뉴스 새 얼굴로 등장 GPTMAGAZINE갤로그로 이동합니다. 03.12 441 1
278 검찰, ‘AI수사관’ 도입 예정 [26] GPTMAGAZINE갤로그로 이동합니다. 03.07 6005 5
277 마이크로소프트 코파일럿, 파일 분석 기능 서비스 [11] GPTMAGAZINE갤로그로 이동합니다. 03.05 42927 5
276 챗GPT, 음성으로 답변한다 [4] GPTMAGAZINE갤로그로 이동합니다. 03.05 2265 1
275 구글, 신규 AI 모델 '젬마' 공개 [15] GPTMAGAZINE갤로그로 이동합니다. 02.28 2148 2
274 MS, 코파일럿 한글판 출시 앞당겨... [1] GPTMAGAZINE갤로그로 이동합니다. 02.26 5318 6
273 오픈AI, ChatGPT 플러그인 베타 종료 발표 [3] GPTMAGAZINE갤로그로 이동합니다. 02.26 3039 0
272 스테이블 디퓨전 3 출시 예정 [4] GPTMAGAZINE갤로그로 이동합니다. 02.23 3104 4
271 북한 해커, AI 사용해 가상화폐 거래소 공격 확대 [5] GPTMAGAZINE갤로그로 이동합니다. 02.20 5321 7
270 AI가 만든 아이스크림, 배스킨라빈스의 새로운 도전 [12] GPTMAGAZINE갤로그로 이동합니다. 02.19 2728 2
269 법조계를 혁신하는 AI 기술, 법률 분야에 새로운 가능성 제시 [9] GPTMAGAZINE갤로그로 이동합니다. 02.19 2471 3
268 구글, 차세대 AI 모델 'Gemini 1.5' 발표 GPTMAGAZINE갤로그로 이동합니다. 02.16 517 1
오픈AI, 텍스트를 통해 비디오 생성하는 AI 모델 'Sora' 발표 [5] GPTMAGAZINE갤로그로 이동합니다. 02.16 1650 1
266 애플의 새로운 AI 도구 '키프레이머' [9] GPTMAGAZINE갤로그로 이동합니다. 02.15 2256 1
265 엔비디아, PC용 개인 AI 챗봇 'Chat with RTX' 출시 [5] GPTMAGAZINE갤로그로 이동합니다. 02.14 1104 1
264 오픈AI, 챗GPT에 '기억력' 추가로 '제미나이 울트라'에 대응 [4] GPTMAGAZINE갤로그로 이동합니다. 02.14 1108 1
263 AI의 진화, 이제는 뉴스 앵커도 인공지능 시대 [26] GPTMAGAZINE갤로그로 이동합니다. 02.14 3019 4
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2