디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

오픈AI, 텍스트를 통해 비디오 생성하는 AI 모델 'Sora' 발표

GPTMAGAZINE갤로그로 이동합니다. 2024.02.16 15:26:11
조회 1745 추천 1 댓글 5



🔼 텍스트에서 비디오로의 창의적 변환

🔼 비주얼 아티스트와 디자이너를 위한 새로운 가능성

🔼 AI 기반 비디오 제작의 변화









OpenAI가 텍스트 지시를 통해 현실적이며 상상력 넘치는 장면을 창조할 수 있는 새로운 AI 모델인 Sora를 소개했습니다. 이 혁신적인 텍스트-비디오 모델은 최대 1분 길이의 비디오를 생성할 수 있으며, 높은 시각적 품질과 사용자의 프롬프트에 대한 충실도를 유지합니다. 현재, Sora는 잠재적 위험성을 평가하기 위해 레드 팀에 의해 평가되고 있으며, 선택된 시각 예술가, 디자이너, 그리고 영화 제작자들에게도 접근성을 제공하여 창의적 전문가들에게 가장 유용하게 모델을 발전시킬 수 있는 피드백을 얻고 있습니다.

Sora는 여러 캐릭터가 포함된 복잡한 장면, 다양한 종류의 움직임, 그리고 주제와 배경의 정확한 세부 사항을 생성할 수 있는 능력으로 눈에 띕니다. 모델은 사용자가 프롬프트에서 요청한 것뿐만 아니라 그러한 것들이 물리적 세계에서 어떻게 존재하는지를 이해합니다.

모델은 언어에 대한 깊은 이해를 가지고 있어, 프롬프트를 정확하게 해석하고 생동감 있는 감정을 표현하는 매력적인 캐릭터들을 생성할 수 있습니다. Sora는 또한 단일 생성 비디오 내에서 캐릭터와 시각적 스타일을 정확하게 유지하는 여러 장면을 만들 수 있습니다.

그러나, Sora에는 한계가 있습니다. 복잡한 장면의 물리학을 정확하게 시뮬레이션하는 데 어려움이 있으며, 특정 원인과 결과의 인스턴스를 이해하지 못할 수 있습니다. 예를 들어, 누군가 쿠키를 한 입 물었지만, 그 후에 쿠키에 물린 자국이 나타나지 않을 수 있습니다.

모델은 또한 프롬프트의 공간적 세부 사항을 혼동할 수 있으며, 시간이 지남에 따라 발생하는 특정 이벤트의 정확한 설명, 예를 들어 특정 카메라 궤적을 따르는 것과 같은 문제에 어려움을 겪을 수 있습니다.

OpenAI 제품에 Sora를 통합하기 전에 여러 중요한 안전 조치를 취하고 있습니다. 오해의 소지가 있는 콘텐츠를 탐지하는 도구를 개발하고, DALL·E 3에서 구축한 기존의 안전 방법을 활용하여, 오용 가능성을 완화합니다.

Sora의 기술은 확산 모델에 기반을 두고 있으며, 정적 노이즈처럼 보이는 비디오에서 시작하여 많은 단계를 거쳐 노이즈를 제거함으로써 명확한 비디오로 변환합니다. 이 모델은 GPT 모델과 유사한 트랜스포머 아키텍처를 사용하여 우수한 확장 성능을 제공합니다.

이 모델은 텍스트 지시만으로 비디오를 생성할 수 있을 뿐만 아니라, 기존의 정지 이미지를 가져와 그 내용을 정확하게 애니메이션화하거나 기존 비디오를 확장하거나 누락된 프레임을 채울 수 있습니다. Sora는 실제 세계를 이해하고 시뮬레이션할 수 있는 모델을 위한 기초를 제공하며, 이는 인공 일반 지능(AGI)을 달성하기 위한 중요한 이정표가 될 것으로 믿습니다.

Sora와 그 기능에 대한 자세한 내용은 OpenAI가 발표한 기술 보고서에서 확인할 수 있습니다.












◎GPT매거진 (https://www.gptmagazine.net)

지피티 기자 : gptmagazinebiz@gmail.com

카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf

페이스북 그룹 : https://www.facebook.com/groups/392367786704067


추천 비추천

1

고정닉 0

2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
275 구글, 신규 AI 모델 '젬마' 공개 [15] GPTMAGAZINE갤로그로 이동합니다. 02.28 2450 2
274 MS, 코파일럿 한글판 출시 앞당겨... [1] GPTMAGAZINE갤로그로 이동합니다. 02.26 5611 6
273 오픈AI, ChatGPT 플러그인 베타 종료 발표 [3] GPTMAGAZINE갤로그로 이동합니다. 02.26 3309 0
272 스테이블 디퓨전 3 출시 예정 [5] GPTMAGAZINE갤로그로 이동합니다. 02.23 3347 4
271 북한 해커, AI 사용해 가상화폐 거래소 공격 확대 [5] GPTMAGAZINE갤로그로 이동합니다. 02.20 5515 8
270 AI가 만든 아이스크림, 배스킨라빈스의 새로운 도전 [12] GPTMAGAZINE갤로그로 이동합니다. 02.19 2936 2
269 법조계를 혁신하는 AI 기술, 법률 분야에 새로운 가능성 제시 [8] GPTMAGAZINE갤로그로 이동합니다. 02.19 2646 3
268 구글, 차세대 AI 모델 'Gemini 1.5' 발표 GPTMAGAZINE갤로그로 이동합니다. 02.16 577 1
오픈AI, 텍스트를 통해 비디오 생성하는 AI 모델 'Sora' 발표 [5] GPTMAGAZINE갤로그로 이동합니다. 02.16 1745 1
266 애플의 새로운 AI 도구 '키프레이머' [9] GPTMAGAZINE갤로그로 이동합니다. 02.15 2362 1
265 엔비디아, PC용 개인 AI 챗봇 'Chat with RTX' 출시 [5] GPTMAGAZINE갤로그로 이동합니다. 02.14 1188 2
264 오픈AI, 챗GPT에 '기억력' 추가로 '제미나이 울트라'에 대응 [4] GPTMAGAZINE갤로그로 이동합니다. 02.14 1143 1
263 AI의 진화, 이제는 뉴스 앵커도 인공지능 시대 [27] GPTMAGAZINE갤로그로 이동합니다. 02.14 3057 4
262 '유료의 힘' 챗GPT vs '무료의 매력' 바드 [10] GPTMAGAZINE갤로그로 이동합니다. 02.13 1909 0
261 애플, 생성 이미지 편집 AI 'MGIE' 공개 [3] GPTMAGAZINE갤로그로 이동합니다. 02.08 1715 1
260 마이크로소프트, 코파일럿의 새로운 디자인 [3] GPTMAGAZINE갤로그로 이동합니다. 02.08 2656 5
259 챗GPT 도입으로 인한 데이터 라벨러 일자리 축소 현상 [6] GPTMAGAZINE갤로그로 이동합니다. 02.07 2052 2
258 멀티모달 AI, 텍스트 넘어 이미지와 음성까지 이해하는 인공지능 [6] GPTMAGAZINE갤로그로 이동합니다. 02.06 1512 0
257 오픈AI 샘알트먼, 챗GPT 성능 개선 발표 [9] GPTMAGAZINE갤로그로 이동합니다. 02.06 1787 2
256 홍콩에서 벌어진 340억 원 규모의 AI 딥페이크 사기 사건 [35] GPTMAGAZINE갤로그로 이동합니다. 02.05 8753 13
255 오픈AI, 애플 비전 프로용 새로운 챗GPT 앱 출시 [4] GPTMAGAZINE갤로그로 이동합니다. 02.05 4353 7
254 구글, 바드에서 새로운 안드로이드 앱과 함께 '제미나이'로 변경 [17] GPTMAGAZINE갤로그로 이동합니다. 02.05 4435 4
253 애플, iOS18에 AI 탑재 유력 [21] GPTMAGAZINE갤로그로 이동합니다. 02.02 2067 2
252 구글, 제미나이 프로로 한국 포함한 전 세계 언어와 국가로 확장 [6] GPTMAGAZINE갤로그로 이동합니다. 02.02 1491 1
251 행정안전부, AI기반 정보공개 민원처리 지원모델 개발 [5] GPTMAGAZINE갤로그로 이동합니다. 01.31 3802 0
250 OpenAI, 대화 중 GPT 호출 기능 출시 [3] GPTMAGAZINE갤로그로 이동합니다. 01.31 4871 1
249 메타, 무료 코드 생성 AI 'Code Llama' 출시 [4] GPTMAGAZINE갤로그로 이동합니다. 01.30 1793 2
248 서버 구축, 앱 개발? 필요 없습니다... GPT 스토어! GPTMAGAZINE갤로그로 이동합니다. 01.23 460 1
247 구글 메시지에 바드 AI 통합 [3] GPTMAGAZINE갤로그로 이동합니다. 01.22 2072 1
246 딥브레인AI, 한 장의 사진으로 AI 고인을 만드는 '리메모리2' 출시 [11] GPTMAGAZINE갤로그로 이동합니다. 01.22 4551 4
245 오픈AI, GPT-5, 사용자 맞춤형 AI로 진화 [17] GPTMAGAZINE갤로그로 이동합니다. 01.19 2558 7
244 오픈AI, GPT 스토어에 AI 여자친구 봇들 급증 [17] GPTMAGAZINE갤로그로 이동합니다. 01.17 2724 5
243 마이크로소프트, 개인용 AI 서비스 '코파일럿 프로' 출시 [3] GPTMAGAZINE갤로그로 이동합니다. 01.16 1400 1
242 빌 게이츠와 샘 알트만이 만나다. [29] GPTMAGAZINE갤로그로 이동합니다. 01.12 8511 6
241 OpenAI의 GPT Store 공식 출시 [5] GPTMAGAZINE갤로그로 이동합니다. 01.11 4683 2
240 마이크로소프트, 코파일럿 GPT-4 무료 제공에도 불구하고.. [9] GPTMAGAZINE갤로그로 이동합니다. 01.10 3924 1
239 구글, 안드로이드에서 구글 어시스턴트를 챗GPT로 교체 예정 [8] GPTMAGAZINE갤로그로 이동합니다. 01.09 1680 0
238 오픈AI, 새로운 GPT 스토어 다음 주 출시 예정 [2] GPTMAGAZINE갤로그로 이동합니다. 01.05 1305 1
237 챗GPT가 인정한 AI 대부, 힌턴 교수 [2] GPTMAGAZINE갤로그로 이동합니다. 01.05 1265 0
236 아주대, 챗GPT로 정신질환 해석 [8] GPTMAGAZINE갤로그로 이동합니다. 01.04 2434 5
235 미국 기업 AI 연구원, 놀라운 연봉 공개! [6] GPTMAGAZINE갤로그로 이동합니다. 01.03 1619 1
234 마이크로소프트 엣지, iOS 및 Android용 고급 코파일럿 출시 [11] GPTMAGAZINE갤로그로 이동합니다. 01.02 2456 15
233 마이크로소프트, 안드로이드용 '코파일럿' 앱 출시 [7] GPTMAGAZINE갤로그로 이동합니다. 23.12.29 1911 1
232 구글, AI로 인한 3만명 대규모 조직개편 예고 [11] GPTMAGAZINE갤로그로 이동합니다. 23.12.26 1703 6
231 AI가 작곡하는 시대, 코파일럿 플러그인 출시 [15] GPTMAGAZINE갤로그로 이동합니다. 23.12.20 1527 5
230 한국마이크로소프트, M365 코파일럿 한국어 지원 발표 [3] GPTMAGAZINE갤로그로 이동합니다. 23.12.19 734 5
229 GPT-4와 AI 통제: 새로운 실험 결과 발표 [1] GPTMAGAZINE갤로그로 이동합니다. 23.12.15 786 0
228 마이크로소프트, AI 운영 위한 대규모 에너지 계획 발표 [2] GPTMAGAZINE갤로그로 이동합니다. 23.12.15 706 3
227 구글, 제미니에 이어 제미니 프로 발표 [14] GPTMAGAZINE갤로그로 이동합니다. 23.12.14 1610 5
226 다가올 2024년 주목해야 할 AI 생산성 툴 20가지 [2] GPTMAGAZINE갤로그로 이동합니다. 23.12.12 2326 6
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2