갤러리 이슈박스, 최근방문 갤러리
연관 갤러리
판타지 갤러리 타 갤러리(0)
이 갤러리가 연관 갤러리로 추가한 갤러리
0/0
타 갤러리 판타지 갤러리(0)
이 갤러리를 연관 갤러리로 추가한 갤러리
0/0
개념글 리스트
1/3
- 아재들이 보고 비명질렀다는 추신수 부인 마이바흐 취급 너구리
- 대흥민...LA FC 데뷔골 ㄹㅇ...gif Adidas
- 의학적 노산과 사회적 노산을 분리해서 생각해봅시다 ㅇㅇ
- 마왕군 사천왕 예견의 퓨쳐뷰어 2부 40화 위마
- 감동감동 물난리 난 마을을 구한 고무장갑 의인.jpg ㅇㅇ
- [Project BS] 돌아온 십덕소울 개발일지 mansu3
- 이윤희 실제 남친있었고 휴대폰 사진 동영상 pc에 백업해둔게 나옴ㄷㄷ ㅇㅇ
- 와퍼 본고장서 '정면승부'...해외로 가는 'K-버거' 깐부
- 싱글벙글 AI 그거 거품이야 ㅇㅇ
- 극우 이재명 근황 ㅋㅋㅋ.jpg 몸파는낙태한녀
- 변호사 수 줄여야 된다는 변호사 ㅇㅇ
- 유관순이 날조라고 주장하는 한국인들 대한민국인디언
- 일쌍툰 23~26화.manhwa 웅쿤
- 페미 때문에 결혼이 매춘으로 변질됐다는 미국녀 ㄷㄷㄷ 주갤러
- 일론 머스크가 타고다녔던 자동차들 Du_Rove
광주 도심 차량 연쇄방화 사대남 현행범 체포
https://youtu.be/yaqoNSyyMRQ?si=Hr4ygFDZO-AZ_7JP [자막뉴스] "지 기분 나쁘면 저러는 거예요"…"억울해!" 동네가 '발칵' / JTBC News누군가 광주 도심 한복판에서 잇따라 차량 두 대에 불을 질렀습니다. 그런데 CCTV 관제센터에 딱 걸리면서 두 번째 범행 30여 분 만에 경찰에 붙잡혔습니다.? 시리즈 더 보기 https://www.youtube.com/playlist?list=PL3Eb1N33oAXjQpE62c...youtu.behttps://n.news.naver.com/article/003/0013433209?sid=102 광주 도심 차량 연쇄방화 40대 현행범 체포광주 도심에서 주차 차량에 잇따라 불을 지른 40대가 경찰에 붙잡혔다. 21일 경찰 등에 따르면 전날 오후 10시55분께 광주 남구 백운동에서 주차 차량에 불이 나 50분 만에 꺼졌다. 2시간여 뒤인 인근 남구 양림n.news.naver.com
작성자 : 깐부고정닉
AI 비디오 생성 모델의 연도별 발전
2016년MIT와 컬럼비아 대학교의 연구GAN(생성적 적대 신경망) 이라는 방식의 모델딥러닝으로 2백만개의 영상을 학습해서 만듬64x64의 해상도로 초당 32프레임, 최대 1.5초까지의 영상을 만들수 있음해변아기https://www.cs.columbia.edu/~vondrick/tinyvideo/ Generating Videos with Scene Dynamics - MITGenerating Videos with Scene Dynamics - MITwww.cs.columbia.edu2017년위 모델을 토대로 개선된 모델사이즈와 프레임은 같지만 퀄리티가 아주 약간은 올라간걸 볼 수 있음https://pfnet-research.github.io/tgan/ Temporal Generative Adversarial Nets with Singular Value ClippingTemporal Generative Adversarial Nets with Singular Value Clippingpfnet-research.github.io2018년듀크 대학교Text to Video를 구현하기 시작텍스트에서 정적 및 동적 정보를 모두 추출하고딥러닝 학습용 온라인 영상에 매칭할 텍스트를 자동 생성함https://ojs.aaai.org/index.php/AAAI/article/view/122332019년딥마인드DVD-GAN 이라는 모델유튜브 HD 비디오 10초 클립을 600개의 카테고리로 나눈 50만개의 동영상으로 학습함최대 256x256 해상도 48프레임까지 생성 가능함https://arxiv.org/abs/1907.06571 Adversarial Video Generation on Complex DatasetsGenerative models of natural images have progressed towards high fidelity samples by the strong leveraging of scale. We attempt to carry this success to the field of video modeling by showing that large Generative Adversarial Networks trained on the complex Kinetics-600 dataset are able to produce video samples of substantially higher complexity and fidelity than previous work. Our proposed model, Dual Video Discriminator GAN (DVD-GAN), scales to longer and higher resolution videos by leveraging a computationally efficient decomposition of its discriminator. We evaluate on the related tasks of video synthesis and video prediction, and achieve new state-of-the-art Fréchet Inception Distance for prediction for Kinetics-600, as well as state-of-the-art Inception Score for synthesis on the UCF-101 dataset, alongside establishing a strong baseline for synthesis on Kinetics-600.arxiv.org2021년마이크로소프트-듀크 대학교의 프로젝트 GODIVA당시 영상 생성에서는 드물게 VQ-VAE(벡터 양자화 자동 인코더)모델을 사용함 (DALL-E가 VQ-VAE)Text to Video1억 3,600만개의 텍스트-비디오 쌍으로 학습“야구 경기가 진행중” 이라는 프롬프트로 알아서 야구장 모습과 선수의 클로즈업이 이어서 나오는 흥미로운 결과가 나옴최대 128x128 해상도 10프레임https://www.researchgate.net/publication/351278868_GODIVA_Generating_Open-DomaIn_Videos_from_nAtural_Deions2022년 5월중국 청화대학교 - CogVideo청화대의 Text to Image 모델인 CogView2를 사용한 Text to Video94억개 파라미터, 540만개의 텍스트-영상 세트를 학습함최대 480x480 해상도 4초간 32프레임2022년 9월메타의 Make-A-Video이미지 모델인 Make-A-Scean의 후속 모델디퓨전 기반Text to Video, Image to Video, Video to VideoWebVid-10M과 HD-VILA-100M이라는 2개의 데이터 세트(슈백만개, 수십만 시간분의 영상)로 학습최대 64x64 해상도 16프레임 동영상을 768x768로 업스케일링함이 모델의 발표를 기점으로 세간의 관심이 크게 쏠림2022년 10월구글의 Imagen VideoImagen 기반 디퓨전 모델Text to Video, Image to Video, Video to Video1400만개의 텍스트-비디오, 6000만개의 텍스트-이미지, LAION-400M 텍스트-이미지 데이터셋으로 학습24x48 해상도의 초당 3프레임 최대 16프레임을 업스케일링하여 최대 1280x768, 초당 24프레임 최대 128프레임 생성https://imagen.research.google/video/ 2023년Stability AI의 Stable Video Diffusion디퓨전 모델Text to Video, Image to Video, Video to Video학습 데이터 미공개최대 768×1344 해상도, 최대 4.2초상업적 이용 가능2024년 2월OpenAI의 Sora디퓨전 트랜스포머데이터 미공개1080P 시연기준 1분, 공개 배포 기준 20초2024년 5월Google의 Veo구조 미공개데이터 미공개1080P 시연기준 1분 2025년 8월구글 Geine 3네이티브 720P 초당 24프레임 지속시간 수 분일관성 유지와 상호작용Text To World이래도 발전 속도가 둔화 되는거 같아?
작성자 : 봄바다고정닉
차단 설정
설정을 통해 게시물을 걸러서 볼 수 있습니다.
[전체 갤러리]
차단 기능을 사용합니다. 차단 등록은 20자 이내, 최대 10개까지 가능합니다.
설정된 갤러리
갤러리 선택
설정할 갤러리를 선택하세요.
[갤러리]
차단 기능을 사용합니다. 전체 설정과는 별개 적용됩니다.