디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

마이크로소프트, 사람 얼굴 이미지를 말하는 동영상으로 변환

GPTMAGAZINE갤로그로 이동합니다. 2024.04.22 13:14:59
조회 6676 추천 6 댓글 14


🔼 사용자의 요청에 따라 캐릭터의 감정과 시선을 조절할 수 있는 기능 제공

🔼 인공지능 이미지와 실제 사진, 두 가지 모두로 실험 가능

🔼 딥페이크로 인한 윤리적 문제, 기술 발전의 양면성을 드러내







마이크로소프트가 개발한 VASA-1 AI는 사람의 정지 이미지를 말하거나 노래하는 동영상으로 변환할 수 있는 입술 동기화 도구를 새롭게 공개했습니다. 이 도구는 오디오와 "정교하게 동기화된" 입 움직임뿐만 아니라, 얼굴 미묘한 뉘앙스와 자연스러운 머리 움직임을 포착하여 진정성과 생동감을 느끼게 하는 데 기여합니다.



마이크로소프트는 "전체적인 얼굴 동작"과 얼굴 잠재 공간에서 작동하는 머리 움직임 생성 모델을 개발했다고 밝혔습니다. 이 회사는 이 기술이 기존 방법들을 종합적으로 "현저하게 능가한다"고 설명했습니다.



VASA는 현재 연구 시연 단계에 있으며, 제품 출시나 API 사용 허가 계획은 없습니다. 이는 마이크로소프트가 자사의 입술 동기화 모델을 선보이고 싶어 함을 의미합니다.



이 기술은 캐릭터의 시선 방향, 대상의 머리 크기, 그리고 말하는 동안의 감정 상태 등을 요청할 수 있도록 합니다. 마이크로소프트는 DALL-E 3 또는 StyleGAN2를 사용하여 인공지능 이미지를 생성하여 VASA를 시연했지만, 실제 사진도 사용할 수 있습니다. 예를 들어, 미국 대통령이 한 적 없는 말을 하게 할 수도 있습니다.



이로 인해 딥페이크와 잘못된 정보에 대한 윤리적 문제가 제기됩니다. 마이크로소프트는 "우리의 연구는 가상 AI 아바타를 위한 시각적 감정 기술을 생성하는 데 중점을 두고 있으며, 긍정적인 용도로 활용하고자 한다"고 밝혔습니다.



그러나 이 회사는 "실제 사람들을 오도하거나 해를 끼치는 콘텐츠를 생성하는 행위에 반대한다"며, "위조 감지 기술의 발전에 기술을 적용하는 데 관심이 있다"고 덧붙였습니다. 현재 이 방법으로 생성된 비디오는 여전히 식별 가능한 아티팩트를 포함하고 있으며, 실제 비디오의 진정성에 도달하기까지는 여전히 간극이 존재합니다.










◎GPT매거진 (https://www.gptmagazine.net)
지피티 기자 : gptmagazinebiz@gmail.com
카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf
페이스북 그룹 : https://www.facebook.com/groups/392367786704067


추천 비추천

6

고정닉 0

17

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
315 애플, 1100억 달러 규모 자사주 매입 결정.. AI 탑재 신제품 예고 [5] GPTMAGAZINE갤로그로 이동합니다. 05.03 5397 3
314 애플, AI 개발 위해 스위스에 비공개 연구소 구축 [4] GPTMAGAZINE갤로그로 이동합니다. 05.02 1826 3
313 SKT, 통신 분야 최적화된 'AI 멀티엔진' 개발 착수 GPTMAGAZINE갤로그로 이동합니다. 05.02 121 0
312 마이크로소프트, AI 전력 확보 위해 재생에너지에 14조 투자 [5] GPTMAGAZINE갤로그로 이동합니다. 05.02 5213 4
311 깃허브, 개발자의 코드 작성부터 테스트까지 지원하는 AI 발표 [3] GPTMAGAZINE갤로그로 이동합니다. 04.30 2506 3
310 인텔, 삼성, 네이버의 연합으로 새로운 AI 생태계의 출범 [36] GPTMAGAZINE갤로그로 이동합니다. 04.29 5567 19
309 메타, ‘라마 3’ 와 ‘메타 AI’ 오픈소스 공개 [6] GPTMAGAZINE갤로그로 이동합니다. 04.25 2614 1
308 어도비, 창의적 AI 모델인 'Firefly Image 3' 공개 [14] GPTMAGAZINE갤로그로 이동합니다. 04.24 5691 2
307 업스테이지, 1000억 원 투자 유치로 글로벌 AI 시장 진출 가속화 [3] GPTMAGAZINE갤로그로 이동합니다. 04.23 2141 1
306 일본 소프트뱅크, '챗GPT 잡기' 위한 통큰 투자 전략 공개 [13] GPTMAGAZINE갤로그로 이동합니다. 04.23 5526 7
305 중국 바이두, 챗GPT 넘어서기 위한 대규모 개발 도전 GPTMAGAZINE갤로그로 이동합니다. 04.23 265 0
304 영국 작가협회, 번역 AI로 인한 번역가 일자리 감소 및 소득 하락 [16] GPTMAGAZINE갤로그로 이동합니다. 04.23 2849 7
303 텐센트AI, 3조 토큰의 파워로 오픈AI 압도하나 [3] GPTMAGAZINE갤로그로 이동합니다. 04.22 2250 0
마이크로소프트, 사람 얼굴 이미지를 말하는 동영상으로 변환 [14] GPTMAGAZINE갤로그로 이동합니다. 04.22 6676 6
301 구글, 코카콜라와 로레알 AI광고 파트너십 체결 GPTMAGAZINE갤로그로 이동합니다. 04.15 1987 1
300 구글 , 신형 ‘제미나이 1.5 프로' 도입으로 개발시간 40% 단축 GPTMAGAZINE갤로그로 이동합니다. 04.11 600 3
299 오픈AI, 챗GPT 내 DALL-E 이미지 편집 기능 업데이트 발표 [1] GPTMAGAZINE갤로그로 이동합니다. 04.04 4782 3
295 챗GPT 이제 계정 없이도 자유롭게! 오픈AI의 대대적 접근성 향상 전략 [5] GPTMAGAZINE갤로그로 이동합니다. 04.03 6274 9
294 오픈AI, 이달 일본 도쿄에 아시아 첫 거점 개설 [6] GPTMAGAZINE갤로그로 이동합니다. 04.02 1126 5
293 MS-오픈AI, 슈퍼컴퓨터 구축에 135조 원 투자 [5] GPTMAGAZINE갤로그로 이동합니다. 04.01 4957 9
292 실리콘밸리 최상급 AI 전문가, 연봉 13억 이상으로 급상승 GPTMAGAZINE갤로그로 이동합니다. 03.28 1418 2
291 오픈AI, Sora를 통한 크리에이터들의 첫 작품 공개 [4] GPTMAGAZINE갤로그로 이동합니다. 03.27 1235 2
290 청소년, 음란 AI 챗봇에 쉽게 접근 무방비 노출 [39] GPTMAGAZINE갤로그로 이동합니다. 03.26 2682 0
289 애플, 바이두 AI 기술 도입 검토 [31] GPTMAGAZINE갤로그로 이동합니다. 03.26 2704 11
288 오픈AI, 새로운 AI 음성 비서 출시 예정 [6] GPTMAGAZINE갤로그로 이동합니다. 03.25 4891 0
287 블랙웰의 등장과 AI의 확장, 기독교적 복음의 전달 [1] GPTMAGAZINE갤로그로 이동합니다. 03.22 582 0
286 오픈AI, GPT-5 올 여름 출시 예정 [11] GPTMAGAZINE갤로그로 이동합니다. 03.21 3168 9
285 애플, 구글과 차세대 아이폰에 생성 AI 탑재를 위한 협력 모색 [8] GPTMAGAZINE갤로그로 이동합니다. 03.20 4742 4
284 xAI, 새로운 AI 모델 Grok-1 발표 [2] GPTMAGAZINE갤로그로 이동합니다. 03.18 1071 0
283 MS, 전 세계 코파일럿 프로 출시와 함께 1개월 무료 체험 제공 [18] GPTMAGAZINE갤로그로 이동합니다. 03.15 5457 5
282 오픈AI, 소라AI 올해 안에 공개 예정 [18] GPTMAGAZINE갤로그로 이동합니다. 03.14 2740 4
281 국내 AI 대체 가능 일자리 327만개…60%는 전문직 집중 포진 [27] GPTMAGAZINE갤로그로 이동합니다. 03.13 2106 5
280 일론 머스크, xAI의 챗봇 '그록' 오픈소스로 공개 예정 [15] GPTMAGAZINE갤로그로 이동합니다. 03.12 4996 6
279 가상 인간 아나운서, 제주도 뉴스 새 얼굴로 등장 GPTMAGAZINE갤로그로 이동합니다. 03.12 442 1
278 검찰, ‘AI수사관’ 도입 예정 [26] GPTMAGAZINE갤로그로 이동합니다. 03.07 6007 5
277 마이크로소프트 코파일럿, 파일 분석 기능 서비스 [11] GPTMAGAZINE갤로그로 이동합니다. 03.05 42929 5
276 챗GPT, 음성으로 답변한다 [4] GPTMAGAZINE갤로그로 이동합니다. 03.05 2270 1
275 구글, 신규 AI 모델 '젬마' 공개 [15] GPTMAGAZINE갤로그로 이동합니다. 02.28 2150 2
274 MS, 코파일럿 한글판 출시 앞당겨... [1] GPTMAGAZINE갤로그로 이동합니다. 02.26 5320 6
273 오픈AI, ChatGPT 플러그인 베타 종료 발표 [3] GPTMAGAZINE갤로그로 이동합니다. 02.26 3041 0
272 스테이블 디퓨전 3 출시 예정 [4] GPTMAGAZINE갤로그로 이동합니다. 02.23 3105 4
271 북한 해커, AI 사용해 가상화폐 거래소 공격 확대 [5] GPTMAGAZINE갤로그로 이동합니다. 02.20 5324 7
270 AI가 만든 아이스크림, 배스킨라빈스의 새로운 도전 [12] GPTMAGAZINE갤로그로 이동합니다. 02.19 2730 2
269 법조계를 혁신하는 AI 기술, 법률 분야에 새로운 가능성 제시 [9] GPTMAGAZINE갤로그로 이동합니다. 02.19 2473 3
268 구글, 차세대 AI 모델 'Gemini 1.5' 발표 GPTMAGAZINE갤로그로 이동합니다. 02.16 519 1
267 오픈AI, 텍스트를 통해 비디오 생성하는 AI 모델 'Sora' 발표 [5] GPTMAGAZINE갤로그로 이동합니다. 02.16 1655 1
266 애플의 새로운 AI 도구 '키프레이머' [9] GPTMAGAZINE갤로그로 이동합니다. 02.15 2260 1
265 엔비디아, PC용 개인 AI 챗봇 'Chat with RTX' 출시 [5] GPTMAGAZINE갤로그로 이동합니다. 02.14 1108 1
264 오픈AI, 챗GPT에 '기억력' 추가로 '제미나이 울트라'에 대응 [4] GPTMAGAZINE갤로그로 이동합니다. 02.14 1112 1
263 AI의 진화, 이제는 뉴스 앵커도 인공지능 시대 [26] GPTMAGAZINE갤로그로 이동합니다. 02.14 3023 4
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2