디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

마이크로소프트, 사람 얼굴 이미지를 말하는 동영상으로 변환

GPTMAGAZINE갤로그로 이동합니다. 2024.04.22 13:14:59
조회 6920 추천 6 댓글 14


🔼 사용자의 요청에 따라 캐릭터의 감정과 시선을 조절할 수 있는 기능 제공

🔼 인공지능 이미지와 실제 사진, 두 가지 모두로 실험 가능

🔼 딥페이크로 인한 윤리적 문제, 기술 발전의 양면성을 드러내







마이크로소프트가 개발한 VASA-1 AI는 사람의 정지 이미지를 말하거나 노래하는 동영상으로 변환할 수 있는 입술 동기화 도구를 새롭게 공개했습니다. 이 도구는 오디오와 "정교하게 동기화된" 입 움직임뿐만 아니라, 얼굴 미묘한 뉘앙스와 자연스러운 머리 움직임을 포착하여 진정성과 생동감을 느끼게 하는 데 기여합니다.



마이크로소프트는 "전체적인 얼굴 동작"과 얼굴 잠재 공간에서 작동하는 머리 움직임 생성 모델을 개발했다고 밝혔습니다. 이 회사는 이 기술이 기존 방법들을 종합적으로 "현저하게 능가한다"고 설명했습니다.



VASA는 현재 연구 시연 단계에 있으며, 제품 출시나 API 사용 허가 계획은 없습니다. 이는 마이크로소프트가 자사의 입술 동기화 모델을 선보이고 싶어 함을 의미합니다.



이 기술은 캐릭터의 시선 방향, 대상의 머리 크기, 그리고 말하는 동안의 감정 상태 등을 요청할 수 있도록 합니다. 마이크로소프트는 DALL-E 3 또는 StyleGAN2를 사용하여 인공지능 이미지를 생성하여 VASA를 시연했지만, 실제 사진도 사용할 수 있습니다. 예를 들어, 미국 대통령이 한 적 없는 말을 하게 할 수도 있습니다.



이로 인해 딥페이크와 잘못된 정보에 대한 윤리적 문제가 제기됩니다. 마이크로소프트는 "우리의 연구는 가상 AI 아바타를 위한 시각적 감정 기술을 생성하는 데 중점을 두고 있으며, 긍정적인 용도로 활용하고자 한다"고 밝혔습니다.



그러나 이 회사는 "실제 사람들을 오도하거나 해를 끼치는 콘텐츠를 생성하는 행위에 반대한다"며, "위조 감지 기술의 발전에 기술을 적용하는 데 관심이 있다"고 덧붙였습니다. 현재 이 방법으로 생성된 비디오는 여전히 식별 가능한 아티팩트를 포함하고 있으며, 실제 비디오의 진정성에 도달하기까지는 여전히 간극이 존재합니다.










◎GPT매거진 (https://www.gptmagazine.net)
지피티 기자 : gptmagazinebiz@gmail.com
카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf
페이스북 그룹 : https://www.facebook.com/groups/392367786704067


추천 비추천

6

고정닉 0

18

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 경제관념 부족해서 돈 막 쓸 것 같은 스타는? 운영자 24/05/13 - -
321 구글, AI 비서 ‘프로젝트 아스트라’ 공개 [4] GPTMAGAZINE갤로그로 이동합니다. 05.16 5436 2
320 애플과 오픈AI ChatGPT의 거래 [7] GPTMAGAZINE갤로그로 이동합니다. 05.14 5972 3
319 오픈AI, 더 빠르고 강력한 혁신적 신모델 GPT-4o 발표 [4] GPTMAGAZINE갤로그로 이동합니다. 05.14 2408 2
318 애플, M2 Ultra 서버로 AI 기능 강화 예정 [11] GPTMAGAZINE갤로그로 이동합니다. 05.13 5747 1
317 오픈AI, AI 생성 이미지 판별 기술 도입 [1] GPTMAGAZINE갤로그로 이동합니다. 05.09 2371 0
316 애플, M4 칩 기존 M2 대비 50% 성능 향상 [40] GPTMAGAZINE갤로그로 이동합니다. 05.08 6417 6
315 애플, 1100억 달러 규모 자사주 매입 결정.. AI 탑재 신제품 예고 [5] GPTMAGAZINE갤로그로 이동합니다. 05.03 5869 3
314 애플, AI 개발 위해 스위스에 비공개 연구소 구축 [4] GPTMAGAZINE갤로그로 이동합니다. 05.02 2230 3
313 SKT, 통신 분야 최적화된 'AI 멀티엔진' 개발 착수 GPTMAGAZINE갤로그로 이동합니다. 05.02 293 1
312 마이크로소프트, AI 전력 확보 위해 재생에너지에 14조 투자 [5] GPTMAGAZINE갤로그로 이동합니다. 05.02 5547 4
311 깃허브, 개발자의 코드 작성부터 테스트까지 지원하는 AI 발표 [3] GPTMAGAZINE갤로그로 이동합니다. 04.30 2836 3
310 인텔, 삼성, 네이버의 연합으로 새로운 AI 생태계의 출범 [36] GPTMAGAZINE갤로그로 이동합니다. 04.29 5895 19
309 메타, ‘라마 3’ 와 ‘메타 AI’ 오픈소스 공개 [6] GPTMAGAZINE갤로그로 이동합니다. 04.25 2894 1
308 어도비, 창의적 AI 모델인 'Firefly Image 3' 공개 [14] GPTMAGAZINE갤로그로 이동합니다. 04.24 5970 2
307 업스테이지, 1000억 원 투자 유치로 글로벌 AI 시장 진출 가속화 [3] GPTMAGAZINE갤로그로 이동합니다. 04.23 2359 1
306 일본 소프트뱅크, '챗GPT 잡기' 위한 통큰 투자 전략 공개 [13] GPTMAGAZINE갤로그로 이동합니다. 04.23 5761 7
305 중국 바이두, 챗GPT 넘어서기 위한 대규모 개발 도전 GPTMAGAZINE갤로그로 이동합니다. 04.23 369 0
304 영국 작가협회, 번역 AI로 인한 번역가 일자리 감소 및 소득 하락 [17] GPTMAGAZINE갤로그로 이동합니다. 04.23 3093 7
303 텐센트AI, 3조 토큰의 파워로 오픈AI 압도하나 [3] GPTMAGAZINE갤로그로 이동합니다. 04.22 2455 0
마이크로소프트, 사람 얼굴 이미지를 말하는 동영상으로 변환 [14] GPTMAGAZINE갤로그로 이동합니다. 04.22 6920 6
301 구글, 코카콜라와 로레알 AI광고 파트너십 체결 GPTMAGAZINE갤로그로 이동합니다. 04.15 2095 1
300 구글 , 신형 ‘제미나이 1.5 프로' 도입으로 개발시간 40% 단축 GPTMAGAZINE갤로그로 이동합니다. 04.11 719 3
299 오픈AI, 챗GPT 내 DALL-E 이미지 편집 기능 업데이트 발표 [1] GPTMAGAZINE갤로그로 이동합니다. 04.04 4969 3
295 챗GPT 이제 계정 없이도 자유롭게! 오픈AI의 대대적 접근성 향상 전략 [5] GPTMAGAZINE갤로그로 이동합니다. 04.03 6482 9
294 오픈AI, 이달 일본 도쿄에 아시아 첫 거점 개설 [6] GPTMAGAZINE갤로그로 이동합니다. 04.02 1304 5
293 MS-오픈AI, 슈퍼컴퓨터 구축에 135조 원 투자 [5] GPTMAGAZINE갤로그로 이동합니다. 04.01 5124 9
292 실리콘밸리 최상급 AI 전문가, 연봉 13억 이상으로 급상승 GPTMAGAZINE갤로그로 이동합니다. 03.28 1513 2
291 오픈AI, Sora를 통한 크리에이터들의 첫 작품 공개 [4] GPTMAGAZINE갤로그로 이동합니다. 03.27 1421 2
290 청소년, 음란 AI 챗봇에 쉽게 접근 무방비 노출 [40] GPTMAGAZINE갤로그로 이동합니다. 03.26 2880 0
289 애플, 바이두 AI 기술 도입 검토 [31] GPTMAGAZINE갤로그로 이동합니다. 03.26 2876 11
288 오픈AI, 새로운 AI 음성 비서 출시 예정 [6] GPTMAGAZINE갤로그로 이동합니다. 03.25 5063 0
287 블랙웰의 등장과 AI의 확장, 기독교적 복음의 전달 [1] GPTMAGAZINE갤로그로 이동합니다. 03.22 743 0
286 오픈AI, GPT-5 올 여름 출시 예정 [11] GPTMAGAZINE갤로그로 이동합니다. 03.21 3346 9
285 애플, 구글과 차세대 아이폰에 생성 AI 탑재를 위한 협력 모색 [8] GPTMAGAZINE갤로그로 이동합니다. 03.20 4896 4
284 xAI, 새로운 AI 모델 Grok-1 발표 [2] GPTMAGAZINE갤로그로 이동합니다. 03.18 1232 0
283 MS, 전 세계 코파일럿 프로 출시와 함께 1개월 무료 체험 제공 [18] GPTMAGAZINE갤로그로 이동합니다. 03.15 5628 5
282 오픈AI, 소라AI 올해 안에 공개 예정 [18] GPTMAGAZINE갤로그로 이동합니다. 03.14 2912 4
281 국내 AI 대체 가능 일자리 327만개…60%는 전문직 집중 포진 [27] GPTMAGAZINE갤로그로 이동합니다. 03.13 2276 5
280 일론 머스크, xAI의 챗봇 '그록' 오픈소스로 공개 예정 [15] GPTMAGAZINE갤로그로 이동합니다. 03.12 5156 6
279 가상 인간 아나운서, 제주도 뉴스 새 얼굴로 등장 GPTMAGAZINE갤로그로 이동합니다. 03.12 525 1
278 검찰, ‘AI수사관’ 도입 예정 [26] GPTMAGAZINE갤로그로 이동합니다. 03.07 6176 5
277 마이크로소프트 코파일럿, 파일 분석 기능 서비스 [11] GPTMAGAZINE갤로그로 이동합니다. 03.05 43085 5
276 챗GPT, 음성으로 답변한다 [4] GPTMAGAZINE갤로그로 이동합니다. 03.05 2425 1
275 구글, 신규 AI 모델 '젬마' 공개 [15] GPTMAGAZINE갤로그로 이동합니다. 02.28 2310 2
274 MS, 코파일럿 한글판 출시 앞당겨... [1] GPTMAGAZINE갤로그로 이동합니다. 02.26 5488 6
273 오픈AI, ChatGPT 플러그인 베타 종료 발표 [3] GPTMAGAZINE갤로그로 이동합니다. 02.26 3195 0
272 스테이블 디퓨전 3 출시 예정 [5] GPTMAGAZINE갤로그로 이동합니다. 02.23 3266 4
271 북한 해커, AI 사용해 가상화폐 거래소 공격 확대 [5] GPTMAGAZINE갤로그로 이동합니다. 02.20 5486 7
270 AI가 만든 아이스크림, 배스킨라빈스의 새로운 도전 [12] GPTMAGAZINE갤로그로 이동합니다. 02.19 2893 2
269 법조계를 혁신하는 AI 기술, 법률 분야에 새로운 가능성 제시 [8] GPTMAGAZINE갤로그로 이동합니다. 02.19 2630 3
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2