디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[생성 AI 길라잡이] 더 사람 같아진 AI, 'GPT-4o'는 어떻게 다를까?

IT동아갤로그로 이동합니다. 2024.05.17 12:20:22
조회 1400 추천 1 댓글 2
※생성 인공지능이 세계를 뜨겁게 달굽니다. 사람만큼, 더러는 사람보다 더 그림을 잘 그리고 글을 잘 쓰는 생성 인공지능. 생성 인공지능을 설치하고 활용하는 방법과 최신 소식을 매주 전합니다.

[IT동아 권택경 기자] 오픈AI가 지난 13일(현지시각) 최신 대형언어모델(LLM)인 ‘GPT-4o’를 발표했습니다. 구글 ‘제미나이’, 앤트로픽 ‘클로드’, 메타 ‘라마’ 등 수많은 LLM이 등장해 경쟁이 치열해지는 와중에 오픈AI가 이번 업데이트로 다시 한 번 기술 격차를 벌리고, 생성 AI 업계 대표이자 선두라는 걸 입증하는 모양새입니다.

GPT-4o의 o는 옴니(Omni)를 뜻합니다. ‘모든’을 뜻하는 라틴어 접두사입니다. 이 말에 걸맞게 글뿐만 아니라 사진, 영상, 음성 등 여러 종류 데이터를 처리할 수 있는 능력인 ‘멀티 모달리티(Multimodality)를 극한까지 밀어붙였습니다. 하나의 AI 모델로 모든 게 가능한 ‘옴니 모델(Omni Model)’이라는 의미가 담긴 이름입니다. 그야말로 만능인 셈입니다.


지난 13일 열린 오픈AI의 GPT-4o의 발표 행사 / 출처=오픈AI



이번 발표의 하이라이트라고 할 수 있는 음성 모드가 옴니모델의 특장점을 잘 보여줍니다. 음성 모드는 사람과 대화하듯 챗GPT와 음성으로 대화하는 기능입니다. 이번 GPT-4o의 적용으로 반응 속도가 최소 232밀리초, 평균 320밀리초 수준으로 개선됐습니다. 2~5초 수준이었던 이전 버전들과는 비교하면 환골탈태 수준입니다.

오픈AI의 시연을 보면 마치 인간과 대화하는 듯한 자연스러움을 느낄 수 있는데, 실제로 250밀리초 수준으로 알려진 인간만큼 반응 속도가 빠르기 때문입니다. 이렇게 음성 모드가 빨라진 건 음성을 음성 그 자체로 인식하고 처리할 수 있게 됐기 때문입니다. 이전에는 음성을 텍스트로 바꿔 인식하고, 답변도 텍스트로 생성한 다음 이를 단순 음성 합성으로 읊는 방식이었다고 합니다.


실시간 영상 인식과 음성 기능으로 마치 AI와 영상통화를 하듯 대화할 수 있다 / 출처=오픈AI



처리 방식이 바뀌면서 반응 속도만 빨라진 게 아니라 음성에 담긴 톤이나 배경에 섞인 소리도 인식할 수 있게 됐습니다. 반대로 AI가 목소리에 감정을 담거나, 웃거나, 노래를 부르는 일도 가능해졌습니다. 오픈AI가 공개한 시연 영상을 보면 챗GPT가 사용자의 농담에 반응해 웃거나, 자장가를 부릅니다. 두 챗GPT가 서로 자연스럽게 대화를 이어가기도 합니다.

샘 올트먼 오픈AI CEO는 AI와 사랑에 빠지는 영화 ‘그녀(Her)’를 언급하기도 했는데, 영화에나 나올 법한 사람 같은 수준의 AI가 현실이 됐다는 평가도 그리 과장은 아닌 것처럼 느껴질 정도입니다. 이 모든 게 GPT-4o가 텍스트, 화상, 오디오 등 여러 형태의 데이터를 하나의 신경망으로 처리하는 옴니모델이기에 가능한 일입니다.


챗GPT에 태블릿 화면 속 수학 문제를 공유해 AI 과외 선생님처럼 활용할 수도 있다 / 출처=오픈AI



속도와 바용도 개선됐습니다. 특히 영어 외 언어에서 토큰(AI 데이터 처리의 최소 단위) 효율이 대폭 개선되면서 처리 능력이 올랐습니다. 한국어도 토큰 효율이 1.7배 개선됐습니다. 같은 양의 한국어 텍스트를 더 적은 토큰으로 처리할 수 있게 됐다는 의미입니다. 그만큼 GPT-4o를 활용하는 앱이나 서비스들의 속도가 빨라지고, 비용도 저렴해집니다. 오픈AI에서는 GPT-4o의 응용 프로그램 인터페이스(API)가 이전 버전인 GPT4-터보와 같은 성능을 더 빠르고 50% 저렴하게 제공한다고 설명합니다.


음성 모드를 사용 중인 오픈AI 개발자/ 출처=오픈AI



발표와 함께 오픈AI는 우선 GPT-4o의 텍스트와 이미지 기능을 먼저 출시했습니다. 월 20달러(약 2만 7100원)의 유료 서비스 ‘챗GPT 플러스’ 이용자에게만 제공됐던 GPT-4, GPT-4 터보 등과 달리 무료 이용자들도 현재 이용이 가능합니다. 다만 이용 가능한 메시지 수에 제한이 있습니다. 사용량과 수요에 따라 유동적으로 결정됩니다. 유료 이용자는 무료 이용자보다 5배 더 많은 메시지를 이용할 수 있습니다.

다만 아쉽게도 음성 모드는 아직 출시되지 않았습니다. 오픈AI는 앞으로 몇 주 내에 음성 모드 알파 버전을 일부 유료 이용자를 대상으로 순차 출시할 예정이라고 밝혔습니다.

글 / IT동아 권택경 (tk@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 국내 기업 열에 일곱은 "이제 AI 활용 못 하는 직원은 고용 안 해"▶ [생성 AI 길라잡이] GPT 활용 사례 및 교육 커뮤니티, '지피터스'▶ 효율 중요한 키워드 검색광고, 인공지능에 해답 있다



추천 비추천

1

고정닉 0

7

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 가족과 완벽하게 손절해야 할 것 같은 스타는? 운영자 24/06/24 - -
3839 국내 통신3사 모두 "이제 우리는 AI 기업" [16] IT동아갤로그로 이동합니다. 05.23 2295 1
3838 [IT애정남] 갤럭시 '생성형 편집', 어떻게 해야 잘 될까요? IT동아갤로그로 이동합니다. 05.23 292 0
3837 즉석 카메라로 이런 ‘손맛’이? ‘인스탁스 미니 99’ 출시 IT동아갤로그로 이동합니다. 05.23 222 0
3836 스타트업 해외 진출 시 알아야 할 정보 공유 ‘라이징 스타트업 콘서트4’ IT동아갤로그로 이동합니다. 05.23 267 0
3835 [IT애정남] 해외 구매폰에 국내 유심 쓰는데 음성 통화 안되면? [1] IT동아갤로그로 이동합니다. 05.23 1130 3
3834 퀄컴, 코파일럿+ PC 등장에 'AI 허브 및 개발 도구'로 지원 사격 IT동아갤로그로 이동합니다. 05.23 234 0
3833 네카오, 글로벌 공략 갈 길 바쁜데…일단 멈춤 IT동아갤로그로 이동합니다. 05.23 186 0
3832 2025년 상반기 탄생할 주식 대체거래소(ATS), 이렇게 달라진다 IT동아갤로그로 이동합니다. 05.23 215 0
3831 AMD, 에픽·MI300X 투트랙으로 AI 산업 주도권 확보 나서 IT동아갤로그로 이동합니다. 05.22 192 0
3830 '직장인 3명 중 1명, 데이터 도출 어려워'··· AI 기반 자동화가 해답될까? IT동아갤로그로 이동합니다. 05.22 232 0
3829 산행 보조부터 산불 진화까지...'입는 로봇' 활용처 확대 [1] IT동아갤로그로 이동합니다. 05.22 5157 1
3828 대거 출시 예고한 Arm CPU 기반 윈도우 PC, 뭐가 다를까? IT동아갤로그로 이동합니다. 05.22 281 0
3827 비트코인 피자데이, 업비트·빗썸 “피자 2024판 쏜다” [17] IT동아갤로그로 이동합니다. 05.22 7277 4
3826 [생성 AI 길라잡이] 음성과 이미지만 있으면 영상을 만든다 ‘런웨이ML’ IT동아갤로그로 이동합니다. 05.21 1908 0
3825 가속 페달 밟은 검색광고 시장 경쟁, 보라웨어 ‘AI 검색광고 관리 솔루션에 주목해야 되는 이유 IT동아갤로그로 이동합니다. 05.21 200 0
3824 부르면 달려오는 '이동형 전기차 충전기' 시장 기지개 [14] IT동아갤로그로 이동합니다. 05.21 2103 0
3823 MS, '코파일럿 플러스 PC' 발표…AI 시대의 새로운 PC 제시 IT동아갤로그로 이동합니다. 05.21 252 0
3822 업비트·빗썸, 1분기 실적 개선···투자자 보호·서비스 개선에 주력한다 IT동아갤로그로 이동합니다. 05.21 179 0
3821 GPT4o와 GPT4 비교해 보니··· '사람 대 AI의 근본적인 접근 방식 바꿔' [6] IT동아갤로그로 이동합니다. 05.21 1494 3
3820 삼성전자, '비스포크 AI 콤보' 에센셜 화이트 색상 출시…색상 라인업 강화 IT동아갤로그로 이동합니다. 05.20 233 0
3819 채팅창 넘어 일상으로…'만능 AI 비서' 시대 온다 IT동아갤로그로 이동합니다. 05.20 606 0
3818 오늘부터 시끄러운 불법 튜닝 오토바이 집중 단속 [6] IT동아갤로그로 이동합니다. 05.20 764 6
3817 AWS 서밋 행사장에서 펼쳐진 훈훈한 ‘프리킥’ IT동아갤로그로 이동합니다. 05.20 210 0
3816 [주간투자동향] 라피치, 60억 원 규모 투자 유치 IT동아갤로그로 이동합니다. 05.20 178 0
3815 키보드의 윈도 키, 최대한 활용하려면 이렇게![이럴땐 이렇게!] [5] IT동아갤로그로 이동합니다. 05.20 1629 16
3814 인포플라 “대답만 하던 기존 AI의 한계, VLM 기반 자동화로 극복” [4] IT동아갤로그로 이동합니다. 05.18 7169 3
3813 6월 인공지능ㆍ반도체 시장 엔비디아 손에 달렸다 IT동아갤로그로 이동합니다. 05.17 269 0
3812 [시승기] 시대를 초월한 디자인 DNA…’포르쉐 911 카레라 쿠페’ IT동아갤로그로 이동합니다. 05.17 271 0
3811 [IT신상공개] 입맛대로 고르는 저음, 소니 얼트 파워 사운드 IT동아갤로그로 이동합니다. 05.17 307 0
3810 "코바코의 대국민 AI 광고 제작 서비스, 네이버가 함께합니다" IT동아갤로그로 이동합니다. 05.17 256 0
[생성 AI 길라잡이] 더 사람 같아진 AI, 'GPT-4o'는 어떻게 다를까? [2] IT동아갤로그로 이동합니다. 05.17 1400 1
3808 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 11 IT동아갤로그로 이동합니다. 05.16 268 0
3807 [뉴스줌인] PC 2대 연결해 하나처럼? 인텔 ‘썬더볼트 쉐어’ 기술 이모저모 [5] IT동아갤로그로 이동합니다. 05.16 2323 0
3806 스틸시리즈 코리아 “편의성 강화한 ‘아크티스 노바5’로 가파른 성장세 이어갈 것” IT동아갤로그로 이동합니다. 05.16 341 0
3805 [스타트업 첫걸음] 기고를 시작하며 IT동아갤로그로 이동합니다. 05.16 237 0
3804 [월간자동차] 24년 4월, 신차 등록 감소…기아 ’쏘렌토’ 4개월 연속 판매 1위 [1] IT동아갤로그로 이동합니다. 05.16 1014 0
3803 10년 차 맞은 AWS 서밋 서울··· '국내 최대 IT·클라우드 행사로 자리매김' IT동아갤로그로 이동합니다. 05.16 294 0
3802 [자동차와 法] 딜레마존 구간에서 운전자 주의의무에 대하여 IT동아갤로그로 이동합니다. 05.14 300 0
3801 대기업부터 스타트업까지, K-우주산업 ‘성큼’ IT동아갤로그로 이동합니다. 05.14 307 0
3800 벤츠, 소비자가 외면한 전기차 디자인 손본다 [47] IT동아갤로그로 이동합니다. 05.14 8317 2
3799 우주방사선 차폐로 초소형위성 수명 늘린다 IT동아갤로그로 이동합니다. 05.14 284 0
3798 국내 기업 열에 일곱은 "이제 AI 활용 못 하는 직원은 고용 안 해" [37] IT동아갤로그로 이동합니다. 05.14 7539 9
3797 NHN두레이 기반의 협업 환경, KDI 국제정책대학원의 ‘저력’ 높인다 IT동아갤로그로 이동합니다. 05.14 227 0
3796 [IT강의실] 가상자산 맡기고 추가 수익 실현 ‘스테이킹’ IT동아갤로그로 이동합니다. 05.14 239 0
3795 화제의 K-패스 카드, 발급부터 활용까지 이렇게! [이럴땐 이렇게!] [1] IT동아갤로그로 이동합니다. 05.14 2637 2
3794 도로 위 시한폭탄 ‘맨홀 단차’ 빠르게 보수할 제품 실증 [4] IT동아갤로그로 이동합니다. 05.13 794 1
3793 와탭랩스, "옵저버빌리티 기업 정체성 확립··· 美·日·동남아 시장 성과낼 것" IT동아갤로그로 이동합니다. 05.13 214 0
3792 빗썸 “대학생 서포터즈 썸즈업이 제안한 개선안 적극 검토할 것” [3] IT동아갤로그로 이동합니다. 05.13 1078 0
3791 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 10 [8] IT동아갤로그로 이동합니다. 05.11 8159 3
3790 [뉴스줌인] 캐논, 비정품 토너보다 심각한 ‘위조’ 토너에 골머리 [20] IT동아갤로그로 이동합니다. 05.11 12518 6
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2