디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[생성 AI 길라잡이] 더 사람 같아진 AI, 'GPT-4o'는 어떻게 다를까?

IT동아갤로그로 이동합니다. 2024.05.17 12:20:22
조회 1402 추천 1 댓글 2
※생성 인공지능이 세계를 뜨겁게 달굽니다. 사람만큼, 더러는 사람보다 더 그림을 잘 그리고 글을 잘 쓰는 생성 인공지능. 생성 인공지능을 설치하고 활용하는 방법과 최신 소식을 매주 전합니다.

[IT동아 권택경 기자] 오픈AI가 지난 13일(현지시각) 최신 대형언어모델(LLM)인 ‘GPT-4o’를 발표했습니다. 구글 ‘제미나이’, 앤트로픽 ‘클로드’, 메타 ‘라마’ 등 수많은 LLM이 등장해 경쟁이 치열해지는 와중에 오픈AI가 이번 업데이트로 다시 한 번 기술 격차를 벌리고, 생성 AI 업계 대표이자 선두라는 걸 입증하는 모양새입니다.

GPT-4o의 o는 옴니(Omni)를 뜻합니다. ‘모든’을 뜻하는 라틴어 접두사입니다. 이 말에 걸맞게 글뿐만 아니라 사진, 영상, 음성 등 여러 종류 데이터를 처리할 수 있는 능력인 ‘멀티 모달리티(Multimodality)를 극한까지 밀어붙였습니다. 하나의 AI 모델로 모든 게 가능한 ‘옴니 모델(Omni Model)’이라는 의미가 담긴 이름입니다. 그야말로 만능인 셈입니다.


지난 13일 열린 오픈AI의 GPT-4o의 발표 행사 / 출처=오픈AI



이번 발표의 하이라이트라고 할 수 있는 음성 모드가 옴니모델의 특장점을 잘 보여줍니다. 음성 모드는 사람과 대화하듯 챗GPT와 음성으로 대화하는 기능입니다. 이번 GPT-4o의 적용으로 반응 속도가 최소 232밀리초, 평균 320밀리초 수준으로 개선됐습니다. 2~5초 수준이었던 이전 버전들과는 비교하면 환골탈태 수준입니다.

오픈AI의 시연을 보면 마치 인간과 대화하는 듯한 자연스러움을 느낄 수 있는데, 실제로 250밀리초 수준으로 알려진 인간만큼 반응 속도가 빠르기 때문입니다. 이렇게 음성 모드가 빨라진 건 음성을 음성 그 자체로 인식하고 처리할 수 있게 됐기 때문입니다. 이전에는 음성을 텍스트로 바꿔 인식하고, 답변도 텍스트로 생성한 다음 이를 단순 음성 합성으로 읊는 방식이었다고 합니다.


실시간 영상 인식과 음성 기능으로 마치 AI와 영상통화를 하듯 대화할 수 있다 / 출처=오픈AI



처리 방식이 바뀌면서 반응 속도만 빨라진 게 아니라 음성에 담긴 톤이나 배경에 섞인 소리도 인식할 수 있게 됐습니다. 반대로 AI가 목소리에 감정을 담거나, 웃거나, 노래를 부르는 일도 가능해졌습니다. 오픈AI가 공개한 시연 영상을 보면 챗GPT가 사용자의 농담에 반응해 웃거나, 자장가를 부릅니다. 두 챗GPT가 서로 자연스럽게 대화를 이어가기도 합니다.

샘 올트먼 오픈AI CEO는 AI와 사랑에 빠지는 영화 ‘그녀(Her)’를 언급하기도 했는데, 영화에나 나올 법한 사람 같은 수준의 AI가 현실이 됐다는 평가도 그리 과장은 아닌 것처럼 느껴질 정도입니다. 이 모든 게 GPT-4o가 텍스트, 화상, 오디오 등 여러 형태의 데이터를 하나의 신경망으로 처리하는 옴니모델이기에 가능한 일입니다.


챗GPT에 태블릿 화면 속 수학 문제를 공유해 AI 과외 선생님처럼 활용할 수도 있다 / 출처=오픈AI



속도와 바용도 개선됐습니다. 특히 영어 외 언어에서 토큰(AI 데이터 처리의 최소 단위) 효율이 대폭 개선되면서 처리 능력이 올랐습니다. 한국어도 토큰 효율이 1.7배 개선됐습니다. 같은 양의 한국어 텍스트를 더 적은 토큰으로 처리할 수 있게 됐다는 의미입니다. 그만큼 GPT-4o를 활용하는 앱이나 서비스들의 속도가 빨라지고, 비용도 저렴해집니다. 오픈AI에서는 GPT-4o의 응용 프로그램 인터페이스(API)가 이전 버전인 GPT4-터보와 같은 성능을 더 빠르고 50% 저렴하게 제공한다고 설명합니다.


음성 모드를 사용 중인 오픈AI 개발자/ 출처=오픈AI



발표와 함께 오픈AI는 우선 GPT-4o의 텍스트와 이미지 기능을 먼저 출시했습니다. 월 20달러(약 2만 7100원)의 유료 서비스 ‘챗GPT 플러스’ 이용자에게만 제공됐던 GPT-4, GPT-4 터보 등과 달리 무료 이용자들도 현재 이용이 가능합니다. 다만 이용 가능한 메시지 수에 제한이 있습니다. 사용량과 수요에 따라 유동적으로 결정됩니다. 유료 이용자는 무료 이용자보다 5배 더 많은 메시지를 이용할 수 있습니다.

다만 아쉽게도 음성 모드는 아직 출시되지 않았습니다. 오픈AI는 앞으로 몇 주 내에 음성 모드 알파 버전을 일부 유료 이용자를 대상으로 순차 출시할 예정이라고 밝혔습니다.

글 / IT동아 권택경 (tk@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 국내 기업 열에 일곱은 "이제 AI 활용 못 하는 직원은 고용 안 해"▶ [생성 AI 길라잡이] GPT 활용 사례 및 교육 커뮤니티, '지피터스'▶ 효율 중요한 키워드 검색광고, 인공지능에 해답 있다



추천 비추천

1

고정닉 0

7

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 외모와 달리 술 일절 못 마셔 가장 의외인 스타는? 운영자 24/07/01 - -
3992 나중에 다시 볼 SNS 동영상, ‘찜’ 하려면 이렇게! [이럴땐 이렇게!] IT동아갤로그로 이동합니다. 17:07 7 0
3991 [정구태의 디지털자산 리터러시] 디지털자산 갈라파고스 탈출을 위한 제언 3. 해외 투자자 허용 IT동아갤로그로 이동합니다. 12:22 106 0
3990 [주간투자동향] 스픽이지랩스코리아, 300억 원 시리즈 B3 투자 유치 IT동아갤로그로 이동합니다. 11:36 12 0
3989 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 17 [3] IT동아갤로그로 이동합니다. 06.28 606 0
3988 [뉴스줌인] LG전자 ‘클로이’ 로봇, 구글 ‘제미나이’ AI 탑재해 더 똑똑해졌다 IT동아갤로그로 이동합니다. 06.28 157 0
3987 [농업이 IT(잇)다] AI로 누구나 쉽게 식물 키우도록 돕는 ‘그루우’ IT동아갤로그로 이동합니다. 06.28 88 0
3986 누비랩 x 전주효림초등학교 “AI와 놀며 편식·잔반 문제 해결” IT동아갤로그로 이동합니다. 06.28 93 0
3985 가상자산 사업자 신고제 개정 ‘법령 준수 체계·대주주 현황도 신고’ [1] IT동아갤로그로 이동합니다. 06.28 6006 0
3984 브이디컴퍼니 x 여산휴게소 “로봇과 함께 휴게소 무인화 성큼” IT동아갤로그로 이동합니다. 06.28 92 0
3983 디지털 교육 위한 첫걸음 디벗, 교육 현장에서는 어떻게 쓰이나 IT동아갤로그로 이동합니다. 06.28 74 0
3982 [스케일업] 캠터 [1] BM 분석 “수익형 캠핑용품 대여 플랫폼으로 상생을 꿈꾼다” IT동아갤로그로 이동합니다. 06.28 68 0
3981 [SBA X IT동아] 페이먼트인앱 “인공지능 에지 컴퓨팅의 효용을 세계로 ” IT동아갤로그로 이동합니다. 06.28 56 0
3980 [생성 AI 길라잡이] PC도, 스마트폰도…온디바이스 AI 시대 본격화 IT동아갤로그로 이동합니다. 06.28 93 0
3979 퓨리오사AI, TCP(텐서 축약 프로세서)로 AI 반도체 시장 전환 노린다 IT동아갤로그로 이동합니다. 06.28 61 0
3978 부산모빌리티쇼 개막…캐스퍼 일렉트릭·르노 콜레오스 등 신차 격전 IT동아갤로그로 이동합니다. 06.27 92 0
3977 동의 없이 마음대로 수리하고 수리비는 개인 주머니에? 제이씨현온비즈의 수상한 A/S [4] IT동아갤로그로 이동합니다. 06.27 655 0
3976 [IT애정남] AI PC, 어떤 기준으로 고르는 게 좋나요? [1] IT동아갤로그로 이동합니다. 06.27 448 1
3975 [SBA X IT동아] 그린웨어 “섬유 산업 지속가능성 주는 바이오매스 천연 염색” IT동아갤로그로 이동합니다. 06.27 95 0
3974 2024 블록체인 지원 사업 14개 추진 “블록체인 혁신 서비스 발굴·지원” IT동아갤로그로 이동합니다. 06.27 69 0
3973 [스타트업 첫걸음] 창업지원기관, 어떻게 찾아야 할까 IT동아갤로그로 이동합니다. 06.27 71 0
3972 업무 문화 혁신 중, KB국민은행은 ‘애자일(Agile)에 진심’이었습니다 [13] IT동아갤로그로 이동합니다. 06.27 6077 0
3971 [스케일업] 파나띠꼬 [1] BM분석 – 선택ㆍ집중 통한 기업과 제품 정체성 구축 필요 IT동아갤로그로 이동합니다. 06.26 87 0
3970 [스케일업] 말랑탱크 [1] BM분석 “눈 건강 솔루션으로 틈새 시장 개척, 방향성 유지가 중요” IT동아갤로그로 이동합니다. 06.26 81 0
3969 브이디컴퍼니 x 골프존파크 “서빙로봇과 24시간 매장으로 변신” IT동아갤로그로 이동합니다. 06.26 82 0
3968 [리뷰] 조명을 더한 감성 스피커 ‘브리츠 BZ-CML200’ IT동아갤로그로 이동합니다. 06.26 838 1
3967 [자동차와 法] 차량 결함으로 의심되는 급발진 교통사고의 문제점 IT동아갤로그로 이동합니다. 06.25 92 0
3966 [인터뷰] 실사용 의료데이터 분석으로 성공적인 임상연구 돕는 ‘메디플렉서스’ IT동아갤로그로 이동합니다. 06.25 103 0
3965 [자동차 디자人] 프리미엄 소형차 ‘MINI 디자인’ 이끄는 ‘올리버 하일머’ IT동아갤로그로 이동합니다. 06.25 851 0
3964 [칼럼] IPO 열풍 속 IT 인프라 변화, 클라우드 전환의 필요성과 전략적 접근 IT동아갤로그로 이동합니다. 06.25 95 0
3963 ‘성능? 호환성?’ AI(인공지능) PC 시대, 선택의 기준은? IT동아갤로그로 이동합니다. 06.25 584 0
3962 엔슬파트너스·콴티파이 “유망 초격차 10대 스타트업 적극 육성” IT동아갤로그로 이동합니다. 06.25 90 0
3961 [혁신스타트업 in 홍릉] 두뇌싱긋연구소 “게임으로 노년층에게 즐거운 삶을” IT동아갤로그로 이동합니다. 06.25 91 0
3960 [SBA x IT동아] 넷스파 “폐어망 재활용으로 해양 폐기물 문제 해결에 기여하겠습니다” IT동아갤로그로 이동합니다. 06.25 86 0
3959 [뉴스줌인] 성능은 UP, 가격은 동결, ‘갤럭시 A35’ 이모저모 [3] IT동아갤로그로 이동합니다. 06.25 965 1
3958 [스케일업] 운약근답올핏 [1] “시장·영업·스케일업 전략 명확하게 제시하라” IT동아갤로그로 이동합니다. 06.24 97 0
3957 업비트·빗썸, 가상자산 투자대회 개최 '투자 심리 회복 기대' IT동아갤로그로 이동합니다. 06.24 114 0
3956 뷰소닉 데이빗 첸 “한국 빔프로젝터 시장, 우리 경쟁력 높일 기회의 땅” [3] IT동아갤로그로 이동합니다. 06.24 882 0
3955 브이디컴퍼니 x 타임빌라스 수원 “대형 매장 서빙, 로봇으로 거뜬히” [2] IT동아갤로그로 이동합니다. 06.24 933 1
3954 [정구태의 디지털자산 리터러시] 디지털자산 갈라파고스 탈출을 위한 제언 2. 실명계좌 제도 개선 IT동아갤로그로 이동합니다. 06.24 90 0
3953 헷갈리는 우회전 교통법규 숙지하기! [이럴땐 이렇게!] [13] IT동아갤로그로 이동합니다. 06.24 2526 3
3952 [르포] ‘페라리’ 전동화 전초 기지 ‘e-빌딩’ 현장 살펴보니 IT동아갤로그로 이동합니다. 06.21 144 0
3951 AWS 지용호 마케팅 총괄 “클라우드 강자 AWS, 생성형 AI 혁신도 주도” IT동아갤로그로 이동합니다. 06.21 145 0
3950 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 16 IT동아갤로그로 이동합니다. 06.21 153 0
3949 [생성 AI 길라잡이] 대화형 생성AI도 골라서 쓰자, GPT와 클로드, 제미나이 IT동아갤로그로 이동합니다. 06.21 4454 5
3948 [농업이 IT(잇)다] 마늘 분류에 비전인식 AI 접목한 '젠틀파머스' IT동아갤로그로 이동합니다. 06.21 149 0
3947 “NFT가 가상자산?” NFT 법적 성격 판단 기준 나왔다 IT동아갤로그로 이동합니다. 06.20 760 0
3946 삼성전자, 빌트인 가전 브랜드 '데이코' 전시·판매 확대로 B2C 시장 공략 [2] IT동아갤로그로 이동합니다. 06.19 2533 0
3945 KIAT, 광주 가전산업 위기 극복 위해 기업과 머리 맞대 IT동아갤로그로 이동합니다. 06.19 159 0
3944 [스케일업] 두디스 [1] BM분석 - "유튜브 영상 분석 플랫폼, 첨예한 접근 필요" IT동아갤로그로 이동합니다. 06.19 159 0
3943 브이디컴퍼니 x 향촌흑염소 "서빙로봇, 대형 요식업 매장에 어울려” IT동아갤로그로 이동합니다. 06.19 177 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2