디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

GPT-4, 사진 알아보고 변호사·대입 시험 성적도 우수

IT동아갤로그로 이동합니다. 2023.03.16 11:09:20
조회 2098 추천 6 댓글 11
[IT동아 차주경 기자] 인공지능 기술 개발사 오픈AI(OpenAI)는 3월 14일(이하 현지시각), 언어 모델 기반 인공지능 GPT(Generative Pre-trained Transformer)의 최신판 GPT-4를 공개했다.

오픈AI가 2022년 11월 선보인 GPT-3.5는 사람과의 대화와 글 짓기, 웹 코딩까지 할 정도로 우수한 능력을 발휘해 세계인으로부터 주목 받았다. 오픈AI는 GPT-3.5의 버그(오동작)를 수정하고 더욱 다양한 작업을 하도록 GPT-4를 개량했다고 밝혔다.

오픈AI GPT-4는 문장뿐만 아니라 사진도 보고 분석한다. 오픈AI가 공개한 예시를 보면, GPT-4는 옛날 PC 모니터를 연결하는 규격 ‘VGA’ 커넥터 모양으로 만든 ‘라이트닝(애플 스마트폰 데이터 전송·충전 규격)’ 커넥터의 상품 사진을 알아봤다. 이어 ‘크기가 작은 첨단 라이트닝 커넥터를, 구식에다 크기도 큰 VGA 커넥터로 만들다니 재미있네요’라는 분석도 내놨다.


오픈AI GPT-4를 활용해 온라인 가정교사



오픈AI는 일반 작업이나 대화에서는 GPT-3.5와 GPT-4의 차이가 두드러지지 않는다고 말한다. 하지만, 작업이나 대화가 복잡해지면 GPT-4가 더 안정감 있게 창의적인 답변을 한다고 밝혔다.

질문과 답변의 수준을 제어하는 능력도 좋아졌다. 답변이나 정보를 바로 말하는 것이 아니라 조금씩 추리하면서 접근하고 이 과정을 잘 소개한다. 오픈AI GPT-4를 가정 교사처럼 쓸 가능성도 증명한 셈이다. 실제로 GPT-4를 활용해 온라인 가정교사 서비스를 만든 스타트업도 있다. 언어 호환성과 번역 능력도 좋아졌다. GPT-4는 26개 언어 가운데 24개 언어에서 GPT-3.5를 능가하는 성능을 나타냈다.

오픈AI는 GPT-4를 마이크로소프트의 클라우드 ‘애저(Azure)’에서 운용한 결과 안정적으로 움직였고, 학습의 성과도 사전에 정확하게 예상했다고 밝혔다. 덕분에 앞으로의 GPT가 어떤 능력을 가질지 예측하는 방법론 연구도 쉬워졌다고 말했다.

오픈AI는 GPT-4의 능력을 검증하려고 사람이 응시하는 각종 시험 문제를 제시했다. GPT-4는 미국 모의 변호사 시험에서 상위 10%에 들 정도로 우수한 성적을 낸 것으로 알려졌다. 앞서 GPT-3.5는 같은 시험에서 하위 10%의 성적을 냈을 뿐이었다.


사람이 응시하는 각종 시험을 GPT-3.5와 GPT-4가 각각 본 결과. 출처 = 오픈AI



오픈AI GPT-4는 사람이 미국 대학교에 입학할 때 응시하는 ‘SAT 시험’도 봤다. 읽고 쓰기 부문에서 800점 만점에 710점, 수학 부문에서 800점 만점에 700점을 각각 받았다. 앞서 GPT-3.5는 각각 670점, 590점을 받았는데, 점수가 많이 올랐다.

전문 영역을 다루는 객관식 질문을 여러 개 제시하는 ‘MMLU’, 상식과 추론 능력을 검증하는 ‘헬라스웩(HellaSwag)’, 파이썬 코딩 실력을 보는 ‘휴먼이벌(HumanEval)’, 독해와 산술 능력을 시험하는 드롭(DROP)등 기계 학습과 인공지능의 성능을 시험하는 각종 벤치마크가 있다. 이 벤치마크 테스트에서도 오픈AI GPT-4는 GPT-3.5를 포함해 기존의 언어 모델 기반 인공지능의 실력을 웃도는 성적을 냈다. 오픈AI는 GPT-4를 도입해 서비스를 고도화한 기업의 사례도 공개했다.

오픈AI는 그럼에도 GPT-4를 완전히 신뢰하면 안된다고 당부했다. GPT-4가 아직 추론 방법을 배우는 중이며, 2021년 9월 이전까지의 데이터만 활용했기에 그 이후 만들어진 지식이나 사건은 제대로 답변하지 못할 가능성이 있다고 말했다. 이어 GPT-4의 버그와 취약점을 개선하고 유해한 정보(폭탄 제조법, 불법 약물 구입처)를 말하지 않도록, 업계 전문가와 함께 성능을 고도화한다고도 언급했다.

글 / IT동아 차주경(racingcar@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 챗GPT 열풍에 AI 활용 서비스·앱 쏟아진다▶ [스타트업-ing] 드랩 “쇼핑몰 상품 사진, AI로 순식간에 만들 수 있습니다”▶ 빙 챗봇에게 세 가지 자아가 생겼다…어떻게 다를까?



추천 비추천

6

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 인터넷 트랜드를 가장 빠르게 알고 있을 것 같은 스타는? 운영자 24/11/25 - -
4564 [생활 속 IT] 카카오톡 팀채팅, 입력코드로 한꺼번에 친구 추가한다 [1] IT동아갤로그로 이동합니다. 11.23 140 0
4563 [투자를IT다] 2024년 11월 3주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 11.23 6329 0
4562 [창업도약+경북대] 허드슨에이아이 “팀버(Timbr)로 크리에이터 글로벌 진출 가교 역할할 것” IT동아갤로그로 이동합니다. 11.22 104 0
4561 [ENSL 2024] 누구나 쉽게 버튜버 만들어주는 동영상 서비스 ‘에이플라’ [7] IT동아갤로그로 이동합니다. 11.22 5194 2
4560 [리뷰] AI PC로 거듭난 비즈니스 노트북, 에이수스 엑스퍼트북 P5(P5405) [2] IT동아갤로그로 이동합니다. 11.22 837 0
4559 [부산창경 BEF 2024] 바다플랫폼 “블록체인 세이피안, 식품 생산·유통 안전 지킨다” IT동아갤로그로 이동합니다. 11.22 113 0
4558 [부산창경 BEF 2024] 엘리코퍼레이션 “인도 여성 인권 신장하는 콘택트렌즈 전문 브랜드” IT동아갤로그로 이동합니다. 11.22 97 0
4557 [창업도약+경북대] 에이스에듀 “버추얼 아이돌로 전 세계에 K-콘텐츠의 매력 알릴 것” IT동아갤로그로 이동합니다. 11.22 88 0
4556 전문가가 제시하는 스타트업 ESG 경영 전략…’2024 서울 스타트업 ESG 포럼’ [1] IT동아갤로그로 이동합니다. 11.21 1784 0
4555 수원대학교 'WoW 스타트업 브랜치 오픈이노베이션' 개최 IT동아갤로그로 이동합니다. 11.21 120 0
4554 [스타트업리뷰] 로닉 “인공지능 맞춤형 음식 도우미, AI 로봇셰프 큐브” IT동아갤로그로 이동합니다. 11.21 4850 0
4553 [IT기획자의 탄생] 3. IT기획자에게 필요한 상상력과 글로벌 전략 IT동아갤로그로 이동합니다. 11.21 127 0
4552 [IT’s 가성비] 삼성 크리스탈 UHD TV, 2024년형/85인치 모델에 눈길? IT동아갤로그로 이동합니다. 11.21 1933 0
4551 [스케일업] 클리카 [3] 피터 노빅과의 대담으로 살펴본 'AI 스타트업'의 방향성 IT동아갤로그로 이동합니다. 11.21 125 0
4550 [생활 속 IT] LG 가전 활용도 넓히는 'LG ThinQ' 연결 및 사용법 IT동아갤로그로 이동합니다. 11.21 115 0
4549 [생활 속 IT] 소프트웨어 활용 습관 바꿔줄 윈도 11 ‘가상 데스크톱’ [1] IT동아갤로그로 이동합니다. 11.20 240 0
4548 [부산창경 BEF 2024] 기술로 문제 풀이와 오답 노트 작성 효율 높인 ‘프라이머스’ IT동아갤로그로 이동합니다. 11.20 132 0
4547 IBM-연세대, 슈퍼컴 능가하는 127 큐비트 양자컴퓨터 국내 첫 도입 [3] IT동아갤로그로 이동합니다. 11.20 4943 4
4546 [주간스타트업동향] 휴머닉스, 위플로 CES 2025 혁신상 수상 外 IT동아갤로그로 이동합니다. 11.20 202 0
4545 [부산창경 BEF 2024] 만만한녀석들 “모듈형 집기로 친환경 MICE 산업 선도한다” IT동아갤로그로 이동합니다. 11.20 123 0
4544 [부산창경 BEF 2024] 나누기월드 “외국인 유학생, 장애인 문제 해결에 기여” [4] IT동아갤로그로 이동합니다. 11.20 386 0
4543 선박 제조업의 디지털 전환 이끄는 ‘버추얼 트윈’ 기술 IT동아갤로그로 이동합니다. 11.19 149 0
4542 에릭슨엘지 “네트워크도 API로 제공…개발자 참여 독려해야” IT동아갤로그로 이동합니다. 11.19 146 0
4541 [IT애정남] 노트북 SSD의 OEM 파티션, 삭제해도 되나요? IT동아갤로그로 이동합니다. 11.19 144 0
4540 [부산창경 BEF 2024] 그린에너지(주) “산업 현장 악취·유해물질 플라즈마로 해결” IT동아갤로그로 이동합니다. 11.19 143 0
4539 [자동차와 法] 행락철 교통사고 책임과 법적 대처 방안 IT동아갤로그로 이동합니다. 11.19 734 0
4538 아이작 컨셉츠 김태영 대표, "반도체·열유체 공학의 산학협력 교두보 만들겠다" IT동아갤로그로 이동합니다. 11.19 139 0
4537 [시승기] 돋보이는 디자인과 안전 사양 ‘KGM 액티언’ [1] IT동아갤로그로 이동합니다. 11.18 469 0
4536 +불필요한 PC 앱, 지우려면 이렇게! [이럴땐 이렇게!] [1] IT동아갤로그로 이동합니다. 11.18 5216 5
4535 [스케일업] 반프 [3] 정예솔 전략총괄 “반프의 가치, 글로벌 시장에서도 매력적” IT동아갤로그로 이동합니다. 11.18 166 0
4534 [주간투자동향] 숨빗AI, 50억 원 규모 시드 투자 유치 外 IT동아갤로그로 이동합니다. 11.18 156 0
4533 [투자를IT다] 2024년 11월 2주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 11.16 252 0
4532 [스케일업] 보라웨어 [2] 전영복ㆍ이효주 “구성원 복지ㆍ기업 성장이 공존하는 곳” IT동아갤로그로 이동합니다. 11.15 245 0
4531 [생성 AI 길라잡이] 8종의 AI 모델 골라 쓰는 ‘SKT 에이닷’ 웹 버전 IT동아갤로그로 이동합니다. 11.15 236 0
4530 디지포레, “제조산업의 디지털 전환, ‘팩토리얼 프로’로 앞당길 것" IT동아갤로그로 이동합니다. 11.15 228 0
4529 [리뷰] 모니터링 헤드폰의 새로운 기준점 제시, 소니 MDR-M1 [5] IT동아갤로그로 이동합니다. 11.15 6330 1
4528 [2024 고려대] 스페이스점프 “자영업·소상공인 기자재의 모든 것, 소상공간” IT동아갤로그로 이동합니다. 11.15 215 0
4527 퀄컴, 온디바이스 AI·차량 전동화에 초점 맞춘 최신 솔루션 선보여 IT동아갤로그로 이동합니다. 11.15 234 0
4526 [창업도약+경북대] 비빔블 “비커스ㆍ버튜디오로 상상 이상의 가상경험 제공할 것” IT동아갤로그로 이동합니다. 11.15 194 0
4525 [AI와 미래] 기존 저작물은 AI 학습에 어디까지 활용할 수 있을까? IT동아갤로그로 이동합니다. 11.15 1415 0
4524 [월간자동차] 24년 10월, 신차 등록 두 달 연속 증가…싼타페 판매 1위 IT동아갤로그로 이동합니다. 11.15 190 0
4523 [리뷰] 10G 업링크 지원 네트워크 스위치, 넷기어 GS108MX IT동아갤로그로 이동합니다. 11.14 214 0
4522 데이터 주권 강조하는 소버린 AI, 진정한 의미는? [1] IT동아갤로그로 이동합니다. 11.14 792 0
4521 [스케일업] 스쿨버스 [3] 통학버스 전문 플랫폼 개발자 인터뷰 IT동아갤로그로 이동합니다. 11.14 216 0
4520 [UDC 2024] 다양한 산업을 변화시키는 블록체인의 힘 IT동아갤로그로 이동합니다. 11.14 209 0
4519 로봇과 문화예술의 만남, 브이디컴퍼니x장 줄리앙의 종이세상 IT동아갤로그로 이동합니다. 11.14 367 0
4518 [IT애정남] 갤럭시워치를 아이폰과 연결해서 쓸 수 있나요? IT동아갤로그로 이동합니다. 11.13 4701 0
4517 [신차공개] BMW ‘뉴 4시리즈 그란 쿠페’·로터스 ‘에메야’ 공식 출시 [3] IT동아갤로그로 이동합니다. 11.13 4849 1
4516 [스타트업-ing] 오아시스 스튜디오 “OVP·오닉스·디보틀로 콘텐츠 에코시스템 구축” IT동아갤로그로 이동합니다. 11.13 223 0
4515 [생활 속 IT] 취업 서류, 정부24에서 내려받는 법 IT동아갤로그로 이동합니다. 11.12 254 0
뉴스 MEOVV(미야오), '2024 MAMA AWARDS' 고품격 퍼포먼스 선보여 디시트렌드 11.24
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2