디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

LG AI연구원, 이미지를 문장으로 변환하는 AI 공개[AWS 리인벤트 2023]

IT동아갤로그로 이동합니다. 2023.11.30 00:54:22
조회 134 추천 0 댓글 0
[IT동아 남시현 기자] LG그룹의 인공지능 연구 허브인 LGAI 연구원이 AWS 리인벤트 2023에서 이미지를 텍스트로 전환하는 인공지능 기술을 선보인다. 또한 엑사원 2.0을 추후 아마존 베드록으로 마이그레이션(전환)하는 등 인공지능 분야에서 다각적으로 협력한다. 그간 프롬프트(명령어)를 입력해 텍스트를 메시지로 만들거나, 텍스트를 동영상으로 만드는 기술 등을 선보인 사례는 많지만, 이번 기술은 상업 및 기업용 용도로 이미지를 텍스트로 전환하는 기술이라는 점에서 차이가 있다.

새로운 인공지능 기술은 3천억 개의 매개변수를 갖춘 LG AI연구원의 멀티모달 기반 모델인 엑사원(EXAONE)을 활용하며, 인간의 인지 능력과 유사하게 이전의 경험과 지식, 훈련을 바탕으로 본 적 없는 객체나 장면을 자동으로 이해하고 설명한다. 사람이 어떤 이미지를 능동적으로 설명하고 소개하는 것과 유사한 개념으로 설명한다.


LG AI연구원이 만든 이미지 투 텍스트를 사용해 사진을 문장으로 변환한 결과 / 출처=LG AI연구원



동작 환경은 한국어와 영어로 된 이미지와 텍스트를 이해하며, 이를 실현하기 위해 LG AI연구원은 AWS의 완전관리형 AI 서비스인 세이지메이커를 사용해 약 3억 5천만 개의 고해상도 이미지와 텍스트를 학습시켰다. LG AI 연구원은 지난 2022년 CVPR(컴퓨터 비전과 패턴 인식 콘퍼런스)에서 해당 기능을 처음 선보였으며, 1년 간 완성도와 상업성을 가다듬어 아마존 세이지메이커 점프스타트를 통해 제공하게 됐다.

이미지 텍스트화, 언어의 장벽 넘는 도구 될까


도입 배경에 대해 이화영 LG AI연구원 상무는 “미국에서는 장애를 이유로 하는 차별을 명확하고 포괄적으로 금지하기 위한 법률이 있다. 따라서 시각 장애인이 사내 자산인 이미지 등을 구분할 수 없으면 권리 보호를 위해 폐기해야 한다. 이런 경우에 이미지를 텍스트로 만드는 기술을 도입하면 애써 만든 자산을 폐기하지 않고 계속 사용할 수 있다”라면서, “기업에 따라 다르지만 최대 수백만 달러까지 비용을 절감할 수 있다는 예측이 나오고 있다”라고 덧붙였다.


미국 네바다 주 라스베이거스에서 열리는 AWS 리인벤트 특성상, 인터뷰는 화상 회의로 진행됐다 / 출처=IT동아



이어서 “LG전자만 하더라도 전 세계에 100개가 넘는 법인이 있다. 각 법인에서는 사진 등의 결과물을 라이브러리로 보관하는데, 언어 체계가 다르다 보니 데이터를 공유하고 확인하는데 한계가 있다. 이 기술을 활용하면 언어가 다르더라도 비교적 쉽게 타 법인의 자산을 확인할 수 있어서 전반적인 콘텐츠 비용도 낮출 수 있다”고 덧붙였다.

그렇다면 GPT처럼 이미지를 설명해 주는 기존 AI와는 어떻게 다를까. 이화영 상무는 “GPT의 경우 이미지를 장황하고 세부적으로 설명하지만, 시간이나 속도 측면에서 느리고 또 틀린 내용도 유입된다”라면서, “반면 이미지 투 텍스트 변환 솔루션은 특수 목적으로 용도를 지정할 수 있고, 장애인이 이해하기 쉬운 용어들을 쓴다. 또 여러 번 생성해 정확도 순위를 매기는 식으로 품질을 높이는 알고리즘이 적용돼 환각 현상도 적다”라고 설명했다.


아마존 세이지메이커 점프스타트에 업로드돼있는 이미지 투 텍스트 모델 / 출처=AWS



소비재기업, 마케팅 에이전시 등 LG AI연구원의 고객사는 AWS의 확장성을 활용해 시간당 최대 2000장의 이미지에 설명글을 달 수 있으며, 또 현장에서 별도로 고도화 작업을 거치지 않고 그대로 사용할 수 있다. 이화영 상무는 “이미 건설 현장 안전점검용 드론으로 촬영한 이미지를 텍스트로 변환해 문제점을 확인한다거나, 장애물이 확인되는 등의 용도로 쓸 수 있음을 확인했다”라는 설명을 추가했다.

AWS와의 협업, 더 큰 그림 그리는 LG AI연구원


마지막으로 이화영 상무는 앞으로 AWS와 더 많은 부분에서 협력할 뜻을 내비쳤다. 이화영 상무는 “AWS의 인공지능 생태계는 사용자 중심적이다. 세이지메이커만 하더라도 학습부터 배포까지 일괄로 편리하게 작업할 수 있다. 이런 시각은 LG그룹이 추구하는 바와 뜻이 맞기 때문에 앞으로도 협력할 예정이다”라면서, “추후에는 엑사원 2.0을 아마존 베드록으로 마이그레이션하고, LG 계열사뿐만 아니라 B2B 파트너사들도 같이 쓰는 방식 등에 대해서도 고려하는 중”이라고 말했다.

글 / IT동아 남시현 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ AWS, 생성형 AI 베드록·새 AI 반도체로 '초가속'한다 [AWS 리인벤트 2023]▶ 세계 최대 클라우드 행사 시작··· 이목은 'AI'에 집중 [AWS 리인벤트 2023]▶ 윤석찬 AWS 수석 “AWS 게임데이 LoL 에디션, 머신러닝 서비스 구축 기회 제공”



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 가수에서 배우로 전향 했지만 기대에 못 미치는 스타는? 운영자 25/02/24 - -
3559 펀블, 신규 STO 플랫폼 및 투자 상품 출시 “STO 시장 선점할 것” IT동아갤로그로 이동합니다. 24.03.13 170 0
3558 벤큐코리아 ‘2024 디자인뷰 어워드’ 디자인 공모전 개최 IT동아갤로그로 이동합니다. 24.03.12 177 0
3557 인공지능 아니었으면... 코세라 한국어 번역 강좌로 한국 시장 진출 [2] IT동아갤로그로 이동합니다. 24.03.12 1398 1
3556 다시 걷는 춘천 원도심, ‘상권르네상스 사업’ [1] IT동아갤로그로 이동합니다. 24.03.12 1926 2
3555 [EV 시대] 전기차 공유 서비스의 명과 암 IT동아갤로그로 이동합니다. 24.03.12 815 0
3554 [2024 고려대 초창패] "렛서의 미래, AI 업계의 관리형 서비스를 꿈꿉니다" IT동아갤로그로 이동합니다. 24.03.12 202 0
3553 [KESIA 시드팁스] 메디노드 “AI·자동화 기술로 통합 약제 솔루션 구축한다” IT동아갤로그로 이동합니다. 24.03.12 162 0
3552 고효율가전 살 때 비용 지원받으려면 이렇게![이럴땐 이렇게!] [2] IT동아갤로그로 이동합니다. 24.03.12 1789 0
3551 복잡한 경제지표 일정, '경제 캘린더'로 빠르게 파악하는 방법 IT동아갤로그로 이동합니다. 24.03.12 159 0
3550 [뉴스줌인] 가상 아닌 ‘진짜’ 입체음향 내는 2024 LG 사운드바, 뭐가 다를까? [9] IT동아갤로그로 이동합니다. 24.03.11 1858 0
3549 고가 법인차 ‘연두색 번호판 부착’...제도 개정 후 결과 살펴보니 [12] IT동아갤로그로 이동합니다. 24.03.11 2539 1
3548 [스타트업 법률실무 마스터링] 투자유치 법률실무 (3) - 투자계약 체결 전 투자사와의 분쟁방지 IT동아갤로그로 이동합니다. 24.03.11 145 0
3547 [주간투자동향] 케어링, 400억 원 규모 시리즈 B 투자 유치 IT동아갤로그로 이동합니다. 24.03.11 647 0
3546 내가 원하는 기업의 공시자료 ‘RSS 피드’로 편하게 보자 IT동아갤로그로 이동합니다. 24.03.08 165 0
3545 [생성 AI 길라잡이] 챗GPT와 자동차의 만남 [2] IT동아갤로그로 이동합니다. 24.03.08 9508 3
3544 이노와이어리스의 협업 자산, ‘NHN두레이’로 쌓는다 IT동아갤로그로 이동합니다. 24.03.08 182 1
3543 [KESIA 시드팁스] 프렉탈테크놀로지 “검증된 고객과 데이터 갖춘 M&A 거래소 만듭니다” IT동아갤로그로 이동합니다. 24.03.08 158 0
3542 LG전자, 토출구 2개로 냉각성능∙전력효율 강화한 벽걸이 에어컨 신제품 공개 IT동아갤로그로 이동합니다. 24.03.07 512 1
3541 [뉴스줌인] 전에 못 보던 24GB, 48GB 용량? ‘논바이너리’ 메모리의 이모저모 [6] IT동아갤로그로 이동합니다. 24.03.07 803 0
3540 가상자산 거래소, 시장 상황에 맞춰 ‘거래 환경·혜택 강화’ IT동아갤로그로 이동합니다. 24.03.07 149 0
3539 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 1 IT동아갤로그로 이동합니다. 24.03.07 184 0
3538 세일즈포스, 새로운 AI CRM ·대화형 AI로 CRM 고도화 나서 IT동아갤로그로 이동합니다. 24.03.07 152 0
3537 [시승기] 214년 역사 佛 제조사의 7인승 패밀리카…'푸조 5008 SUV' IT동아갤로그로 이동합니다. 24.03.07 156 0
3536 생성형 AI와 협업 툴의 만남은? 플로우 3.0 AI 나우로 살펴본 현 주소 [4] IT동아갤로그로 이동합니다. 24.03.07 1068 1
3535 인공지능 열풍 닷컴버블 같다고? 비슷하지만 다르다 [4] IT동아갤로그로 이동합니다. 24.03.07 589 0
3534 갤럭시 S23에도 적용되는 갤럭시 AI 기능, S22는? IT동아갤로그로 이동합니다. 24.03.06 247 0
3533 NAS 보안을 강화하는 8가지 보안 수칙 IT동아갤로그로 이동합니다. 24.03.06 176 0
3532 현대차 ”포니 시대로 타임슬립”…제페토에 신규 콘텐츠 론칭 [9] IT동아갤로그로 이동합니다. 24.03.06 1273 4
3531 [메타버스에 올라타자] 7. 메타버스 어떻게 활용할 것인가? 기업 도입 사례 IT동아갤로그로 이동합니다. 24.03.06 216 0
3530 [리뷰] 인터넷으로 사진·동영상 전송하는 '카멜 클라우드 디지털 액자' IT동아갤로그로 이동합니다. 24.03.06 1024 2
3529 [IT애정남] DDR4, LPDDR5 램을 탑재한 노트북, 뭐가 더 좋나요? IT동아갤로그로 이동합니다. 24.03.05 161 0
3528 [자동차와 法] 전기차 충전시설 의무 설치 관련 법률 살펴보니 IT동아갤로그로 이동합니다. 24.03.05 345 0
3527 ‘빅 이벤트 온다’ 엔비디아 GTC 2024 관전 포인트는? IT동아갤로그로 이동합니다. 24.03.05 160 0
3526 [IT애정남] 버티컬 마우스는 왜 쓰는 걸까요? IT동아갤로그로 이동합니다. 24.03.05 160 0
3525 [IT신상공개] 애플, M3 탑재한 새 맥북에어 13 및 15 공개 IT동아갤로그로 이동합니다. 24.03.05 162 0
3524 [2024 고려대 초창패] 뉴로엑스티 “알츠하이머 치매 정밀의료를 실현합니다” [1] IT동아갤로그로 이동합니다. 24.03.05 974 0
3523 “혹시 퇴직연금 깜박하셨나요?” 찾는 방법부터 앞으로 바뀌는 부분까지 IT동아갤로그로 이동합니다. 24.03.04 390 0
3522 [KESIA 시드팁스] 그랜터 “회사 지출 관리, AI에 맡기고 업무에 집중하세요” IT동아갤로그로 이동합니다. 24.03.04 167 0
3521 [스타트업-ing] 니어스랩 “한국의 자율비행 드론, 전 세계를 누빌 것” IT동아갤로그로 이동합니다. 24.03.04 117 0
3520 플리토 이정수 대표 "온디바이스 AI, LLM으로 데이터 중요성 커져" IT동아갤로그로 이동합니다. 24.03.04 118 0
3519 [스타트업 법률실무 마스터링] 투자유치 법률실무 (2) Termsheet 이해를 통한 분쟁방지 IT동아갤로그로 이동합니다. 24.03.04 741 0
3518 헷갈리는 버스전용 차로 만나면 이렇게![이럴땐 이렇게!] IT동아갤로그로 이동합니다. 24.03.04 122 0
3517 [월간자동차] 24년 1월, 수입 신차 판매량 급감...BMW 5시리즈 1위 수성 IT동아갤로그로 이동합니다. 24.02.29 822 0
3516 인텔, “새로운 vPro 플랫폼 통해 기업시장에 AI PC 확대할 것” IT동아갤로그로 이동합니다. 24.02.29 179 0
3515 [리뷰] ‘좋아할 만한 건 다 담았네?’ 에이수스 비보북 프로 15 OLED IT동아갤로그로 이동합니다. 24.02.29 190 0
3514 레노버 “한국 기업들의 생성형 AI투자, 아태지역 1위” IT동아갤로그로 이동합니다. 24.02.29 176 0
3513 [IT강의실] 생성형 AI와 클라우드의 상관관계는? IT동아갤로그로 이동합니다. 24.02.29 152 0
3512 [생성 AI 길라잡이] 챗GPT에서 최신 정보까지 검색한다 ‘웹챗GPT’ IT동아갤로그로 이동합니다. 24.02.29 1428 1
3511 LG전자, AI로 화질과 음향 강화한 2024 올레드/QNED TV 라인업 선보여 IT동아갤로그로 이동합니다. 24.02.28 489 0
3510 [리뷰] 실용주의 AI폰, 삼성 갤럭시 S24 울트라 [2] IT동아갤로그로 이동합니다. 24.02.28 876 4
뉴스 구준엽 장모, 故서희원 전 남편에 두손두발 들었다?…“왕소비, 양육권과 재산 모두 알아서 해” 디시트렌드 18:00
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2