디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

직접 인공지능 그림 그려보니··· '문외한도 작가 됐다'

IT동아갤로그로 이동합니다. 2022.10.05 11:53:53
조회 5351 추천 17 댓글 19
[IT동아 남시현 기자] 1956년, 미국의 인지심리학자이자 컴퓨터 공학자인 존 매카시(John McCarthy)는 다트머스 학회에서 처음으로 인공지능(Artificial Intelligent, AI)이라는 용어를 창안했다. 존 매카시는 인공지능을 ‘기계가 인간 행동의 지식에서와 같이 행동하게 만드는 것’으로 정의했으며, 1980년대 들어 존 설(John Searle) 교수에 의해 어떤 문제를 실제로 사고하고 해결할 수 있는 강인공지능과 미리 정의된 규칙을 이용해 지능을 흉내내는 약인공지능으로 구분되기 시작했다. 오늘날 모든 인공지능은 규정된 데이터 안에서 명령을 처리하는 약인공지능에 해당한다.

그런데 최근 몇 년 사이 컴퓨터 공학이나 학문 단계에 있던 인공지능이 갑작스럽게 대중화되기 시작했다. 게임이나 3D 연산 등을 처리하던 그래픽 카드의 GPU(Graphics Processing Unit)를 활용해 CPU의 연산을 처리하는 GPGPU(General-Purpose computing on GPU) 기술이 등장하면서 인공지능 개발 속도가 빨라진 것이다. 게다가 GPU가 대중적인 물건이다 보니 인공지능 개발 역시 보편화하기 시작했고, 올해부터 가시적인 성과들이 나타나고 있다. 그중에서도 이미지 처리는 한 두달 사이에 갑자기 등장해 논란의 중심에 서기 시작했다.

오픈 AI의 ‘DALL-E’, 새 지평 열었다



오픈 AI의



인공지능 기반의 이미지 처리 기술이 본격화한 것은 2015년 설립된 ‘오픈AI’부터다. 테슬라의 최고경영자 일론 머스크와 와이 콤비네이터 사장인 샘 알트만은 인류에게 도움을 주는 인공지능을 만들기 위해 오픈AI를 설립했다. 오픈AI는 특허와 연구를 대중에 공개하고, 자유로운 협업을 바탕으로 인공지능을 개발한다. 그리고 작년 1월, 오픈AI의 자연어 서술 인공지능을 통해 이미지를 생성하는 ‘DALL-E’라는 기술이 공개됐으며, 올해 4월 더욱 완성도를 높인 ‘DALL-E 2’가 비공개 서비스를 시작했다.

DALL-E는 현재 150만 명 이상이 하루 200만 개 이상의 이미지를 생산해내고 있으며, 단순히 이미지를 조합해내는 단계를 넘어 원본의 경계를 넘어서는 방식의 이미지를 제공한다. 가령 ‘사이버펑크 고양이, 90년대 일본 애니메이션 스타일’을 입력하면 당시 애니메이션 기법과 색감을 토대로 한 이미지를 생성해내고, ‘야생화, 풀밭, 가을의 리듬, 수채화’를 입력하면 수채화 느낌의 그림을 만든다. 이렇게 생성된 이미지는 현실에 이미 존재하는 작품이 아닌 새롭게 조합된 것이다.


크래용에



이를 시작으로 오픈 AI 기반의 ‘크래용(craiyon)’이나 이미지 생성 인공지능 ‘스테이블 AI’ 기반의 ‘미드저니(Midjourney)’, 소설 및 애니메이션을 생성하는 ‘노블.AI’까지 각양각색의 서비스가 등장하기 시작했다. 대다수 서비스는 횟수 제한 무료 혹은 유료로 제공되지만, 시작 단계임에도 단어 몇 개나 문장 몇 개로 수준 급의 결과물을 만들어낼 수 있어서 업계에 큰 파장을 일으키고 있다. 실제로 지난 9월 미국 콜로라도 주립 박람회의 디지털 아트 부문에서 인공지능으로 미드저니로 생성한 이미지가 1위를 차지해 예술 업계 전반에 큰 파장을 일으키기도 했다.


미드 저니를 활용해 추상적인 메시지를 입력했는데, 인공지능이 예상한 것과 비슷한 이미지를 만들어냈다. 출처=IT동아



‘디스코드’ 메신저를 활용하는 인공지능 이미지 처리 서비스, 미드저니를 직접 활용해봤다. 미드저니는 디스코드로 메시지를 보내면, 내용을 토대로 그림을 생성해낸다. 메시지에 ‘눈 오는 장면, 수평선은 끝이 없고, 나무는 울창하되 파랗게 불탄다, 숲 중간으로 빛나는 뿔을 가진 사슴이 아이와 함께 서 있다’라는 문장을 입력하고, 사실적이면서 몽환적으로 그려달라고 주문했다. 그 결과 총 네 개의 이미지가 자동으로 생성되었고, 첫 번째 그림을 선택한 다음 완성도를 끌어올려봤다.


미드저니로 만든 이미지를 재가공 혹은 고도화한 결과물들. 출처=IT동아



결과물은 비교적 추상적이지만, 원하는 구도와 구성으로 제공됐다. 만약 예술가라면 이정도 그림을 그리는 데 상당한 시간이 소요되겠지만, 단지 텍스트만으로 이 정도 이미지를 만들어냈다는 점 자체가 인상적이다. 사용자가 문장을 정확하게 입력할수록 완성도는 상승하며, 수많은 반복과 세밀함을 반복해 품질을 끌어올릴 수 있다. 또한 그림이나 구도 등은 모두 자동으로 생성되고, 그림체나 형식에 대해서도 지시할 필요가 없었다. 대다수 서비스가 시작한 지 세 달도 되지 않았음에도 상업화가 논의될 정도로 빠르게 진보하고 있다.

그림에서 영상까지, 진보는 시작됐다



메타AI가 공개한 Make-A-Video 결과물, 텍스트로 창초해낸 비디오들이다. 출처=메타AI

이제 막 이미지 기반의 인공지능이 등장하면서 관련 업계를 달구고 있지만, 발전 속도는 예상보다 훨씬 빠르다. 메타(前 페이스북)은 지난 9월 29일(현지 시각), 텍스트에서 비디오를 만들어내는 인공지능까지 공개했다. ‘Make-A-Video’는 단 몇 단어 또는 텍스트를 추론해 존재하지 않는 형태의 동영상을 생성해내고, 실제로 존재하는 비디오를 입력하면 이를 토대로 유사한 다른 형태의 비디오를 만들어내기도 한다. 앞서 DALL-E나 미드저니와 다르게 시험 단계의 성격이 강하며 완성도가 떨어지지만, 인공지능이 지금 기술로도 충분히 동영상으로 구현될 수 있음을 보여준다.

발전 가능성은 무궁무진, 저작권이 문제


인공지능 기반의 이미지 처리 기술은 이제 막 선보이는 기술이지만, 이미 예술 시장 전반을 바꿔놓을 거란 우려를 낳고 있다. 전문가가 오랜 시간을 투자해야 만들 수 있는 결과물도 인공지능에 문장만 입력해 30초면 생성해낼 수 있기 때문이다. 인공지능 품질이 향상된다면 간단한 사진이나 일러스트레이트는 인공지능이 대체해버릴 수도 있다.

시장에서 우려하는 바도 적지 않다. 애니메이션을 생성하는 노블AI의 정식 서비스는 유료다. 문제는 노블AI의 데이터베이스가 원작자의 허락 없이도 이미지가 수집될 수 있는 ‘단보루(Danbooru)’라는 서비스를 데이터베이스로 삼고 있다는 점이다. 즉 노블AI를 활용해 이미지를 생성하는 과정 자체에서 원작자의 의사와 무관하게 저작권이 침해될 수 있다는 의미다. 이는 노블AI만의 문제점이 아닌 모든 인공지능 서비스에 해당하는 문제다.

인공지능의 품질은 데이터를 가공하는데 쓰이는 매개 변수를 얼마나 크고 효율적으로 운용하는가에 있다. 사용할 데이터가 적으면 그만큼 조합 가능한 수가 적어 품질은 떨어지고, 데이터가 많으면 그만큼 빠르게 발전한다. 앞으로 이 문제를 어떻게 해결하는가에 따라 전체 인공지능 시장의 성장세가 달렸다고 보면 된다.

글 / IT동아 남시현 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ '메타 퀘스트2' 왕좌 빼앗기나…피코, 신제품 '피코4' 한국 출시▶ '음악·글·사진'도 AI가 만든다... "AI 창작물에도 약한 저작권 보호가 필요해"▶ VR 시장 다시 기지개 펴나…소니, 메타, 피코 등 신제품 출격 대기



추천 비추천

17

고정닉 2

3

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 손해 보기 싫어서 피해 입으면 반드시 되갚아 줄 것 같은 스타는? 운영자 24/11/18 - -
1852 [농업이 IT(잇)다] 어밸브 “농사가 어려우세요? 스마트팜으로 해결하세요" IT동아갤로그로 이동합니다. 22.10.07 116 0
1851 북경 한복판에 한국기업 전용 공유오피스 '한국창업원' 개원한 고영화 원장 IT동아갤로그로 이동합니다. 22.10.07 146 0
1850 최초의 17형 폴더블 노트북, 그 배경에 인텔·에이수스 협업 빛났다 IT동아갤로그로 이동합니다. 22.10.07 214 0
1849 ‘C필러, 펜더?’...아리송한 자동차 외관 부위별 명칭 정리 IT동아갤로그로 이동합니다. 22.10.07 117 0
1848 데이터 판매에 '화들짝' 놀란 이용자들... 마이데이터는 정말로 정보주권을 보장하나? IT동아갤로그로 이동합니다. 22.10.07 329 0
1847 네이버 웨일 김효 책임리더 "웨일의 궁극적 목표는 기술기반 플랫폼" IT동아갤로그로 이동합니다. 22.10.07 140 0
1846 [IT신상공개] 구글 '인공지능 스마트폰' 픽셀 7·7 프로의 특징은 IT동아갤로그로 이동합니다. 22.10.06 138 0
1845 [스케일업] 아시안푸드컨넥트 [1] “진입장벽 높은 수출 무역, 플랫폼으로 해결할 수 있습니다” IT동아갤로그로 이동합니다. 22.10.06 108 0
1844 [리뷰] 다재다능한 비즈니스 노트북, 에이수스 엑스퍼트북 B7 플립 [4] IT동아갤로그로 이동합니다. 22.10.06 1290 0
1843 [모빌리티 인사이트] 하늘을 나는 오토바이, 내가 가고자 하면 하늘도 길이 된다 [6] IT동아갤로그로 이동합니다. 22.10.06 1448 1
1842 전동화 물결 탄 전기차 타이어, 특징과 종류는? IT동아갤로그로 이동합니다. 22.10.06 118 0
1841 배터리, 스포츠 기능 강화한 어메이즈핏 4세대 스마트워치, GTR 4 & GTS 4 출시 IT동아갤로그로 이동합니다. 22.10.06 167 0
1840 한컴의 선택엔 이유가 다 있더라, 직접 들어본 'NHN 두레이' 활용기 [1] IT동아갤로그로 이동합니다. 22.10.06 625 0
1839 [리뷰] 비로소 GPU 시장이 바뀔 것, 인텔 아크 A770 그래픽 카드 [11] IT동아갤로그로 이동합니다. 22.10.05 1545 6
1838 [리뷰] 구독으로 완성되는 액션캠, 고프로 히어로11 블랙 크리에이터 에디션 IT동아갤로그로 이동합니다. 22.10.05 112 0
1837 [스타트업 in KB] 딥네츄럴 박상원 대표 "인공지능을 가르치는 레이블러입니다" IT동아갤로그로 이동합니다. 22.10.05 116 0
1836 엡손, 영화관 품질의 가정용 4K 레이저 프로젝터, ‘EH-LS12000B’ 출시 IT동아갤로그로 이동합니다. 22.10.05 162 0
1835 자동차 기능의 핵심 ‘반도체’의 신뢰성은 어떻게 확보할까 IT동아갤로그로 이동합니다. 22.10.05 197 0
1834 포스코 IMP “10년 경험 토대로 글로벌 유니콘 등용문으로” IT동아갤로그로 이동합니다. 22.10.05 139 0
1833 [스타트업人] "팬 입장에서 팬덤 플랫폼을 만들도록 돕고 있어요"...비마이프렌즈의 CS팀 이야기 IT동아갤로그로 이동합니다. 22.10.05 191 0
직접 인공지능 그림 그려보니··· '문외한도 작가 됐다' [19] IT동아갤로그로 이동합니다. 22.10.05 5351 17
1831 '메타 퀘스트2' 왕좌 빼앗기나…피코, 신제품 '피코4' 한국 출시 [6] IT동아갤로그로 이동합니다. 22.10.04 1588 1
1830 차 보험 대차료 합리화...친환경차 기준도 생긴다 IT동아갤로그로 이동합니다. 22.10.04 116 0
1829 충성도 높은 실시간 방송 팬덤... '트위치 마케팅은 성공 문법 중 하나' [25] IT동아갤로그로 이동합니다. 22.10.04 2597 1
1828 젠하이저 이종석 상무 “유튜버가 스튜디오급 음향? 노이만과 함께하면 가능” [12] IT동아갤로그로 이동합니다. 22.10.04 2832 8
1827 [스케일업] 프롬차일드 [1] "믿고 먹는 식물성 단백질 보충제 선두 되려면?" [2] IT동아갤로그로 이동합니다. 22.10.04 1716 0
1826 [주간투자동향] 서울로보틱스, 308억 원 규모의 시리즈B 투자 유치 IT동아갤로그로 이동합니다. 22.10.04 101 0
1825 스튜디오 음향기기의 강자 노이만, 1인 미디어 시장도 노린다 IT동아갤로그로 이동합니다. 22.09.30 244 1
1824 넥스트페이먼츠 “스마트 상점, 주문 통합 이어 무인 상점 시대 연다” IT동아갤로그로 이동합니다. 22.09.30 162 0
1823 팩트체크를 하고 싶다면?... "악마의 대변인처럼 반론을 제기해라" [1] IT동아갤로그로 이동합니다. 22.09.30 363 2
1822 '음악·글·사진'도 AI가 만든다... "AI 창작물에도 약한 저작권 보호가 필요해" [19] IT동아갤로그로 이동합니다. 22.09.30 3218 0
1821 [리뷰] 합리적 가격에 전문가용 모니터 찾는다면, 벤큐 PD2506Q [6] IT동아갤로그로 이동합니다. 22.09.30 3070 2
1820 [농업이 IT(잇)다] 울릉브루어리 “울릉도만의 청정 맥주·문화 콘텐츠 기대하세요” IT동아갤로그로 이동합니다. 22.09.30 141 0
1819 [리뷰] 망가져도 데이터 살려주는 외장하드, 씨게이트 원터치 HDD 데이터복구 [8] IT동아갤로그로 이동합니다. 22.09.29 2759 1
1818 [홍기훈의 ESG 금융] ESG와 채권 (4) ESG가 채권시장에 영향을 미치는 방법 IT동아갤로그로 이동합니다. 22.09.29 152 0
1817 [시승기] 볼보 전동화 신호탄, ‘XC40 리차지’ 타보니 [4] IT동아갤로그로 이동합니다. 22.09.29 1239 1
1816 [스케일업] 푼타컴퍼니 [1] “식후경 2.0 서비스, 이제 맛보고 구매하세요” IT동아갤로그로 이동합니다. 22.09.29 151 0
1815 게이밍 시장 잡는다··· 인텔, 신형 CPU와 그래픽 카드 동시 공개 [22] IT동아갤로그로 이동합니다. 22.09.29 2833 6
1814 [가상자산 제대로 알기] 1. 가상자산을 제대로 알기 위한 첫 단계 - 용어 이해 IT동아갤로그로 이동합니다. 22.09.29 168 0
1813 공공 부문의 해외 클라우드 진출, '실리와 명분' 모두 챙겨야 IT동아갤로그로 이동합니다. 22.09.28 205 0
1812 조선업계, 신개념 돛 ‘로터세일’로 탄소 배출 저감 추진 IT동아갤로그로 이동합니다. 22.09.28 165 0
1811 NFT 비즈니스는 진화한다..."좋은 비즈니스 모델을 찾는 것이 중요" [1] IT동아갤로그로 이동합니다. 22.09.28 199 0
1810 중요 데이터 암호화하고 협박하는 랜섬웨어, 피해 어떻게 줄여야 할까? [6] IT동아갤로그로 이동합니다. 22.09.28 2124 0
1809 체인지업 그라운드 “1조원 가치 스타트업의 요람, 퍼시픽 밸리로” IT동아갤로그로 이동합니다. 22.09.28 171 0
1808 한층 진화한 사진 놀이, 인스탁스 미니 링크2 포토 프린터 출시 IT동아갤로그로 이동합니다. 22.09.27 1931 0
1807 유료 이용률 정체, 만족도 하락...OTT 옥석은 ‘콘텐츠’와 '가격'이 가린다 [1] IT동아갤로그로 이동합니다. 22.09.27 212 0
1806 [IT신상공개] 접히는 노트북 시대 온다, 에이수스 젠북 17 폴드 OLED [28] IT동아갤로그로 이동합니다. 22.09.27 3363 4
1805 [박진성의 블록체인 바로알기] 9. '이더리움 2.0'의 첫걸음, '더 머지(Merge)' IT동아갤로그로 이동합니다. 22.09.27 146 0
1804 [모빌리티 인사이트] 스스로 음주운전을 단속하는 자동차? IT동아갤로그로 이동합니다. 22.09.27 126 0
1803 [스케일업] 레디블룸 [1] “여성 위한 단백질의 모든 것 줄 운영 전략 원한다” IT동아갤로그로 이동합니다. 22.09.27 137 0
뉴스 [포토] '대가족'에서 연기 기대해 주세요 디시트렌드 10:00
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2