디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[SBA x IT동아] 신티아 “생성형 AI로 고품질 오디오북 대량생산 꿈꾼다”

IT동아갤로그로 이동합니다. 2024.12.10 13:25:49
조회 4465 추천 0 댓글 1
[SBA x IT동아 공동기획] 서울특별시와 서울경제진흥원(SBA)은 서울 성수·창동·동작에 창업센터를 마련했습니다. 스타트업을 발굴, 초기 창업부터 성장기까지 단계별 프로그램을 지원해 육성합니다. 2024년 두드러진 활동을 펼친, 성장 가능성이 높은 유망 스타트업을 소개합니다.

[IT동아 김예지 기자] 전통적인 종이책이 디지털을 입고 새로운 형태의 독서 방법으로 변모하는 중이다. 디지털 기기를 통해 책을 소비하는 전자책, 오디오북이 대표적이다. 특히 오디오북은 책의 문자를 음성으로 변환해 책을 듣는 방식으로, 다양한 상황에서 손쉽게 들을 수 있고, 멀티태스킹이 가능하다는 장점을 가진다. 책을 소비하는 방식이 눈에서 귀로 확장된 셈이다.

그러나 오디오북 시장은 커지는 데 한계가 있었다. 가장 큰 이유 중 하나는 높은 오디오북 제작 비용과 이로 인해 부족한 콘텐츠 수 때문이다. 오디오북 수요가 증가하는 가운데, ‘신티아’는 이를 해결하기 위해 ‘AI 오디오북 자동제작 서비스’를 출시했다. 기존의 ‘텍스트 음성 변환(TTS, Text to Speech)’ 기술에 생성형 인공지능(AI) 음성 기술을 접목해 기존 대비 오디오북 제작 시간 및 비용을 줄인 것. 나아가, 거대언어모델(LLM)은 사람처럼 자연스럽게 책을 읽어 소비자의 오디오북 경험을 극대화한다. IT동아는 오진환 신티아 대표를 만나 신티아 서비스 및 적용 기술에 대해 물었다.


오진환 신티아 대표 / 출처=신티아


효율적으로 책을 소비하는 방법 ‘오디오북’


오진환 대표는 평소 독서를 좋아했지만 책 읽을 시간이 부족해 출퇴근 시간 오디오북을 들으며 독서를 대신해 왔다. 그러나 그는 한정된 오디오북 종류 때문에 불편함을 느꼈고, 신티아의 자체 TTS 기술을 활용해 직접 오디오북을 만들어봤다. 그러나 만든 오디오북은 사람이 낭송한 오디오북과 달리 어색함이 느껴졌다. 단순한 음성 변환으로 만들어져 강약 조절, 속도 조절 등이 적용되지 않았기 때문이다.

이에 오진환 대표는 신티아의 TTS 기능에 AI 기술을 더해 책 내레이션에 특화되도록 고도화하고, 나아가 오디오북을 자동으로 제작하는 서비스를 출시하기로 결심했다. 그는 2020년 11월 법인을 설립, 본격적으로 지난해 여름부터 시장에 진입했다. 오진환 대표는 “해외에 비해 한국은 시장은 오디오북 시장 자체가 아직 활성화되지 않은 편이나, 오디오북도 콘텐츠를 소비하는 새로운 방식으로 그 수요가 늘고 있다”고 말했다.

내레이션에 특화된 자체 AI 음성 기술


신티아의 AI 음성 기술은 오디오북 제작 시간을 기존보다 대폭 줄여준다. 기존에는 성우가 300페이지 책을 오디오북으로 제작하는 데 1달이 소요됐던 반면, 신티아의 AI는 동일 분량의 이펍(Epub, 전자책 파일 포맷) 파일을 10분만에 읽고, 8-10시간 분량의 오디오북으로 만들어 MP3 파일로 제공한다.

신티아가 제공하는 오디오북에는 기본 형식인 ‘싱글 내레이션’과 ‘멀티 캐스팅’ 두 가지 버전이 있다. 멀티 캐스팅은 마치 오디오 드라마처럼 소설 등 장르에서 다양한 등장인물의 목소리를 구분해 읽어주는 방식이다. 더불어 신티아는 책 한 권을 여러 목소리 버전으로 만들어 줄 수 있다. 오진환 대표는 “사람마다 몰입도를 높여줄 수 있는 목소리가 있다. 현재 모든 오디오북은 높은 가격 때문에 하나의 목소리 버전으로 제작되지만, 신티아는 여러 목소리 버전으로 소비자 선택폭을 넓혀준다”고 덧붙였다.


신티아 서비스 이미지 / 출처=신티아



신티아의 LLM은 책을 빠르게 읽고, 본문의 등장인물을 분석해 적합한 목소리를 찾는다. 단순한 TTS는 띄어쓰기 실수가 있어도 무시하지만, LLM은 사람처럼 문법 문제를 파악하며 읽을 수 있다. LLM은 음성 엔진에게 숨소리 조절, 강약 조절, 속도 조절, 감정 표현 등 문장 읽는 법을 지시한다. 이 LLM은 모듈화돼 개별적으로 기능을 훈련할 수 있다. 책 본문에 외국어 단어 및 문장이 있어도 19개 언어 모듈 덕분에 해당 언어를 인지해 자연스럽게 소리 낸다.

다음으로 AI 음성 엔진이 목소리를 합성해 캐스팅(어울리는 목소리를 매칭하는 것)을 완료한다. 이때 사용자는 음성 복제 기술을 통해 AI, 성우, 또는 본인의 목소리를 사용할 수 있다. 예컨대, 영국식 발음을 못 하는 사용자가 영국식 발음 내레이션에 사용자 목소리를 입히면 영국식 발음을 하는 자신의 목소리를 들을 수 있다. 덕분에 고유 명사의 경우, 작가는 의도에 맞게 단어를 소리내도록 설정할 수 있다.

오디오북은 자동으로 제작되지만, 사용자가 검토 및 수정할 수 있다. 오진환 대표는 “가장 중요한 것은 자동화다. 현재는 100% 자동화가 아니지만 파일 업로드 및 변환하는 과정이 자동 제작”이라며, “멀티 캐스팅 영역 등에서 아직 개발 훈련이 필요하나, 점차 학습 데이터가 쌓이며 목소리 구분이 정확해지고 향후 자동화가 가능해질 것”이라고 말했다.

식사 한 끼 값으로 오디오북 제작한다


오진환 대표는 오디오북 제작의 가장 큰 걸림돌인 제작 비용을 낮췄다는 점을 강조한다. 그는 “미국에서는 1년에 책 약 400만 권이 출판되면 이중에서 상위권에 있는 약 2%인 8만 권만 오디오북으로 만들어진다. 그 이유는 300페이지 책을 오디오북으로 제작하는 데 수백만 원이 드는 구조 때문”이라고 설명했다. 그러면서 “오디오북으로 아직 만들어지지 않은 나머지 98% 책들을 대량생산처럼 저렴한 가격에 오디오북으로 만들겠다”고 말했다.

신티아는 오디오북 제작 완료 후, 결과물 재생 시간을 차감하는 방식으로 시간당 9.9달러(약 1만 4000원)를 과금한다. 10시간이면 99달러(약 14만원)인데, 여기에 개인이 1년권을 구독할 경우 약 20달러(약 2만 8000원)에 10시간을 제공한다. 즉, 식사 한 끼 값으로 오디오북을 만들 수 있다는 설명이다. 싱글 내레이션 가격과 멀티 캐스팅 가격은 동일하다.


오진환 신티아 대표 / 출처=IT동아


화이트 라벨 전략 B2B·개인 작가 대상 B2C 노린다


오진환 대표는 시장 본격 진출 후, 유럽과 미국 시장을 중심으로 고객군을 넓혀가는 중이다. 지난 10월 독일 프랑크푸르트 도서전에서 해외 오디오북 플랫폼 기업을 만나 협력을 논의한 데 이어 국내에서도 대형 출판사와 계약을 체결했다.

신티아는 언어별·국가별 오디오북 서비스 기업과 협력해 오디오북 제작 시장 점유율을 높일 계획이다. 오진환 대표는 “단기간에 많은 책이 신티아를 통해 오디오북으로 제작되는 과정에서 시장 점유율 확보가 중요하다”며, “국가별 유명한 파트너사에서 신티아의 기술이 사용되도록 ‘화이트 라벨(White Label)’ 전략으로 접근하고 있다”고 설명했다.

또한 신티아는 출판사를 필요로 하지 않는 미국 개인 작가와 중소형 출판사 등 B2C 시장으로의 기회도 엿본다. 장기적으로는 제작 외 플랫폼으로 진화한다는 목표다. 오진환 대표는 “현재는 개인 작가가 오디오북을 만들어 다른 플랫폼에 가져가 거래한다. 이러한 번거로움을 해소하기 위해 신티아는 오디오북 플랫폼과 연계해 직접 오디오북을 제공할 예정이다. 나아가, 향후에는 작가가 신티아에서 제작한 오디오북을 직접 판매하는 플랫폼으로 진화할 것이라 기대한다”고 말했다.

이어 그는 “대형 플랫폼은 작가의 콘텐츠를 독점하는 수익 구조를 유지하는데, 이때 작가가 콘텐츠에 주도권을 가지면 협상력을 가질 수 있다. 신티아는 오디오북 제작 서비스를 함께 제공하면서 작가에게 수익 비율을 많이 줄 수 있다”며, “오디오북은 사업의 본질이 콘텐츠다. 작가들이 더 많은 수익을 가져가게끔 하여 출판 시장의 건강한 생태계를 만들어 나가는 것이 목표”라고 덧붙였다.

IT동아 김예지 기자 (yj@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ [스타트업-ing] 써티블랙 “공간음악 서비스 기반의 오디오 광고 플랫폼, 스넥스”▶ [투자를IT다] 2024년 12월 1주차 IT기업 주요 소식과 주가 흐름▶ 6G 필수 기술로 꼽히는 오픈랜, 이점 뭐길래



추천 비추천

0

고정닉 0

23

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 나라가 위기에 처하면 가장 먼저 나설 것 같은 스타는? 운영자 24/12/09 - -
이슈 [디시人터뷰] ‘피의 게임3’ 게임판을 흔드는 플레이어, 유리사 운영자 24/12/09 - -
4657 AI 가전 넘어 AI홈으로…삼성·LG 전략은 IT동아갤로그로 이동합니다. 12.11 55 1
4656 [스케일업] 모넷코리아 [3] 미국 모넷 CEO “한국 IoT 시장의 성과는 세계의 모범” IT동아갤로그로 이동합니다. 12.11 53 0
4655 [주간스타트업동향] 카카오벤처스 패밀리 7곳, CES 2025 참여 外 IT동아갤로그로 이동합니다. 12.11 36 0
4654 [스타트업-ing] 트래비어지 “사람보다 똑똑한 인공지능 여행 비서” IT동아갤로그로 이동합니다. 12.11 43 0
4653 [KIDP 울산] 아워즈팜 “농가 환경에 맞춘 단계별 스마트팜 모듈로 혁신을 꾀하다” IT동아갤로그로 이동합니다. 12.11 38 0
4652 [ETF 기본기 다지기] 주식과 펀드의 장점을 결합한 ETF IT동아갤로그로 이동합니다. 12.11 3046 0
4651 [KIDP 울산] 서브루나바이크 [2] 접이식, 전동 자전거 신제품으로 2025년 도약 IT동아갤로그로 이동합니다. 12.11 43 0
4650 이세용 대표 “세계화, 드레이퍼 스타트업 하우스 코리아에서” IT동아갤로그로 이동합니다. 12.10 93 0
4649 [KTVF 2024] 바이오커넥트 “비접촉 생체 정보 측정 솔루션, 바이탈트래커” IT동아갤로그로 이동합니다. 12.10 127 0
[SBA x IT동아] 신티아 “생성형 AI로 고품질 오디오북 대량생산 꿈꾼다” [1] IT동아갤로그로 이동합니다. 12.10 4465 0
4647 [KIDP 울산] 모토웨이 '산업안전 모니터링', 차량·AI 기술로 실현 가능성 ↑ IT동아갤로그로 이동합니다. 12.10 121 0
4646 [신차공개] '디 올 뉴 팰리세이드' 공개·'25년형 캠리 하이브리드' 출시 IT동아갤로그로 이동합니다. 12.09 2228 0
4645 인텔, 2세대 '배틀메이지' 데스크톱 GPU 출시··· '시장 공략에 박차' IT동아갤로그로 이동합니다. 12.09 124 1
4644 오래된 수동 렌즈, 미러리스 카메라에 쓰기 전 확인할 것들 [이럴땐 이렇게!] IT동아갤로그로 이동합니다. 12.09 4203 3
4643 윤경식 경희의무산단 원장 “의학 융합 연구 도와 우리 의료기술 세계로” IT동아갤로그로 이동합니다. 12.09 110 0
4642 [스타트업-ing] 써티블랙 “공간음악 서비스 기반의 오디오 광고 플랫폼, 스넥스” IT동아갤로그로 이동합니다. 12.09 95 0
4641 [리뷰] 가장 큰 존재감을 얹은 카메라, 캐논 EOS R5 마크 II [2] IT동아갤로그로 이동합니다. 12.09 1709 1
4640 [IT애정남] 스마트TV용 유튜브에서 시청 기록 안 남기려면? IT동아갤로그로 이동합니다. 12.09 1754 1
4639 [투자를IT다] 2024년 12월 1주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 12.07 163 0
4638 세종시+세종창경, '창업한마당 2024'서 올해 스타트업 육성/지원 성과 발표 IT동아갤로그로 이동합니다. 12.06 172 0
4637 6G 필수 기술로 꼽히는 오픈랜, 이점 뭐길래 IT동아갤로그로 이동합니다. 12.06 214 0
4636 고현우 몰라도 대표, "창업 인큐베이팅 수상, 밤낮 함께한 서울과기대 덕분이죠" IT동아갤로그로 이동합니다. 12.06 164 0
4635 [생성 AI 길라잡이] 생성 AI로 업무 효율 높이는 기업들 [1] IT동아갤로그로 이동합니다. 12.06 4207 0
4634 인공지능 환각 줄일 ‘그래프 신경망’에 주목 IT동아갤로그로 이동합니다. 12.06 162 0
4633 [기술영업人] 운영기술의 길 개척하는 '에스넷시스템'의 영업 방향 IT동아갤로그로 이동합니다. 12.06 1179 0
4632 호반건설 “혁신 스타트업과의 동반 성장이 목표” IT동아갤로그로 이동합니다. 12.06 151 0
4631 [리뷰] 엡손 EH-QB1000B, 상위 1%용 고화질 4K 레이저 홈 프로젝터 IT동아갤로그로 이동합니다. 12.05 172 0
4630 디지털 트윈 기술로 접근 불가능한 지역 모니터링 돕는 ‘메이사’ IT동아갤로그로 이동합니다. 12.05 1242 0
4629 [부산창경 BEF 2024] 온유어사이드 “모두가 맛있고 건강하게 즐기는 식물성ㆍ대체 식품을 만듭니다” IT동아갤로그로 이동합니다. 12.05 180 0
4628 [IT애정남] 스마트폰이 언제부턴가 80%만 충전돼요 IT동아갤로그로 이동합니다. 12.05 197 0
4627 수원대 “실전 스타트업 코치 육성, 세르파 프로그램 고도화” IT동아갤로그로 이동합니다. 12.05 159 0
4626 교보생명 “스타트업과의 협업 통해 보험업 역량 강화 및 신사업 발굴 기대” IT동아갤로그로 이동합니다. 12.05 555 0
4625 [생활 속 IT] 유튜브 동영상, 보고 싶은 장면 빨리 찾고 싶다면? IT동아갤로그로 이동합니다. 12.05 684 0
4624 스타트업과 손잡고 클라우드 기반 스마트홈 시스템·로봇배송 추진 ‘현대건설’ IT동아갤로그로 이동합니다. 12.04 176 0
4623 [생활 속 IT] 스마트폰 살균 세척, 정석적으로 하는 법은? [1] IT동아갤로그로 이동합니다. 12.04 2062 0
4622 [부산창경 BEF 2024] 프리그로우 “사람들이 공간을 즐겁고 효율적으로 활용하도록 돕습니다” IT동아갤로그로 이동합니다. 12.04 4214 0
4621 [주간스타트업동향] 스텔라비전, 중기부 장관상 수상 外 IT동아갤로그로 이동합니다. 12.04 144 0
4620 GS리테일 “스타트업과 함께 오프라인 매장의 디지털 전환 속도 높인다” IT동아갤로그로 이동합니다. 12.04 153 0
4619 서울대, AI 반도체 포럼 개최…“핵심 화두는 전력 효율성” [1] IT동아갤로그로 이동합니다. 12.04 546 0
4618 수목 병해충 발생 예측부터 방제약 처방까지 돕는 ‘애프터레인’ IT동아갤로그로 이동합니다. 12.03 164 0
4617 KIAT, 차세대 배터리 산업 지원 위해 팔 걷어 IT동아갤로그로 이동합니다. 12.03 158 0
4616 단말기에서 스팸 문자 AI 필터링 가능해진다 [2] IT동아갤로그로 이동합니다. 12.03 788 1
4615 [부산창경 BEF 2024] 아이쿠카 “자녀와 부모가 함께하는 디지털 생활 플랫폼 꿈꾼다” IT동아갤로그로 이동합니다. 12.03 152 0
4614 ‘ai.kr, it.kr’ 등 신규 도메인, 오늘부터 선점 가능? IT동아갤로그로 이동합니다. 12.03 142 0
4613 [자동차와 法] 편리함 이면에 잠재된 위험과 법적 책임 ‘전동킥보드’ [4] IT동아갤로그로 이동합니다. 12.03 1652 0
4612 [부산창경 BEF 2024] 기술 활용해 일상 속 탄소 저감 돕는 ‘글루리’ IT동아갤로그로 이동합니다. 12.02 155 0
4611 [KIDP 울산] 아워즈팜 “스마트팜에서 재배한 딸기, 포장 디자인 혁신으로 친근하게” IT동아갤로그로 이동합니다. 12.02 145 0
4610 [스타트업-ing] 세종 백경증류소 "와인, 위스키에 필적할 우리 전통주를 만들겠습니다!" IT동아갤로그로 이동합니다. 12.02 606 2
4609 겨울철 온열기기 에너지 사용량 읽는 법 [이럴땐 이렇게!] IT동아갤로그로 이동합니다. 12.02 158 0
4608 [주간투자동향] 에이아이스페라, 120억 원 후속 투자 유치 外 IT동아갤로그로 이동합니다. 12.02 142 0
뉴스 '미스터트롯3' 장민호-영탁-김희재-이찬원-정동원, 선배 마스터 5인방이 밝힌 관전포인트 디시트렌드 12.11
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2