디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[리뷰] 인터뷰·회의 내용을 빠르고 정확하게 텍스트로 변환한다... AI속기사 '클로바노트'

IT동아갤로그로 이동합니다. 2022.08.31 16:45:44
조회 1748 추천 0 댓글 4
[IT동아 정연호 기자] 다른 사람이 말하는 내용을 속기하는 건 어려운 일이다. 수업이나 회의, 인터뷰에서 들려오는 말을 다 적다 보면 내용을 놓치는 일이 부지기수다. 또한, 기록에만 집중하게 되면 내용 자체에 집중하지 못하게 된다. 그래서, 수업이나 인터뷰에 편하게 참여하기 위해, 대화 내용을 녹음하고 이후로 음성파일을 들어서 이를 텍스트로 옮겨 적는 사람이 많다.

문제는 녹음파일을 텍스트로 옮기는 작업에 드는 시간이다. 1시간 분량의 녹음파일이라면 모든 문장을 다 일일이 적고서 내용을 보기 좋게 정리하는 데만 2~3 시간 정도 걸린다. 생각보다 많은 시간을 내용 정리에만 써야 하는 것이다.

평소 이런 문제를 겪고 있었다면 STT(Speech to text) 서비스를 활용하는 것도 좋은 방법이다. STT는 컴퓨터가 사람의 언어를 해석해 이를 문자로 변환하는 기술을 말한다. 최근 STT 기술은 화자의 발음이 많이 어눌하거나, 단어 자체의 발음이 어려운 경우가 아니라면 오타를 거의 내지 않는 수준으로 기술이 발전했다. 한국어로 진행된 대화라면 오타는 드물게 발견된다.


AI를 활용한 STT 서비스 클로바노트, 출처=네이버



대표적인 STT 서비스엔 네이버의 클로바노트가 있다. 네이버 계정만 있으면 누구나 무료로 이용할 수 있다. 클로바노트 웹이나 앱에서 음성파일을 등록하고, 대화에 참여한 사람의 수와 해당 대화의 성격(인터뷰, 강연 등)을 설정하면 텍스트화가 가능하다.

클로바노트를 쓰기 전엔 STT 기술을 활용할 생각을 한 적이 없었다. 음성 인식도가 떨어질 것이란 편견 때문이었다. STT의 결과물에 오탈자가 많거나 대화 내용이 제대로 적혀 있지 않다면 이를 교정하는 데 들어가는 시간으로 인해 배보다 배꼽이 더 커질 것 같았다.


클로바노트에 웹페이지에서 서비스를 이용하는 방법. 대화 내용에 영어가 조금 들어간다면 인식 언어를



클로바노트 결과물을 보면 음성 인식도는 완벽하진 않지만, 훌륭하다는 평가를 받을 만하다. 회의나 인터뷰 내용을 정리할 때 큰 도움을 받을 수 있을 것이다. 오타가 적어 교정 등의 후처리 작업도 금방 끝낼 수 있어 만족스럽다. 상대방 목소리를 스마트폰 마이크와 가까운 거리에서 녹음하는 인터뷰나 전화 통화는 오탈자가 정말 드물게 발견된다. 키보드로 직접 내용을 적는 것보다 정확도가 높다.

오탈자가 나더라도 ‘면도기’를 ‘면독’로 작성한 것처럼 특정 단어에 오타가 발생하는 정도다. 이런 경우라면 앞뒤 문맥으로 무슨 단어인지 유추가 가능해, 해당 부분의 음성을 듣고서 내용을 확인할 필요가 없다. 강의나 콘퍼런스처럼 스피커를 통해서 전달되는 내용을 녹음한 파일도 음성 인식도가 훌륭하다. 화자의 목소리가 소음과 같이 녹음됐다면, 소음이 너무 심하지 않은 경우엔 문장이 정확하게 인식된다. 다만, 선풍기 소리처럼 너무 큰 소음이 잡혀 있다면 목소리 인식이 안 되는 상황도 있으니 주의가 필요하다.


talk라고 발음한 부분이 chuck으로 기록됐다. 영어의 경우 오탈자가 한국어보단 많이 나타난다



영어의 경우엔 인식도가 떨어진다는 점을 감안해야 한다. 영어 문장은 전체 문장에서 단어들이 잘못 적히는 일이 종종 발생한다. 다만, 다른 국내 STT서비스와 비교했을 때 클로바노트의 영어의 인식도는 높은 편으로 보인다.


시간과 말하는 화자에 따라서 음성 내용이 깔끔하게 정리된다



클로바노트가 인상적이었던 점은 내용을 타임라인과 화자에 따라 정리해준다는 것이다. 해당 문장을 누르면 그 부분의 음성이 재생된다. 문맥상 무슨 단어를 쓴 건지 유추하기 어려울 때 이 기능으로 음성을 듣고 원래 단어나 문장을 확인할 수 있다. 음성을 텍스트화하는 속도도 빠른 편이다. 1시간 이상의 음성 파일을 텍스트로 변환하는 데 1분도 채 걸리지 않았다.


변환된 텍스트를 복사하는 방법



전체 내용을 복사하려면 오른쪽 옆에 세로로 된 점 세 개를 누르면 된다. 음성 기록 다운로드를 누르면 워드, 한글, 텍스트, 엑셀 등 문서 형식에 맞춰서 전체 기록을 다운받을 수 있다. 일부 내용만 복사하려면 문장 위에 마우스 커서를 놓고, 오른 쪽 위에 나타난 세 개의 점을 누르면 ‘텍스트복사’를 할 수 있다.


텍스트로 변환된 내용을 워드 문서로 다운받아봤다



클로바노트는 현재 베타 서비스 동안 모든 이용자에게 매달 300분의 무료 사용 시간을 제공하고 있다. 앱에서 녹음 파일을 변환하면 시간 제한 없이 무료로 이용이 가능하다. 인터뷰를 많이 하는 특성상 무료 시간만으로는 부족할 때가 있어서 기자의 경우엔 웹과 앱을 함께 이용하고 있다. 유료로 서비스를 이용하고 싶어도 현재는 유료 서비스를 제공하지 않고 무료 사용 시간만 제공하고 있다. 네이버 측은 “베타테스트 이후로 유료화 도입과 관련해선 아직 결정된 게 없다”라고 전했다.

클로바노트를 비롯해서 현재 무료로 이용할 수 있는 다양한 STT 서비스들이 있다. 구글의 ‘음성 자막 및 변환 알림’이나 카카오의 ‘헤이카카오’ 등 편리한 서비스들이 많이 있고, 음성 인식도도 클로바노트에 견줄 만하다.

실제로 여러 서비스를 이용해보니, 가장 중요하게 느껴진 건 서비스를 편리하게 이용할 수 있도록 하는 편의 기능이었다. 이용을 하면서 편리함이 체감됐던 건 타임라인과 화자에 맞게 내용을 정리하는 클로바노트였다. 여러 명이 대화에 참여했다면 누가 무슨 말을 했는지 구별을 하는 것도 속기 과정에서 중요하기 때문이다. 화자에 따라 대화 내용이 정리가 안 되면, 누가 말한 내용인지 확인하기 위해서 음성 파일을 듣고 목소리를 일일이 구별해야 한다.

클로바노트 결과물을 보면 누가 말을 했는지도 상당히 잘 구별돼서 정리가 돼 있다. 텍스트를 누르면 음성이 나온다는 것도 오타를 수정하는 데 큰 도움이 됐다. STT서비스는 음성 내용을 텍스트로 변환할 일이 많은 사람에게 큰 도움이 될 것이다. 무료로 제공되는 서비스이니 이 기회에 한번 STT 서비스들을 체험해봐도 좋을 듯하다.

글 / IT동아 정연호 (hoho@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ [모빌리티 인사이트] 비행기 엔터테인먼트 서비스의 진화, "승객만을 위한 게 아닙니다"▶ [모두를 위한 인공지능] 5. 우리에게 '데이터'는 어떤 의미인가▶ [모두를 위한 인공지능] 4. 인공지능이 아무리 발전해도 결국 사람의 '경험'이 중요하다



추천 비추천

0

고정닉 0

2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 인터넷 트랜드를 가장 빠르게 알고 있을 것 같은 스타는? 운영자 24/11/25 - -
4607 [투자를IT다] 2024년 11월 4주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 11.30 57 0
4606 디지포레, 충남 중소 제조기업과 손잡고 중소제조업 DX 가속화 IT동아갤로그로 이동합니다. 11.29 68 0
4605 [신차공개] 현대차 ‘아이오닉 9’ 최초 공개·포드 ‘더 뉴 익스플로러’ 출시 IT동아갤로그로 이동합니다. 11.29 69 0
4604 고려대학교 “LLM, RAG 등 유망 AI 기술사업화에 매진” IT동아갤로그로 이동합니다. 11.29 68 0
4603 퓨리오사AI, 日 AI 엑스포서 2세대 반도체 선봬··· '다각적 판로 개척에 집중' IT동아갤로그로 이동합니다. 11.29 64 0
4602 [생성 AI 길라잡이] 텍스트만 넣으면 영상, 음성, 자막까지 완성 ‘브루’ [1] IT동아갤로그로 이동합니다. 11.29 584 0
4601 맞춤형 5G특화망 ‘이음5G’, 어디에 쓰이고 있나 IT동아갤로그로 이동합니다. 11.29 497 0
4600 [리뷰] 누구나 쉽게 고음질 콘텐츠 녹음, DJI 마이크 미니 IT동아갤로그로 이동합니다. 11.29 100 0
4599 [부산창경 BEF 2024] 그리니쉬, "퍼티맥스, 임신 꿈꾸는 모든 이들을 위한 제품" IT동아갤로그로 이동합니다. 11.29 58 0
4598 [스케일업] 보라웨어 [3] 정진우 대표 “검색ㆍ쇼핑 광고 관리 솔루션으로 광고주와 함께 성장할 것” IT동아갤로그로 이동합니다. 11.29 60 0
4597 [AI와 미래] AI 창작 콘텐츠, 법적·윤리적 도전과 해결 과제 IT동아갤로그로 이동합니다. 11.29 61 0
4596 [부산창경 BEF 2024] 히어로웍스 “숙박 시설의 업무 자동화에 기여합니다” IT동아갤로그로 이동합니다. 11.29 244 0
4595 메디플렉서스 “의료데이터 수요·공급 연결, 분석과 활용 활성화” IT동아갤로그로 이동합니다. 11.29 59 0
4594 SBA, 임팩트다이브 2024 개최…“오픈 이노베이션 생태계 발판 마련” IT동아갤로그로 이동합니다. 11.28 160 0
4593 [시승기] 새로운 디자인·세단 같은 승차감 앞세운 ‘BMW 뉴 X3’ IT동아갤로그로 이동합니다. 11.28 77 0
4592 세계 최고 권위 반도체 학회 'ISSCC' 두 달 앞으로··· '韓 반도체 산업 입지는?' IT동아갤로그로 이동합니다. 11.28 157 0
4591 서울과기대 창업연합 협의체, '서울 동북권 넘어 전국 단위 연계 나선다' IT동아갤로그로 이동합니다. 11.28 78 0
4590 [부산창경 BEF 2024] 불편하고 폐쇄적인 국내 주류 유통시장을 디지털 전환한 스타트업 '링크업' IT동아갤로그로 이동합니다. 11.28 79 0
4589 삼성전자, 실속형 스마트폰 '갤럭시 A16 LTE' 29일 출시 IT동아갤로그로 이동합니다. 11.28 134 0
4588 누비랩 x 도토리소풍 넥슨 “AI 푸드 스캐너, 영유아 식습관 건강 도우미” IT동아갤로그로 이동합니다. 11.28 80 0
4587 [ENSL 2024] 영앤 “뇌건강놀이터로 어르신들 건강과 행복 책임지는 기업될 것” IT동아갤로그로 이동합니다. 11.28 81 0
4586 [생활 속 IT] 방장이 관리하는 ‘카카오톡 팀채팅’, 유용하게 쓰기 IT동아갤로그로 이동합니다. 11.27 597 0
4585 [창업도약+경북대] 아쿠아웍스 “차세대 수처리 기술로 환경문제 극복할 것” IT동아갤로그로 이동합니다. 11.27 101 0
4584 LG전자, 자체 개발 車반도체 국제 안전표준 인증 IT동아갤로그로 이동합니다. 11.27 101 0
4583 [주간스타트업동향] '신성바이오팜, 커스토젠' TIPS 선정 外 IT동아갤로그로 이동합니다. 11.27 101 0
4582 도시와 산업, 인공지능에 대한 고찰 ‘2024 울산 디자인혁신 포럼’ IT동아갤로그로 이동합니다. 11.27 102 0
4581 [ENSL 2024] 자동차 검사 및 정비 편의성 강화한 O2O 플랫폼 ‘카약’ IT동아갤로그로 이동합니다. 11.27 97 0
4580 [기고] 초고령사회를 위한 의료데이터 정보화: 소프트인프라 구축과 맞춤형 서비스 제공 IT동아갤로그로 이동합니다. 11.27 92 0
4579 [스케일업] 비투랩 [3] 김병규 병천치과의원장 “레이저 표면처리, 임플란트 기본 높일 것” IT동아갤로그로 이동합니다. 11.27 97 0
4578 [부산창경 BEF 2024] 인더라스 "고속도로 2차 교통사고, 레그널이 예방합니다" IT동아갤로그로 이동합니다. 11.27 4531 0
4577 [부산창경 BEF 2024] 보라공사 "리모델링/인테리어 공사에 대한 불신과 불안을 줄여드립니다" IT동아갤로그로 이동합니다. 11.27 90 0
4576 로웨인 “로봇 수직농장 경제성 입증한 첫 사례 만든다” IT동아갤로그로 이동합니다. 11.27 103 0
4575 [창업도약+경북대] 디엠테크컨설팅 “스마트공장장으로 제조업 디지털 전환과 상생 이룰 것” IT동아갤로그로 이동합니다. 11.27 87 0
4574 [고려대 미래내일] 청년 일경험 우수 팀 “연구 구체화, 실무 경험 값진 시간” IT동아갤로그로 이동합니다. 11.27 108 0
4573 [생활 속 IT] PC 화면 캡처 및 편집은 어떻게? IT동아갤로그로 이동합니다. 11.26 1871 1
4572 SBA, 혁신경영 성과 앞세워 대통령 포장 포함 수상 12개 석권 IT동아갤로그로 이동합니다. 11.26 106 0
4571 [부산창경 BEF 2024] 전력 절감장치에 블록체인 기술 더해 ESG 실천 돕는 ‘딥브레인’ IT동아갤로그로 이동합니다. 11.26 101 0
4570 [ENSL 2024] 헬퍼로보틱스 “F&B 불편 해결할 조리 로봇 선도” IT동아갤로그로 이동합니다. 11.26 113 0
4569 [부산창경 BEF 2024] 마리나체인 “국제 환경 규제 대응 원스톱 솔루션, 마리나넷” [6] IT동아갤로그로 이동합니다. 11.26 4504 0
4568 [부산창경 BEF 2024] 지에이치이노텍 “모든 사람이 건강한 호흡하도록” IT동아갤로그로 이동합니다. 11.26 109 0
4567 [창업도약+경북대] 그루브웍스 “아바톡ㆍ크리퐁으로 캐릭터와 전 세계 팬들을 한 자리에 모을 것” IT동아갤로그로 이동합니다. 11.25 399 0
4566 [ENSL 2024] 딸기로컴퍼니, "참신한 복지·살아있는 간식을 전합니다" IT동아갤로그로 이동합니다. 11.25 133 0
4565 ‘국가지점번호’로 내 위치 기반 구조요청 하는 법[이럴땐 이렇게!] IT동아갤로그로 이동합니다. 11.25 705 1
4564 [생활 속 IT] 카카오톡 팀채팅, 입력코드로 한꺼번에 친구 추가한다 IT동아갤로그로 이동합니다. 11.23 353 0
4563 [투자를IT다] 2024년 11월 3주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 11.23 6513 0
4562 [창업도약+경북대] 허드슨에이아이 “팀버(Timbr)로 크리에이터 글로벌 진출 가교 역할할 것” IT동아갤로그로 이동합니다. 11.22 223 0
4561 [ENSL 2024] 누구나 쉽게 버튜버 만들어주는 동영상 서비스 ‘에이플라’ [7] IT동아갤로그로 이동합니다. 11.22 5466 2
4560 [리뷰] AI PC로 거듭난 비즈니스 노트북, 에이수스 엑스퍼트북 P5(P5405) [2] IT동아갤로그로 이동합니다. 11.22 1051 0
4559 [부산창경 BEF 2024] 바다플랫폼 “블록체인 세이피안, 식품 생산·유통 안전 지킨다” IT동아갤로그로 이동합니다. 11.22 215 0
4558 [부산창경 BEF 2024] 엘리코퍼레이션 “인도 여성 인권 신장하는 콘택트렌즈 전문 브랜드” IT동아갤로그로 이동합니다. 11.22 196 0
뉴스 로제 ‘아파트’ 英 오피셜 싱글차트 3위…6주째 최상위권 디시트렌드 10:00
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2