디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[SBA x IT동아] 큐빅 “민감정보 노출 위험 없는 고품질 합성 데이터, AI 혁신 앞당길 것”

IT동아갤로그로 이동합니다. 2024.09.20 18:57:39
조회 307 추천 0 댓글 0
[SBA x IT동아 공동기획] 서울특별시와 서울경제진흥원(SBA)은 서울 성수·창동·동작에 창업센터를 마련했습니다. 스타트업을 발굴, 초기 창업부터 성장기까지 단계별 프로그램을 지원해 육성합니다. 이에 본지는 SBA와 공동으로 2024년 두드러진 활동을 펼친, 성장 가능성이 높은 유망 스타트업을 소개합니다.

[IT동아 권택경 기자] 인공지능(AI) 기술 발전을 위해서는 AI 모델을 학습시킬 데이터가 필수적이다. 하지만 현실에 있는 많은 데이터는 민감한 개인정보를 담고 있어 사용에 제약이 따른다. 이 문제를 해결하기 위해 데이터에서 특정 개인을 식별할 수 있는 정보를 지우는 ‘비식별화’ 처리를 하거나 실제 데이터와 유사하게 인위적으로 생성한 ‘합성 데이터’를 쓰곤 한다.

하지만 비식별화나 합성 데이터도 완벽한 해법은 아니다. 비식별화한 데이터는 원본 데이터보다 정보가 부족할 수밖에 없고, 합성 데이터는 품질과 보안이 반비례하는 문제가 있다.

큐빅(CUBIG)은 차등정보보호 기반 합성 데이터 솔루션으로 이 문제를 해결하는 스타트업이다. 정민찬 큐빅 대표는 “기존의 합성 데이터에서 품질과 보안은 시소처럼 한쪽이 올라가면 다른 한쪽은 내려가는 관계”라고 설명한다.


정민찬 큐빅 대표 / 출처=IT동아



합성 데이터도 결국 AI가 실제 데이터를 원본삼아 학습한 결과로 생성한 데이터이니 원본의 정보가 노출될 수 있는 위험을 내포한다. 그렇다고 실제 데이터 없이 합성을 하면 데이터 품질도, 이를 통해 학습한 인공지능의 성능도 떨어질 수밖에 없다.

큐빅은 차등정보보호 기술을 합성 데이터에 적용해 원본 데이터와 같은 수준의 품질은 유지하면서도 보안성을 높였다. 차등정보보호 기술은 원본 데이터에 노이즈를 추가해 민감정보를 식별할 수 없게 만드는 기술을 말한다. 그러면서도 AI 학습에 사용했을 때 원본 데이터와 같은 수준의 성능을 유지하는 게 핵심이다.


큐빅의 차등정보보호 솔루션 / 출처=큐빅



예를 들어 한 대학교 학생들의 성적 데이터를 비식별화할 때, 단순히 이름을 일부 가리는 것만으로는 개인정보 보호에 한계가 있다. 성별, 연령, 학과 등 다른 정보를 종합하면 누구인지 유추할 수 있기 때문이다. 결국 보안성을 더 높이기 위해 더 많은 정보를 가리게 되면 그 데이터로는 연령이나 학과에 따른 성적 통계를 낼 수 없게 된다. 정보로서의 가치가 떨어지는 데이터가 되는 셈이다.

하지만 차등정보보호 기술을 적용하면 원본 데이터의 통계적 속성은 같으면서도 원본의 정보에 담긴 민간정보는 유추할 수 없는 데이터셋을 만들 수 있다. 이름, 성별, 연령, 학과 등 개별적 정보는 실제 원본과 전혀 다르고 그 어떤 연결고리도 없지만 통계를 내보면 원본과 같은 결과가 나오는 것이다.


큐빅의 기술을 적용한 합성 데이터 예시 / 출처=큐빅



이미지에도 마찬가지로 차등정보보호 기술을 적용할 수 있다. 피부 트러블 진단을 위한 AI를 학습시키기 위한 얼굴 사진의 경우, 단순히 눈이나 입가에 모자이크 처리를 하는 대신 눈과 입은 전혀 다른 형태로 바꿔놓는 방식이다. 원본 데이터 속 인물과는 전혀 다르지만 AI가 학습하는 데 필요한 피부 트러블에 관한 정보는 그대로 간직한 데이터가 탄생한다.

품질이 높은 합성 데이터일수록 원본이 유출될 위험성도 높아지만 큐빅은 AI가 원본 데이터에 직접 접근하지 않는 방식을 구현해 이 위험을 원천 차단했다. 합성 데이터를 만들어 내는 AI가 원본은 보지 못한 채 원본과의 유사한 합성 데이터만 뽑아내는 것이다.


정민찬 큐빅 대표 / 출처=IT동아



정민찬 대표는 “산업 재해, 자율주행, 비전 AI 등 분야에서 시뮬레이션 기반 합성 데이터를 제공하는 회사는 수천수백 개가 있다. 하지만 큐빅처럼 원본 데이터의 대용품이 될 수 있는, 기존 비식별화보다 더 고차원적인 비식별화 처리가 가능한 합성 데이터 기술을 보유한 곳은 전 세계적으로도 큐빅을 포함해 4곳 정도에 불과하다”고 말했다.

큐빅에서는 이 기술을 활용해 기업에 DTS(Data Transform System)라는 솔루션을 제공한다. 데이터 활용을 하고자 하는 기업들이 직접 내부에서 합성 데이터를 만들 수 있는 솔루션이다. 서비스형 소프트웨어(SaaS) 형태뿐만 아니라 설치형(On-Premises) 방식으로도 제공해 보안 문제로 데이터 외부 반출이 불가능하더라도 합성 데이터로 만들어 AI 모델 학습에 활용하거나 외부 AI 개발 업체와 공유할 길을 열어준다.


큐빅의 합성 데이터 솔루션 / 출처=큐빅



실제 민감한 군사기밀을 다루는 공군이 큐빅과 실증(PoC)을 진행 중이다. 이 외에도 네이버, SK텔레콤과도 협업을 진행하고 있다. 정민찬 대표는 “같은 조직 내에서도 부서나 계열사 간에 데이터를 공유하지 못하는 이른바 ‘데이터 사일로’ 현상도 해소할 수 있다”고 덧붙였다.

데이터 공급자 역할을 하고자 하는 기업, 기관 등을 위한 데이터 장터 플랫폼 ‘에이주(Azoo)’ 또한 지난 6월 선보였다. 데이터 분석부터 거래, 결합, 검증까지 모두 해결 가능한 서비스다. 에이주를 활용하면 양질의 데이터를 보유한 기업과 기관들은 원본에 담긴 민감정보가 없는 안전한 합성 데이터를 만들고 판매해서 추가로 수익을 올릴 수 있고, 데이터 수요 기업들도 개인정보보호 문제로부터 자유로운 양질의 데이터를 손쉽게 얻게 된다.


배호 큐빅 대표 / 출처=큐빅



큐빅을 창업한 배호 대표는 이화여자대학교 인공지능대학 사이버보안학과 교수로 재직 중인 인공지능 및 개인정보보호 기술 분야의 전문가다. 서울대 박사 과정 중이던 2016년부터 일찌감치 AI의 보안, 개인정보보호 문제를 연구했다. 알파고의 등장이 대중들에게 인공지능의 존재를 이제 막 각인한 해에 AI 시대에 대두될 새로운 문제를 미리 내다본 것이다. 서울대에서 함께 연구하던 이들, 차등정보보호 기술의 사업화 가능성에 주목한 정민찬 대표 등이 배호 대표를 구심점으로 모이며 2021년 큐빅이 탄생했다.

큐빅은 네이버 D2SF, 브이엔티지, 이화여대 기술지주의 시드 투자를 받은 데 이어 최근에는 씨엔티테크, 한국산업은행 등이 참여한 프리A 투자도 유치했다. 서울경제진흥원(SBA)도 팀빌딩 지원사업으로 큐빅의 성장에 힘을 실었다. 정민찬 대표는 “SBA를 통해 다양한 멘토를 만나 사업 모델의 문제점을 개선하거나 투자 유치 활동을 위한 조언을 받았다. 기술적으로는 강점에 있지만 사업적으로는 놓치고 있었던 문제를 한 번 짚을 수 있었고, 빠른 성장 속도로 인해 생겼던 부작용을 최소화할 수 있었다”고 말했다.

글로벌 시장에서도 큐빅의 기술에 주목한다. 세계적으로 데이터에 대한 수요가 높아지는 상황에서 원본 데이터 노출 위험을 차단한 합성 데이터를 만드는 큐빅의 기술은 꼭 필요한 기술이기 때문이다. 정민찬 대표는 “한국에서 다양한 고객사들과 좋은 성과를 내고, 그 성과를 바탕으로 글로벌 시장에 진출할 계획”이라고 밝혔다.

글 / IT동아 권택경 (tk@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ ‘내장 그래픽 성능 강화’한 인텔ㆍAMD 차세대 CPU, 게이밍 UMPC에 다시 힘 실릴까?▶ 세일즈포스, 엔비디아·구글·IBM 손잡고 '혁신 선도'의 길 간다▶ [투자를IT다] 2024년 9월 2주차 IT기업 주요 소식과 주가 흐름



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 손해 보기 싫어서 피해 입으면 반드시 되갚아 줄 것 같은 스타는? 운영자 24/11/18 - -
4556 전문가가 제시하는 스타트업 ESG 경영 전략…’2024 서울 스타트업 ESG 포럼’ IT동아갤로그로 이동합니다. 19:51 11 0
4555 수원대학교 'WoW 스타트업 브랜치 오픈이노베이션' 개최 IT동아갤로그로 이동합니다. 17:01 16 0
4554 [스타트업리뷰] 로닉 “인공지능 맞춤형 음식 도우미, AI 로봇셰프 큐브” IT동아갤로그로 이동합니다. 16:33 1197 0
4553 [IT기획자의 탄생] 3. IT기획자에게 필요한 상상력과 글로벌 전략 IT동아갤로그로 이동합니다. 10:43 32 0
4552 [IT’s 가성비] 삼성 크리스탈 UHD TV, 2024년형/85인치 모델에 눈길? IT동아갤로그로 이동합니다. 09:07 1775 0
4551 [스케일업] 클리카 [3] 피터 노빅과의 대담으로 살펴본 'AI 스타트업'의 방향성 IT동아갤로그로 이동합니다. 09:06 31 0
4550 [생활 속 IT] LG 가전 활용도 넓히는 'LG ThinQ' 연결 및 사용법 IT동아갤로그로 이동합니다. 08:21 25 0
4549 [생활 속 IT] 소프트웨어 활용 습관 바꿔줄 윈도 11 ‘가상 데스크톱’ [1] IT동아갤로그로 이동합니다. 11.20 74 0
4548 [부산창경 BEF 2024] 기술로 문제 풀이와 오답 노트 작성 효율 높인 ‘프라이머스’ IT동아갤로그로 이동합니다. 11.20 46 0
4547 IBM-연세대, 슈퍼컴 능가하는 127 큐비트 양자컴퓨터 국내 첫 도입 [3] IT동아갤로그로 이동합니다. 11.20 4756 4
4546 [주간스타트업동향] 휴머닉스, 위플로 CES 2025 혁신상 수상 外 IT동아갤로그로 이동합니다. 11.20 93 0
4545 [부산창경 BEF 2024] 만만한녀석들 “모듈형 집기로 친환경 MICE 산업 선도한다” IT동아갤로그로 이동합니다. 11.20 45 0
4544 [부산창경 BEF 2024] 나누기월드 “외국인 유학생, 장애인 문제 해결에 기여” [3] IT동아갤로그로 이동합니다. 11.20 247 0
4543 선박 제조업의 디지털 전환 이끄는 ‘버추얼 트윈’ 기술 IT동아갤로그로 이동합니다. 11.19 74 0
4542 에릭슨엘지 “네트워크도 API로 제공…개발자 참여 독려해야” IT동아갤로그로 이동합니다. 11.19 74 0
4541 [IT애정남] 노트북 SSD의 OEM 파티션, 삭제해도 되나요? IT동아갤로그로 이동합니다. 11.19 78 0
4540 [부산창경 BEF 2024] 그린에너지(주) “산업 현장 악취·유해물질 플라즈마로 해결” IT동아갤로그로 이동합니다. 11.19 78 0
4539 [자동차와 法] 행락철 교통사고 책임과 법적 대처 방안 IT동아갤로그로 이동합니다. 11.19 667 0
4538 아이작 컨셉츠 김태영 대표, "반도체·열유체 공학의 산학협력 교두보 만들겠다" IT동아갤로그로 이동합니다. 11.19 75 0
4537 [시승기] 돋보이는 디자인과 안전 사양 ‘KGM 액티언’ [1] IT동아갤로그로 이동합니다. 11.18 351 0
4536 +불필요한 PC 앱, 지우려면 이렇게! [이럴땐 이렇게!] [1] IT동아갤로그로 이동합니다. 11.18 5089 5
4535 [스케일업] 반프 [3] 정예솔 전략총괄 “반프의 가치, 글로벌 시장에서도 매력적” IT동아갤로그로 이동합니다. 11.18 107 0
4534 [주간투자동향] 숨빗AI, 50억 원 규모 시드 투자 유치 外 IT동아갤로그로 이동합니다. 11.18 99 0
4533 [투자를IT다] 2024년 11월 2주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 11.16 199 0
4532 [스케일업] 보라웨어 [2] 전영복ㆍ이효주 “구성원 복지ㆍ기업 성장이 공존하는 곳” IT동아갤로그로 이동합니다. 11.15 193 0
4531 [생성 AI 길라잡이] 8종의 AI 모델 골라 쓰는 ‘SKT 에이닷’ 웹 버전 IT동아갤로그로 이동합니다. 11.15 181 0
4530 디지포레, “제조산업의 디지털 전환, ‘팩토리얼 프로’로 앞당길 것" IT동아갤로그로 이동합니다. 11.15 174 0
4529 [리뷰] 모니터링 헤드폰의 새로운 기준점 제시, 소니 MDR-M1 [5] IT동아갤로그로 이동합니다. 11.15 6191 1
4528 [2024 고려대] 스페이스점프 “자영업·소상공인 기자재의 모든 것, 소상공간” IT동아갤로그로 이동합니다. 11.15 166 0
4527 퀄컴, 온디바이스 AI·차량 전동화에 초점 맞춘 최신 솔루션 선보여 IT동아갤로그로 이동합니다. 11.15 186 0
4526 [창업도약+경북대] 비빔블 “비커스ㆍ버튜디오로 상상 이상의 가상경험 제공할 것” IT동아갤로그로 이동합니다. 11.15 143 0
4525 [AI와 미래] 기존 저작물은 AI 학습에 어디까지 활용할 수 있을까? IT동아갤로그로 이동합니다. 11.15 1363 0
4524 [월간자동차] 24년 10월, 신차 등록 두 달 연속 증가…싼타페 판매 1위 IT동아갤로그로 이동합니다. 11.15 138 0
4523 [리뷰] 10G 업링크 지원 네트워크 스위치, 넷기어 GS108MX IT동아갤로그로 이동합니다. 11.14 166 0
4522 데이터 주권 강조하는 소버린 AI, 진정한 의미는? [1] IT동아갤로그로 이동합니다. 11.14 698 0
4521 [스케일업] 스쿨버스 [3] 통학버스 전문 플랫폼 개발자 인터뷰 IT동아갤로그로 이동합니다. 11.14 168 0
4520 [UDC 2024] 다양한 산업을 변화시키는 블록체인의 힘 IT동아갤로그로 이동합니다. 11.14 161 0
4519 로봇과 문화예술의 만남, 브이디컴퍼니x장 줄리앙의 종이세상 IT동아갤로그로 이동합니다. 11.14 317 0
4518 [IT애정남] 갤럭시워치를 아이폰과 연결해서 쓸 수 있나요? IT동아갤로그로 이동합니다. 11.13 4653 0
4517 [신차공개] BMW ‘뉴 4시리즈 그란 쿠페’·로터스 ‘에메야’ 공식 출시 [3] IT동아갤로그로 이동합니다. 11.13 4755 1
4516 [스타트업-ing] 오아시스 스튜디오 “OVP·오닉스·디보틀로 콘텐츠 에코시스템 구축” IT동아갤로그로 이동합니다. 11.13 172 0
4515 [생활 속 IT] 취업 서류, 정부24에서 내려받는 법 IT동아갤로그로 이동합니다. 11.12 206 0
4514 기한 지나면 과태료…운전면허 적성검사 및 갱신 방법 살펴보니 IT동아갤로그로 이동합니다. 11.12 2385 3
4513 [창업도약+경북대] 준컴퍼니 “자동차 구매부터 판매까지 아우르는 모빌리티 통합 플랫폼 꿈꾼다” IT동아갤로그로 이동합니다. 11.12 196 0
4512 [스케일업] 모넷코리아 [2] HDC랩스와 협업 통해 AIoT 기반 부동산 관리 플랫폼 고도화 IT동아갤로그로 이동합니다. 11.12 229 0
4511 [2024 고려대] R2C컴퍼니 “데이터 수요·공급자 만족 이끄는 플랫폼” IT동아갤로그로 이동합니다. 11.12 647 0
4510 갤럭시 스마트폰의 위젯 기능, 제대로 쓰려면? IT동아갤로그로 이동합니다. 11.12 255 1
4509 [AWS 인더스트리 위크 2024] 국내 금융/핀테크 기업에 AWS 솔루션은 이렇게 적용됐다 [1] IT동아갤로그로 이동합니다. 11.11 2038 1
4508 '제조 스타트업 대상으로 소싱디렉팅·제품 제작까지'··· 서울과기대의 실질적 지원 들여다보니 IT동아갤로그로 이동합니다. 11.11 217 0
4507 [AWS 인더스트리 위크 2024] AWS가 실현하고 있는 인공지능 기술의 현재 IT동아갤로그로 이동합니다. 11.11 275 0
뉴스 [포토] 질문에 답하는 김윤석 디시트렌드 18:00
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2