"오픈AI, 유튜브 데이터 무단 사용하지 마라" AI 시장 내 데이터 소유권 분쟁 격화

오픈AI, GPT-4 모델 학습 과정에서 유튜브 데이터 무단 사용?
닐 모한 구글 CEO "유튜브 동영상 무단 사용은 약관 위반"
AI 학습 수요와 데이터 소유권의 충돌, 시장 분쟁 본격화

유튜브 모회사 구글이 오픈AI 측에 경고의 메시지를 보냈다. 유튜브 동영상을 오픈AI의 AI 모델 학습에 활용해서는 안 된다는 강경한 입장을 피력한 것이다. 4일(이하 현지시간) 블룸버그통신에 따르면, 유튜브의 닐 모한 CEO(최고경영자)는 인터뷰를 통해 “오픈AI의 텍스트-비디오 생성형 AI 도구를 훈련시키는 데 유튜브 동영상을 사용하는 것은 플랫폼의 서비스 약관을 위반하는 것”이라고 발언했다. 이후 지난 6일, 실제 오픈AI 측이 AI 학습에 유튜브 콘텐츠를 무단 사용했다는 소식이 전해졌다. ‘데이터 소유권’을 중심으로 한 AI 시장 분쟁이 본격화하는 모양새다.

구글, 오픈AI에 ‘경고’ 보내

구글 측은 오픈AI가 자체 AI 모델 소라(Sora, 오픈AI의 텍스트-비디오 AI 모델)의 학습 과정에서 유튜브 데이터를 무단 활용했을 수 있다는 의구심을 드러냈다. 모한 CEO는 “크리에이터가 열심히 만든 작품을 유튜브에 업로드할 때 기대하는 바가 있다”며 “그중 하나는 서비스 약관이 준수될 것이라는 점”이라고 짚었다. 이어 “(유튜브 내) 영상을 무단으로 내려받는 행위, 영상과 스크립트 데이터를 무단 활용하는 행위 등은 허용되지 않으며, 이는 명백한 서비스 약관 위반”이라고 부연했다.

모한 CEO는 또 “오픈AI가 소라를 개선하기 위해 유튜브 동영상을 사용했는지 여부에 대해 명확히 알 수는 없으나, 만약 활용했다면 유튜브의 서비스 약관을 위반한 것”이라고 지적했다. 구글이 제미나이(GEMINI, 구글의 텍스트·이미지·음성 등을 생성하는 멀티모달 기반 AI 모델)를 훈련하기 전 유튜브 및 제작자의 개별 계약을 준수한다는 점도 강조했다. 현재 구글은 제미나이를 비롯해 이마젠, 루미에르 등의 자체 AI 모델을 보유하고 있다.

한편 오픈AI가 소라의 학습·훈련에 어떤 자료를 사용하고 있는지는 아직 명확히 밝혀지지 않은 상태다. 미라 무라티 오픈AI CTO는 지난 3월 월스트리트저널과의 인터뷰에서 “소라가 유튜브와 페이스북, 인스타그램에서 사용자 제작 동영상을 학습했는지는 확실하지 않다”고 언급한 바 있다. 해당 발언이 업계 내에서 논란이 되자 차후에는 “(소라는) 제휴한 이미지로만 학습했다”고 입장을 번복하기도 했다.

오픈AI의 콘텐츠 무단 사용 정황

구글 측이 오픈AI에 대한 경고를 보낸 직후, 실제 오픈AI 측이 유튜브의 콘텐츠를 AI 학습에 무단 사용했다는 보도가 전해졌다. 6일 뉴욕타임스는 “오픈AI는 2021년부터 AI 훈련에 쓰일 양질의 텍스트 데이터 부족에 직면했다”며 오픈AI가 자사 AI모델인 ‘GPT-4′를 훈련하기 위해 100만 시간 이상의 유튜브 영상을 무단 활용했다고 보도했다. 오픈AI 측이 학습용 데이터 부족 문제를 타개하기 위해 영상에서 자동으로 스크립트를 추출하는 ‘위스퍼(Whisper)’라는 소프트웨어를 개발, 유튜브 영상 스크립트를 AI 학습에 활용했다는 것이다.

뉴욕타임스에 따르면 오픈AI는 위스퍼를 사용해 유튜브 영상에서 말소리를 텍스트로 받아적은 뒤 이를 ‘GPT-4′의 AI 훈련에 사용했다. 이는 명백한 유튜브 규정 위반 행위이지만, 오픈AI 측은 AI 학습이 유튜브 콘텐츠를 활용할 수 있는 ‘정당한 목적’에 해당한다고 판단한 것으로 전해진다. 이에 더해 뉴욕타임스는 유튜브 내부 사정을 잘 아는 구글 직원들을 인용, “(구글 측이) 오픈AI가 유튜브 영상을 사용하고 있다는 사실을 알고 있었지만 막지 않았다”는 주장을 소개했다. 구글이 이해관계를 고려해 오픈AI 측의 약관 위반을 방관했다는 것이다.

구글 직원들은 구글도 유튜브 영상을 자체 AI 개발에 사용하고 있었다고 주장했다. 오픈AI의 유튜브 콘텐츠 무단 사용을 문제삼을 경우, 구글 역시 관련 데이터를 활용하지 못하게 될 수 있다고 판단했다는 것이다. 뉴욕타임스는 구글·오픈AI 외에도 각 빅테크 기업이 온라인상의 콘텐츠를 AI 훈련에 무단 사용하고 있다고 전했다. 일례로 메타의 경우, 자사가 운영하는 페이스북·인스타그램 게시물뿐만 아니라 소설, 에세이 등 각종 저작물을 무단으로 AI훈련에 사용하고 있다는 전언이다.

시장 내 분쟁 격화 우려

이 같은 분쟁의 시발점은 생성형 AI의 본질적인 ‘특성’에 있다. 생성형 AI는 말 그대로 기존 콘텐츠에서 새로운 콘텐츠를 생성하는 모델이다. 이 같은 거대언어모델(LLM)이 제 기능을 하기 위해서는 수백억 개 이상의 매개변수(파라미터)를 갖춰야 하며, 이를 위해 매우 방대한 데이터를 학습해야 한다. 문제는 AI의 대규모 정보분석(AI 학습용 데이터 가공·추출) 과정이 기업·개인 등의 권리를 침해할 수 있다는 점이다.

현재 대다수의 생성형 AI 모델은 인터넷에 광범위하게 퍼져 있는 콘텐츠 등을 학습에 활용하고 있으며, 학습용 데이터의 출처를 명확히 밝히지 않고 있다. 기업의 콘텐츠·데이터 소유권은 물론, 개인의 저작권 등이 AI 학습으로 인해 침해당할 우려가 있다는 의미다. 이에 업계 일각에서는 차후 AI 산업이 발전할수록 LLM 관련 데이터 소유권 분쟁 역시 격화할 것이라는 우려가 흘러나온다.

실제 시장 곳곳에서는 AI의 데이터 무단 사용과 관련한 갈등이 벌어지고 있다. 지난해 스톡 이미지 서비스를 제공하는 기업 게티이미지(Getty Images)가 인공지능 사진 생성 도구 ‘스테이블 디퓨전(Stable Diffusion)’의 개발사 스테이빌리티AI(Stability AI)를 상대로 최대 1조8,000억 달러에 달하는 대규모 손해 배상 소송을 제기한 것이 대표적인 예다. 생성형 AI 모델을 중심으로 시장의 이해관계가 첨예하게 맞부딪히는 가운데, AI 산업은 ‘권리 침해’의 한계를 어떻게 극복할 수 있을까.

[기자수첩] 스타트업 플랫폼 vs 정부 산하 ‘협회’

Senior Analyst Taesun Lee 2023-02-20 11:292023-02-20 IT, Tech Analysis

법률플랫폼인 ‘로톡’ 가입 변호사 9명에게 대한변호사협회(이하 변협)가 최대 300만원의 벌금을 집행한 데 이어 한국공인중개사협회를 법정 단체화하고 공인중개사들이 의무 가입하는 내용을 골자로 한 ‘공인중개사법 개정안’이 국회 계류 중이다. 특히 공인중개사법의 경우 직방, 다방 등의 국내 프롭테크 스타트업의 영업을 사실상 막는 규제가 될 가능성이 높아 ‘직방금지법’이라는 별명이 붙었다. 두 이익단체 모두 스타트업들이 업계의 기존 서비스 방식에 균열을…

비대면 진료 전면 허용에도 플랫폼 업계는 살얼음판, 정책 일관성 필요 목소리↑

Hyeonjung Ahn 2024-03-06 17:212024-03-07 IT

일평균 비대면 진료 1,500건→3,000건 정부 정책 따라 시장 축소-확대 반복 안전 시스템 강화 위한 지원 필요성 대두 전공의들의 의료 현장 이탈에 대응하기 위해 정부가 비대면 진료를 전면 허용하면서 비대면 진료 이용 건수가 2배가량 증가한 것으로 나타났다. 병원급 의료기관보다 의원 이용률이 크게 늘어난 가운데 업계에서는 진료의 정확성을 높이고 관련 서비스의 안정적인 운영을 위한 시스템 구축과 정부…

일론 머스크, “74조원 토해내라” 판결에 불만 “텍사스로 법인 이전하겠다”

Analyst Sunjoo Im 2024-02-16 16:182024-02-16 IT

머스크, SNS 통해 스페이스X 법인 소재지 텍사스로 이전 발표 “테슬라도 법인 등록지 텍사스로 이전할 것” 주주 투표 실시 ‘제2의 실리콘밸리’ 텍사스에 삼성전자, 애플 등 다수 기업 포진 일론 머스크 테슬라 최고경영자(CEO)가 자신이 설립한 우주기업 스페이스X의 법인 소재지를 델라웨어주에서 텍사스주로 옮겼다. 테슬라에서 받기로 한 560억 달러(약 74조원) 스톡옵션 보상 약정이 델라웨어 주 법원에서 무효화되자 회사 이전으로…

애플 인앱결제 수수료 30% 포기한다, 에픽게임즈 소송전서 패배

Analyst Minjoo Kim 2024-01-17 15:452024-01-26 IT

애플 vs 에픽게임즈 반독점 소송전 마무리 앱스토어 인앱결제 강요는 시장 독점적 행위, 외부 결제도 허용해야 수익성에 적신호 켜진 앱마켓, 수익 모델 재확보 시급 세계적인 IT 기업인 애플과 인기 게임 포트나이트 개발사 에픽게임즈 간의 반(反)독점 소송전이 마무리됐다. 미국 대법원이 두 회사가 제기한 상고를 기각해 2심의 판결을 그대로 수용하면서다. 이에 따라 애플은 이번 소송 쟁점 중 하나인…

드라이브 스루에 사람 대신 ‘챗봇’이? 시장 장악하는 AI 챗봇

Analyst Subin Jeon 2023-05-11 09:302023-05-11 IT

최근 시장의 주목을 받고 있는 ‘생성형 인공지능(AI)’이 산업 현장에서 본격적으로 활용되기 시작했다. 미국의 햄버거 체인인 웬디스(Wendy’s)는 고도화된 챗봇 소프트웨어를 활용해 드라이브 스루(drive-through)를 자동화할 예정이다. 보그와 뉴요커를 소유한 글로벌 미디어인 어드밴스 퍼블리케이션의 자회사 콘데 나스트(Conde Nast)는 뉴스 기사 작성에 생성형 AI를 적극 활용하고 있다고 밝히기도 했다. AI 기반 ‘챗봇 서비스’는 국내 시장에도 많은 변화를 불러왔다. 국내…

“됐고, AI 전문가 모셔와” 생성 AI 열풍 속 설 곳 잃은 개발자들

Analyst Subin Jeon 2024-04-16 13:412024-04-16 Tech Analysis, IT

“이전만큼 필요 없다” 개발자 채용 줄이는 테크 기업들AI 발달로 IT 업계 전반에 지각변동 발생, 사람 설 자리 줄었다개발자 대신 ‘AI 역량’ 갖춘 인재에 기업 수요 몰려 AI 열풍 속 정보기술(IT) 직군 종사자들이 입지를 잃어가고 있다. 특히 코로나19 팬데믹 당시 치열한 인력 확보 경쟁 속 우대받던 개발자 직군의 경우, AI 활용도 상승·AI 전문가로의 채용 쏠림 현상 등…