[해외 DS] 인공지능, 이미지 및 텍스트 생성 넘어 목소리 모방부터 음원 제작까지・・・

생성형 AI, 기존 아티스트의 음악 작업물로 새로운 음악 만들어내 유니버셜 뮤직 그룹, 스트리밍 플랫폼의 생성형 AI 활용한 새로운 사업모델 저작권 침해에 해당한다고 비판 인공지능 이제는 이미지 및 텍스트 넘어서 음원 제작, 목소리 모방까지… 모든 분야에 생성형 AI 스며들고 있다

pabii research

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (MDSA R&D)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.

사진=Getty Images

최근 스포티파이(Spotify) 및 애플 뮤직(Apple Music)과 같은 음원 스트리밍 서비스가 인공지능 모델을 학습시키기 위해 저작권이 있는 노래를 사용하는 것으로 저작권 침해 논란이 일고 있습니다.

테일러 스위프트(Tayler Swift), 드레이크(Drake), 더 위켄드(The weekend)등의 아티스트가 소속된 레이블로 유명한 유니버셜 뮤직 그룹(Unviersal Music Group;이하 UMG)은 “일부 스트리밍 플랫폼이 허가 없이 저작권이 있는 음원으로 AI 모델을 훈련하여 새로운 음악을 출시할 경우 법적 조치를 취할 것”이라고 플랫폼에 경고했습니다.

영국 일간 경제신문 파이낸셜 타임즈(Financial Times)는 “스트리밍 서비스 플랫폼이 아티스트의 음원을 사용해 AI를 훈련하는 것은 법적으로 승인되지 않았으며, 이는 해당 아티스트의 작업을 무단으로 복사하는 것으로 저작권 침해에 해당한다”고 밝혔습니다.

이제 생성형 AI는 텍스트, 이미지, 음악 등 장르를 불문하고 모든 분야에 스며들고 있습니다. 음원 스트리밍 플랫폼은 이러한 생성형 AI를 통해 새로운 음악을 만들고 있는 추세입니다.

2020년 OpenAI는 Elvis 및 Katy Perry와 같은 아티스트 스타일로 노래를 생성할 수 있는 Jukebox를 대중에게 선보인 바 있습니다. 또한 올해 1월, Google은 텍스트 프롬프트를 통해 고음질 음원을 출력할 수 있는 AI모델인 MusicLM을 공개했습니다. 예컨대 유저는 “얼터너티브 R&B 스타일의 힙합 샘플 만들어줘”와 같은 프롬프트를 입력하여 해당 음악을 출력할 수 있습니다.

이제는 스트리밍 플랫폼이 그 뒤를 잇고 있습니다. 예컨대 스포티파이와 애플뮤직은 생성형 AI를 활용하여 사업모델을 확장하고 있습니다.

그러나 UMG는 생성형 AI가 만드는 음원이 저작권 침해의 가능성이 농후하다며 비판의 목소리를 높이고 있습니다. 이달 초 유튜브 유명 채널 Grandayy는 고양이에 대한 가사로 에미넴이 랩을 하는 AI 생성 음원을 게재한 바 있습니다. 이에 UMG는 해당 유튜버가 아티스트의 작업물을 무단으로 활용하여 수익을 창출했다는 이유로 유튜브 측에 동영상을 삭제할 것을 요청했습니다.

대통령을 패러디하다

AI는 음성을 모방하는 데에도 사용되고 있습니다.

AI는 새로운 음악을 생성하는 데 사용될 뿐만 아니라 실제 음성을 모방하는 데에도 사용됩니다. 예를 들어 작년 2022년 공개된 스타워즈 시리즈 ‘오비완 케노비’에서 다스 베이더의 목소리를 재현하는데 AI가 이미 시범적으로 사용된 바 있습니다.

한편 대통령 연설이나 기자 회견에서 축적된 방대한 양의 음성 데이터를 통해 유저가 AI를 사용해서 대통령의 목소리를 모방할 수 있습니다. 최근 버락 오바마, 도널드 트럼프, 조 바이든 미국 대통령이 비디오 게임을 하면서 디스코드 통화를 하는 AI 생성 음원이 화제가 된 바 있습니다. 또한 아이스 스파이스(Ice Spice)가 부른 ‘Boy’s a Liar Pt’에 조 바이든 대통령과 버락 오바마 전 대통령의 목소리를 입힌 음원도 화제가 되고 있습니다.

[embedyt] https://www.youtube.com/watch?v=ouqk4MwqO8g[/embedyt]

보수 진영 토크쇼 진행자 벤 샤피로(Ben Shapiro)와 팟캐스터 조 로건(Joe Rogan)의 AI 생성 목소리도 대중들의 주목을 받고 있습니다. AI 생성 목소리 영상들은 재미를 위해 제작된 것이 주를 이루고 있습니다. 해당 영상들은 상당한 인기를 얻고 있으며 위의 아이스 스파이스 패러디는 현재 약 90만회의 주회수를 기록했습니다.


Streaming services like Spotify and Apple Music are being warned against using copyrighted songs to train AI models, with rightsholders threatening legal action.

Major record label Universal Music Group, which represents artists such as Taylor Swift, Drake and The Weeknd, wrote to the platforms warning that it would “not hesitate to take steps to protect our rights and those of our artists.”

UMG said it has become aware that some platforms have been training AI services on copyrighted music without permission. According to the record label, if the likes of Spotify or Apple Music were to launch AI-generated music, they would be forced to take legal action.

“To the extent these services, or their partners, are training their AI models using our members’ music, that use is unauthorized and infringes our members’ rights by making unauthorized copies of our members’ works,” the Financial Times reported the letter as saying.

Generative AI is seeping into every sector, with the music industry proving no different. Streaming platforms could use existing music to generate new music. While not as widespread as text generation tools like ChatGPT, they are on the rise.

ChatGPT makers OpenAI created Jukebox, which can generate songs in the style of artists such as Elvis and Katy Perry. And in January, Google unveiled MusicLM, an AI model that can generate high-fidelity music from text inputs. Users could type a prompt such as “a calming violin melody backed by a distorted guitar riff” and the model will generate a musical output.

Now the music players are getting involved, with Spotify’s senior director of research recently confirming to AI Business that the streaming platform is working on generative AI tools.

UMG has already gone against AI content posted to YouTube. Earlier this month, YouTube Grandayy posted a video of an AI-generated track of Eminem’s voice rapping about cats. UMG got YouTube to remove it when traditionally a rightsholder would strike the video, meaning the person who made the content cannot monetize it. To take down a video, a rightsholder would have to formally ask the platform to remove it.

AI parody gets presidential

AI is not only being used to generate new music but also to mimic actual voices. It has been used, for example, to recreate iconic voices of characters in TV shows like Darth Vader in new Star Wars shows.

One of the most popular memes circulating the internet sees U.S. Presidents Barack Obama, Donald Trump and Joe Biden in a Discord call playing video games.

The vast amount of voice data accrued from the president’s speeches or press conferences means users can use AI tools to generate accurate representations. For example, take a listen to Biden and Obama singing ‘Boy’s a Liar Pt. 2’ by Ice Spice.

Other videos have featured AI-generated voices from conservative talk show host Ben Shapiro and podcaster Joe Rogan. The clips tend to be humorous, and often have the presidents referring to each other by playful monikers − except Trump resurrected his attack ‘Sleepy Joe’ label on Biden from the last presidential election.

The videos are not intended to fool anyone into thinking the trio plays video games together in their spare time but rather to entertain. Their popularity can be seen in the view counts, with the Ice Spice parody above racking up some 850,000 views.

Similar Posts