[해외DS] AI 이미지 생성기 DALL-E 2 베타 출시

오픈AI, 텍스트 프롬프트 보고 이미지 생성하는 DALL-E 2세대 베타 버전 발표해 무료 크레딧 제공, 소진 시 추가 크레딧 구매해야… 초기 베타 기간에는 115크레딧에 15달러 악용 방지 위해 사실적 얼굴 및 노골적 콘텐츠 업로드 제한하고 이중 모니터링 진행될 예정

20
pabii research

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소(MDSA R&D)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.

사진=오픈AI

지난해 오픈AI가 출시한 DALL-E, 알고 계시나요? 텍스트 프롬프트에서 이미지를 생성하는 기능으로 소셜 미디어에서 큰 인기를 얻은 프로그램이죠. 그런데 최근 이 프로그램의 2세대 베타 버전이 출시됐습니다.

오픈AI는 대기자 명단에 있는 사용자 100만명에게 순차적으로 접근 권한을 부여할 예정이라고 밝혔습니다. 프리미엄(Freemium; 기본 제품 및 서비스는 무료로 제공하지만, 고급 및 특수 기능은 과금하는 비즈니스 모델) 방식으로 서비스되는데, 구체적으로 크레딧이 활용됩니다. 크레딧 한 개로는 원본 프롬프트에서 이미지 4개를 생성하거나 기존의 이미지를 사용하는 편집 혹은 변형 프롬프트에서 이미지 3개를 생성할 수 있습니다.

모든 사용자는 첫 달에는 50개, 그 다음 달부터는 매달 15개의 무료 크레딧을 받을 수 있습니다. 이 크레딧을 소진하면 추가 크레딧을 구매해야 하는데, 초기 베타 단계에서는 15달러로 크레딧 115개를 구매할 수 있다고 합니다. 즉 15달러를 내면 115개의 원본 프롬프트에서 각각 4개씩 총 460개의 이미지를 생성할 수 있다는 뜻입니다.

사용자는 재인쇄, 판매 및 판매할 수 있는 권리를 포함하여 DALL-E 2로 만든 이미지를 상업적으로 이용하는 데 필요한 모든 사용 권한을 갖게 됩니다.

DALL-E 2를 발표하는 자리에서 오픈AI의 한 관계자는 “DALL-E의 접근 장벽을 최대한 낮춰 재정 지원이 필요한 아티스트가 우리 모델로 도움을 받을 수 있기를 바란다”며 “베타 기간 동안 사용자의 다양한 피드백을 받기를 기대한다”고 전했습니다.

[embedyt] https://www.youtube.com/watch?v=qTgPSKKjfVg[/embedyt]

DALL-E 2는 사용자가 입력한 텍스트 프롬프트에 기반해 원본을 합성한 AI 이미지를 생성합니다. 시스템은 이미지의 그림자, 반사 그리고 질감을 고려하면서 해당 요소를 추가하거나 제거할 수도 있습니다.

일례로 유명 패션 잡지 코스모폴리탄(Cosmopolitan)의 편집자 한 명은 최근 DALL-E 2로 잡지의 표지를 만들었습니다. 당시 편집자는 ‘무한한 우주, 신스웨이브 디지털 아트 공간에서 화성에 있는 카메라를 향해 으스대며 걸어가는 여성 우주 비행사를 아래에서 광각 촬영’한 이미지를 요청했다고 합니다. 쉽게 상상이 안 가는 문장인데요, 아래에 해당 표지 사진을 첨부했습니다. 정말 그렇게 보이나요?

사진=코스모폴리탄

DALL-E 2는 단 20초 만에 이미지를 생성했습니다. 코스모폴리탄 편집자가 최종 표지를 만들기 위해 한 일은 텍스트를 추가하는 것뿐이었죠.

DALL-E 2는 원본 이미지를 보고 그 이미지에서 ‘영감을 받은’ 다양한 변형 이미지를 만들 수도 있습니다. 오픈AI는 네덜란드의 유명 화가 요하네스 베르메르의 대표작인 ‘진주 귀걸이를 한 소녀’를 예로 들었는데, DALL-E 2는 원본 이미지의 전체적인 스타일은 유지한 채 피사체의 머리 위치, 옷 색상 또는 표정에 미묘한 변화를 주는 방식으로 몇 가지 변형 이미지를 만들어냈습니다.

사진=오픈AI

한편 DALL-E 2 개발진은 사실적인 얼굴과 노골적인 콘텐츠가 포함된 이미지의 업로드를 금지했습니다. 인상적인 결정인데요, 회사 측은 악의적인 행위자가 AI 시스템을 활용해 딥페이크나 거짓 정보를 생성하는 일을 막기 위해서 이 같은 결정을 내렸다고 밝혔습니다.

오픈AI는 편견을 만들어내는 문제에도 신경을 썼는데요, 예를 들어 DALL-E 2는 인종 혹은 성별이 지정되지 않은 개인에 대한 프롬프트가 제공될 때 “세계 인구의 다양성을 더욱 정확하게 반영”하는 사람들의 이미지를 만들어낸다고 합니다.

또한 오픈AI는 DALL-E 2의 오용을 방지하고자 자동 및 인간 모니터링 시스템을 모두 활용할 계획이라고 덧붙였습니다.


DALL-E 2, the second generation of the AI system that has gone viral on social media for the images it generates from text prompts, is now available in beta.

Developer OpenAI has invited one million users to sign up for its waitlist. DALL-E is available on a freemium basis, with users using credit in exchange for a prompt generation. Each credit can be used to generate four images from an original prompt, or three images from an edit or variation, prompt, which use an existing image.

DALL-E users will earn free credits that refill every month or have the option to buy additional credits. Every user will receive 50 free credits during their first month of use and 15 free credits every subsequent month.

In the initial beta stage, users can purchase 115 DALL-E credits, which equate to around 460 images, for $15.

Users will get full usage rights to commercialize the images they create with DALL-E, including the right to reprint, sell, and merchandise.

“We hope to make DALL·E as accessible as possible. Artists who are in need of financial assistance will be able to apply for subsidized access,” OpenAI said in an announcement. “We are excited to see what people create with DALL·E and look forward to users’ feedback during this beta period.”

DALL-E 2 generates original compositive AI images based on text prompts from the user. The system can add and remove elements while taking shadows, reflections and textures into account.

For example, editors of lifestyle magazine Cosmopolitan recently generated the title’s cover image. The prompt for the cover was a “wide-angle shot from below of a female astronaut with an athletic feminine body walking with swagger toward the camera on Mars in an infinite universe, synthwave digital art.”

It took the AI system just 20 seconds to generate the image. Cosmo staff then added text elements to create the final cover.

DALL-E can also take an image and create different variations of it inspired by the original. Take the below example of Johannes Vermeer’s Girl with a Pearl Earring. The system generated a handful of variations of the famous oil painting, with subtle changes like the subject’s head position, clothing colors or expressions holding true to the original image’s overall style.

A notable decision by DALL-E 2’s developers is the decision to bar uploads that include realistic faces and explicit content. The Microsoft-backed company is concerned that bad actors may seek to use the AI system to generate deepfakes or misinformation.

And to address concerns around biases, the AI now generates images of people that “more accurately reflect the diversity of the world’s population,” for example, when given a prompt about an individual that does not specify race or gender.

OpenAI said it plans to use both automated and human monitoring systems to help guard against misuse of its AI.

Similar Posts