[해외 DS] 생성 AI가 업계 전반에 끼칠 영향

Stable diffusion부터 ChatGPT까지.. 미국 전반에 영향을 끼치는 생성 AI 현재 생성 AI가 영향을 미치는 분야와, 영향을 미치지 않는 분야는 어디인가 해당 기술이 가지고 있는 위험 및 기술적 사항 또한 충분히 고려해야

pabii research

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (MDSA R&D)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.

사진= Getty Images/AI 비즈니스

해당 기사는 MIT에서 팀을 이끌고 최초의 오픈 소스 ML 모델 관리 시스템인 ModelDB구축한  Verta설립자 겸 CEO인 Manasi Vartak의견임을 밝힙니다.

생성 AI는 수 년 전부터 존재해왔지만(2014년에는Generative Adversarial Networks), 최근  OpenAI와 같은 기업에서 대규모 자연어 데이터로 훈련된 생성 AI모델을 배포하면서 전 세계의 이목을 끌기 시작했습니다. 작년 말 텍스트에서 이미지를 생성하는 Stable Diffusion, 다양한 주제에 대해 사람 수준의 대화가 가능한 ChatGPT와 같은 생성 AI는 무엇보다 유저 친화적이고, 여러 분야에서 강력한 성능을 보여주고 있습니다.

생성형 AI 기술을 활용한 서비스에 대한 관심이 커지고, 새로운 응용 프로그램이 등장하고 있는 가운데, 생성 AI가 미국 기업 전체에 어떤 영향을 미치고 있을까요?

현재 생성 AI 적용되고 있는 분야

현재 생성형 AI는 텍스트, 이미지, 비디오, 음악 관련 컨텐츠 기반 작업의 효율성을 제고하는데 아래와 같은 역할을 하고 있습니다.

(1) 작가와 아티스트는 새로운 작품을 더 빨리 제작할 수 있습니다.

(2) 마케팅 담당자는 몇 가지 프롬프트를 통해 즉시 이메일 및 자료 초안을 작성할 수 있습니다.

(3) 소프트웨어 팀은 코드를 더 빠르게 생성할 수 있습니다.

(4) 법률 실무자는 상세한 계약 문구를 신속하게 작성할 수 있습니다.

Grammarly 및 Adobe와 같은 컨텐츠 제작자를 지원하는 서비스를 제공하는 기업은 이미 생성 AI를 제품에 통합하는 방법을 파악하고 있습니다. 한편 Runway 및 Jasper와 같은 AI기반 스타트업들은 창의적 업무 보조를 위해 인공지능을 더욱 유저친화적으로 활용할 수 있도록 하는 새로운 돌파구를 찾고 있습니다.

이러한 컨텐츠 기반 업무에 대한 활용 외에도 다양한 기업이 생성 AI를 활용할 수 있는 아래와 같은 구체적인 방법을 찾고 있습니다.

(1) 고객 서비스를 제공하는 기업은 현재 채팅 로그를 공통 주제로 군집화한 다음 응답을 자동화하는 기존 챗봇을 개선하고 있습니다.

(2) 데이터 과학 팀은 ML 모델을 훈련하는 데 사용할 ‘합성’ 데이터를 만들고 있습니다. 이는 실제 데이터를 얻기 어렵거나 개인 정보 보호 문제를 일으킬 수 있는 경우에 특히 유용합니다.

(3) 제약 회사는 테스트를 위한 새로운 신약 후보를 식별하는 과정의 시간을 단축하기 위해 생성 AI로 방대한 수의 새로운 화합물을 만들고 있습니다.

생성 AI현재 위험

그러나 생성 AI를 활용하는 기업은 반드시 생성 AI 고유의 위험을 고려해야합니다.

열악한 컨텐츠 품질 생성 AI는 컨텐츠를 생성하는 것 자체는 훌륭한 성능을 보이지만, 좋은 컨텐츠와 나쁜 컨텐츠를 구별하는 것은 불가능합니다. 즉, 생성 AI의 출력값에 대한 전적인 신뢰가 어렵기 때문에, 사람의 면밀한 최종 검토가 필요합니다.

설명 가능성의 부재 생성 AI 모델의 작동 방식에 대해 이해하기 위해서는 수학, 통계학에 대한 깊은 이해가 필요하므로 일반적으로 비즈니스 모델이 어떻게 의사 결정을 내리는지,  컨텐츠를 생성하는지 이해하기 어렵습니다.

윤리적 문제 성・인종적으로 편향된 데이터를 학습한 경우의 생성 AI 모델은 그대로 편향되거나 논란의 여지가 있는 컨텐츠를 출력할 가능성이 높습니다.

IP 침해  기존 제작자가 소유한 이미지로 훈련된 모델이 저작권 침해로 해석될 수 있다는 우려 때문에 생성 AI로 만든 작품을 금지하는 스톡 아트 사이트가 늘어나고 있습니다

생성 AI 영향을 주지 않는 분야

오늘날의 전통 데이터 사이언스 및 ML 업무는 분류 및 회귀분석을 기반으로 한 모델이 지배적입니다. 이러한 업무는 본질적으로 생성 AI를 필요로 하지 않기 때문에 가까운 미래 에는 영향을 받지 않을 것입니다. 예컨대 보험업계에서 인수 및 청구 처리를 하는데 사용되는 ML모델에 생성 AI는 필요하지 않습니다. 

IT 리더를 위한 기술적 고려 사항

IT리더는 생성 AI를 활용할 때 다음과 같은 몇 가지 기술적 고려 사항을 염두에 두어야 합니다.

생성 AI 실시간이다 서비스 챗봇을 사용하는 고객은 응답이 즉시 오는 것을 기대합니다. 이를 위해서는 모델에 대한 관리 및 모니터링 관련 적절한 인프라 구축을 통해 챗봇이 효율적인 답변을 추론할 수 있도록 해야합니다.

효율적 자원 관리의 필요성 모델 학습은 막대한 컴퓨팅 자원과 대규모 데이터가 필요합니다. 즉 회사가 내부적으로 자원을 사용하든 클라우드 공급자의 자원을 사용하든 모델 구축에 대한 진입 비용이 매우 가파르다는 것입니다. 이 문제는 스타트업이 관련 리소스를 최소화할 수 있는 응용 기술을 관련 업계에 서비스하여 해결 할 수 있습니다.

프롬프트 엔지니어링 중요성 생성 AI 모델에 입력할 올바른 프롬프트를 이해하여 원하는 출력을 생성하는 ‘프롬프트 엔지니어링’은 기술 초기 수준에 머물고 있습니다. 현재는 원하는 결과의 대략 80% 정도에 도달하는 것이 좋은 출력으로 간주되고 있고, 이를 최종적으로 사람이 보완하고 있습니다. 초기 결과를 95% 이상으로 끌어올리기 위해서 ‘프롬프트 엔지니어링’에 대한 연구가 활발히 이어지고 있습니다.

생성 AI의 사기 및 보안의 취약성 예컨대 사기 보험 청구를 제출하거나 기밀 정보에 접근하기 위해 가짜 이미지 또는 비디오를 생성하여 직원을 사칭할 수 있습니다. 한편 이를 방지하기 위해 실제 사기 사례를 학습하는 사기 탐지 모델을 개발하고 있습니다.

모델 관리 거버넌스는 필수적 생성 AI 모델이 고객 서비스에 활용됨에 따라 기업은 모델이 양질의 결과를 출력할 수 있도록 지속적으로 관리 해야 합니다. 또한 모델이 어떻게 생성되었고, 어떤 평가를 받았으며, 모델 구축 및 사용에 있어 어떤 프로세스를 거쳤는지에 대해 기업 차원에서 완벽하게 이해하고 있어야 합니다.

지금 무엇을 해야하는가                           

그렇다면 생성 AI를 기업에 도입하려는 CEO는 당장 어떻게 준비해야할까요? CEO 입장에서는 아래와 같은 과정을 거쳐볼 수 있습니다.

(1) 사업을 어떻게 확장하고 개선할 계획인지 마케팅 책임자에게 확인

(2) 챗봇을 개선하기 위해 수행되고 있는 작업에 대해 고객 서비스 관리자에게 확인

(3) 제품 관리자가 문서를 어떻게 개선할 계획인지 확인

(4) 엔지니어링 팀이 작업 속도를 높이기 위해 생성 AI 코드 지원을 확인하도록 권장

생성 AI를 핵심 사업에 통합할 기회를 찾고 있는 기업은 해당 기술의 도입 비용이 낮아질 때까지 모델을 경량화 하여 사용하는 것을 고려해볼 수 있습니다.

생성 AI는 계속해서 빠르게 발전하고 있으며, 매일 천문학적인 투자금이 생성 AI 스타트업에 들어가고 있습니다. 이 가운데, 생성 AI기술의 발전 속도를 파악하고 위험에 대해 경계하는 태도가 무엇보다도 필요할 것입니다.


Since late last year, I have been hearing from many executives in tech and other sectors who are fielding queries from their board members about generative AI and how it would impact the business. 

Generative AI has been around for years (and became popular with generative adversarial networks – GANs – in 2014), but more recently we have seen a step change in capabilities as companies like OpenAI have made available massive generative AI models trained on massive datasets. The technology burst into the public consciousness late last year with the wide availability of easy-to-use and powerful tools such as Stable Diffusion, which creates images from text, and ChatGPT, a bot capable of having human-level conversations on a variety of topics. 

Each day, new applications of generative AI continue to surface, creating new experiences, frequently in prose and art generation, ranging from the thoughtful to the provocative to the absurd. But beyond the immediate novelty of generating interesting pictures or essays, what are the practical applications for enterprises?

Current applications of generative AI

First, if your business, or your role in the business, involves any kind of content — text, image, video, music — you probably already know that generative AI changed your world overnight. Generative AI provides a useful starting point for any sort of content-based work:

  • Writers and artists can produce new works more quickly.

  • Marketers can instantly draft emails and collateral with a few prompts.

  • Software teams can generate code faster.

  • Legal practitioners can rapidly draft detailed contract language.

Established companies with tools that support content producers, like Grammarly and Adobe, are already figuring out how to incorporate generative AI into their offerings. Meanwhile, startups with purpose-built tools, like Runway and Jasper, are finding new ways to democratize AI for creative work, allowing users to tap into the power of generative AI’s algorithms for video editing, blog writing and similar tasks.

Beyond these types of creative applications, enterprises are finding specific ways to leverage the technology:

  • Customer service-oriented organizations are clustering their current chat logs into common themes and patterns, and then automating responses or improving existing chatbots.

  • Data science teams are creating ‘synthetic’ data for use in training other ML models, which is especially useful in cases where real data is difficult to obtain or could create privacy issues.

  • Pharmaceutical companies are creating vast numbers of new chemical compounds to accelerate the process of identifying new drug candidates for testing.

Current risks of generative AI

All these applications carry with them certain risks inherent in generative AI that enterprises must consider as they weigh options for incorporating the technology into core processes, especially those that are customer-facing.

  • Poor content quality: Generative AI is great for producing derivative content but terrible (currently, anyway) at distinguishing good content from bad content. This can be a function of the models’ capabilities or a lack of high-quality training data. In any case, the output can range from hallucinatory to patently false, requiring close human review.

  • Lack of explainability: These models can be difficult to interpret and explain, making it challenging for the business to understand how the model is making decisions or generating content — let alone explain the model and its outcomes to regulators or an aggrieved customer.

  • Ethical issues: Similar to the content quality issue, a generative AI model trained on biased data is quite likely to produce biased, misleading or even offensive content as an output. 

  • IP infringement: We have already seen a major stock art site ban works created with generative AI over concerns that models trained on images owned by established creators could be interpreted as copyright infringement.

What will not change

Data science and IT leaders considering how to respond to the generative AI revolution should weigh the above considerations as they think about opportunities to leverage the technology. But they also should consider that little, if any, of the day-to-day ML their teams are doing will change for the foreseeable future as a result of generative AI.

Most pure data science and ML workloads today involve tabular data, with a focus on discriminative models performing classification or regression. Those workloads will not change in the near future because they are not generative in nature. For example, generative AI will not impact the ML that an insurance company is using to accelerate underwriting and claims processing — again, not for the foreseeable future anyway.

Technical considerations for IT leaders

Where opportunities to leverage generative AI do present themselves, IT leaders should bear in mind a few technical considerations:

Generative AI is real-time. A customer using a service chatbot is not going to wait around a day while the model figures out the best response. The answer needs to come instantaneously. This will necessitate very efficient serving inference as a baseline for entry into generative AI, with all the implications for the infrastructure you use to deploy, manage and monitor your models.

The core technology needs to be very powerful. Training alone requires huge computational resources and access to massive datasets. The cost of entry is steep, regardless of whether a company is leveraging its own resources or those of a cloud provider. This challenge may ease over time as computational resources become less costly and as entrepreneurial startups create purpose-built apps that enterprises can adopt off the shelf.

Prompt engineering’ is still as much art as science. ‘Prompt engineering’ — figuring out the right set of prompts to input into a generative AI model so that it produces the desired output — remains an imprecise science at best, given our level of understanding about how these models actually work. At present, getting to, say, 80% of the desired result is considered a good outcome, followed by human interventions to deliver the final output. Getting the initial results to 95% or higher accuracy continues to be very challenging from a technical perspective.

Generative AI could create new vulnerabilities around fraud and security. This could come in the form of fake imagery or video used to submit fraudulent insurance claims or impersonate employees to gain access to confidential information, for example. On the other hand, generative AI may also offer better ways to fight fraud, such as by creating synthetic data based on examples of real fraud to augment training datasets for fraud-detection models.

Model management and governance go from good-to-have to must-have. As generative AI models get used in customer-facing applications, enterprises will need to safeguard against poor quality of results and ensuing legal battles by having iron-clad documentation on how the model was generated (or fine-tuned), what evaluation it underwent, and what governance processes were followed when building and choosing to use the model.

Unlike traditional machine learning, where only regulated industries have had to be concerned with model management and governance, generative AI will rapidly bring to the forefront the need for companies across industries to demonstrate the use of Responsible AI practices. 

What to do now

So where does all this leave the CEO who is fielding queries from her board about generative AI? If your organization’s ML use cases are traditional analytics-oriented classification and regression, tell the board that generative AI is not rewriting your business yet. 

But then ask your direct reports how they plan to leverage currently available generative AI tools:

  • Ask your head of marketing how she plans to expand and improve outbound campaigns.

  • Check in with your customer service leader on what is being done to improve your chatbots.

  • Find out how your product manager plans to improve documentation.

  • Encourage your engineering team to check out generative AI code assistance to speed up their work.

Enterprises looking for opportunities to incorporate generative AI into their core business could consider dabbling with it, at the hackathon level, until the technology becomes more democratized, i.e., less expensive to support. Or consider buying capabilities from startups with purpose-built tools around specific use cases. 

Generative AI continues to advance rapidly, and dozens of generative AI startups are being funded every day. Keep up with the developments and be on the alert for opportunities (and risks) as the technology progresses. But rest assured that, outside the content space, generative AI has not upended your business. Yet.

Similar Posts