[해외 DS] 편리한 인공지능 비서, Auto-GPT

최근 공개된 Auto-GPT, 사람이 인터넷에서 할 수 있는 업무 효과적으로 보조할 수 있어 그러나 일각에서는 아직 Auto-GPT가 복잡한 현실 비즈니스에서 활용되기에는 아직 어렵다고 지적 Auto-GPT 사용법 간단해 많은 유저들의 관심을 받을 것으로 예상돼

pabii research

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (MDSA R&D)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.

사진=Getty Images

최근 온라인 개발자 커뮤니티는 자체적으로 코드를 작성하고 실행하는 기능을 탑재한 Auto-GPT로 인해 떠들석한 분위기입니다. 작업자는 AI가 해야할 작업을 설정하고 이를 실행하기만 하면 됩니다.

Auto-GPT는 스스로 디버깅을 수행하여 오류 코드를 수정할 수 있습니다. Auto-GPT는 지난 4월 13일  트위터에서 가장 뜨거웠던 주제기도 했습니다.

전 tesla의 AI 책임자 안드레이 카르파티(Andrej Karpathy)는 트위터에 “Auto-GPT가 차세대 엔지니어링의 개척자”라고 게재한 바 있습니다.

Autonomous GPT의 줄임말인 Auto-GPT는 OpenAI의 최신 대규모 언어 모델(LLM)의 GPT-4를 기반으로 구축된 오픈 소스 프로젝트입니다. Auto-GPT의 Github 설명서에 따르면 LLM 모델의 출력값을 연결하여 개발자가 설정한 목표를 자율적으로 달성한다고 합니다.

Auto-GPT는 피자 주문, 여행 계획, 항공편 예약, 소셜 미디어 글 게재와 같이 사람이 인터넷에서 할 수 있는 일을 대신 할 수 있는 것으로 알려졌습니다.

한편 개발사 OpenAI는 “Auto-GPT는 아직 실험단계에 있으며 완성된 응용 프로그램이 아니다”라며 “복잡한 실제 비즈니스 상황에서 해당 알고리즘이 제대로 작동할지는 미지수”라고 밝혔습니다. 또한 OpenAI는 “대규모 언어 모델 특성 상 토큰 사용량이 많기 때문에 해당 모델을 실행하는 측면에서 계산비용을 상당히 비싸게 지불해야한다”고 덧붙였습니다.

Auto-GPT 사용법

AutoGPT를 실행하려면 파이썬 3.8 이상이 필요합니다. 또한 OpenAI의 Pinecome 각각에 대한 API가 필요합니다. 만약 텍스트 음성 변환 기능을 해당 알고리즘에 추가하려면 Eleven Labs의 API가 필요합니다. 한편 Stable Diffusion을 사용하려면 HuggingFace의 API가 필요합니다.

Auto-GPT 관련 코드는 Github에서 다운로드 받아 MIT 라이선스에 따라 사용할 수 있습니다. 즉, 유저가 오픈 소스에 MIT 라이선스 원본을 보관하는 한 필요에 따라 코드를 변경하거나 수정할 수 있습니다.

Auto-GPT를 처음 시작할 때 이름과 역할을 설정해야 합니다. 이름은 임의대로 정할 수 있으며 역할에 따라 해당 알고리즘이 수행할 작업이 결정됩니다. 예컨대 역할 설정에 따라 강아지 사진을 Twitter에 자동으로 게시하는 AI를 만들 수 있습니다. 만약 아무것도 입력하지 않으면 기본값이 설정됩니다.

사진=AI 비즈니스

역할을 설정한 이후 Auto-GPT가 어떤 작업을 완료할 것인지에 대한 목표를 설정해야 합니다. 예를 들어 “1단계로 구글로 이동해서 강아지 이미지를 찾아줘’와 같이 설정할 수 있습니다. 목표 달성 후 종료하라고 봇에게 지시하면 해당 알고리즘이 자동으로 종료됩니다.

사진=AI 비즈니스

목표를 설정한 후 알고리즘은 자신의 역할을 점검합니다. 또한 실행 과정에서 만약 오류가 발생했다면 피드백을 스스로 생성해 작업을 효율적으로 수행할 수 있는 방법을 지속적으로 모색합니다.

사진=AI 비즈니스

모델의 피드백 생성을 허용하기 위해 ‘Y’를 누르면 위 프로세스가 시작됩니다. 그러나 Auto-GPT 설명서는 봇이 지속적으로 오류를 일으킨다면 작업을 계속 실행하지 못하도록 하고 종료하는 것을 권장하고 있습니다.


The online developer community is abuzz about an experimental AI assistant that can write its own code and execute it autonomously. Just set up the task and let it run.

Auto-GPT, created by an ad hoc team of developers, can even fix itself by doing such things as self-debugging. The bot was the top trending topic on Twitter yesterday. Earlier this month, it topped the charts on GitHub.

Andrej Karpathy, Tesla’s former AI chief who is now at OpenAI, tweeted that Auto-GPT is the “next frontier of prompt engineering.”

Short for Autonomous GPT, Auto-GPT is an open source project that is built off OpenAI’s GPT-4, the latest and largest language model from the maker of ChatGPT. Auto-GPT “chains together LLM ‘thoughts,’ to autonomously achieve whatever goal you set,” according to its GitHub description.

Auto-GPT can potentially do many things humans can do on the internet, like order pizza, planning trips or booking flights. It can also post on social media by itself: The bot created the IndiepreneurGPT account on Twitter and automatically tweets from it.

Auto-GPT is just an experiment, however, and is “not a polished application or product,” according to its makers. They also said it “may not perform well in complex, real-world business scenarios” although if it does, the team encourages developers to share their results. And Auto-GPT can be “quite expensive” to run due to large token usage, they cautioned.

How to run Auto-GPT

To run Auto-GPT, you need Python 3.8 or later, as well as an API key for both OpenAI and Pinecone. If you want to run text-to-speech, you will need the API key from Eleven Labs. If you want image generation as well, Auto-GPT uses DALL-E. To use Stable Diffusion, a HuggingFace API key is required.

The code for Auto-GPT can be found on GitHub and is available under an MIT license, meaning as long as users keep the original copy of the MIT license in their distribution they can make changes or modifications to the code to suit their needs.

When booting up Auto-GPT, you need to give it a name and a role. The name can be anything and the role determines what you want the application to do. For example, you can create an AI designed to autonomously post pictures of dogs to Twitter. Entering nothing will load the default setting.

Once your name and role are set up, you need to set up goals – how you want Auto-GPT to complete its task. For example, ‘Step one, go to Google Search to find images of dogs.’ Once your list of tasks is complete, you can tell the bot to shut down and it should automatically do so.

After setting your goals, the AI will generate a confirmation of its role, reasoning for doing the task and how it is going to execute it – as well as a criticism of how it can perform its task more efficiently.

To confirm the model’s reasoning, press ‘Y’ and the process is complete. Auto-GPT should now complete the actions laid out for it automatically. However, the documentation for the bot discourages users from running tasks continuously and encourages a shut down upon completion.

Similar Posts