[해외DS] 유사인지의 세상, 어떻게 살아남아야 하나 (1)

핵무기와 LLM, 인류의 “인위적” 종말에 대한 상상력 부채질해 유비쿼터스 유사인지, 삶의 방식뿐 아니라 인간성 개념도 바꿀 것 스스로 콘텐츠 만드는 LLM, 환각이라는 고질병 어떻게 치료할까

6
pabii research

계몽주의는 인간이 언젠가는 멸종할 수도 있다는 깨달음을 주었습니다. 17세기에는 태양계가 자연의 원리에 따라 돌아가고, 지구에 충돌할지도 모르는 혜성이 존재한다는 사실이 밝혀지면서 충격을 가져다줬죠. 프랑스의 자연사학자 르클레르 뷔퐁(Comte de Buffon)은 대규모 멸종에 대한 지질학적 기록을 해석했습니다. 이후 찰스 다윈(Charles Darwin)은 이러한 멸종이 진화의 원동력이자 인간을 움직이게 하는 힘, 그리고 인간의 운명이라고 보았습니다. 이는 상대적으로 초창기에 발전한 열역학 덕분에 더욱 명확해졌습니다. 결국 이 세상은 사라질 것입니다.

20세기에는 멸종이 “인공적으로” 일어날 수 있다는 개념이 추가됐습니다. 원자핵이 어떤 힘이 있는지, 그것이 어떻게 악용될 수 있는지가 증명됐기 때문입니다. 원자력의 위협은 얼마 지나지 않아 더욱 선명해졌고, 다른 기술 분야에도 영향을 미쳤습니다.

사실 원흉은 컴퓨터입니다. 괜히 컴퓨터 탓을 하는 게 아니냐고요? 하지만 컴퓨터가 핵무기 개발에 중요한 역할을 했음은 부정할 수 없습니다. 어쩌면 누군가는 이런 상황을 내다봤을지도 모릅니다. 합리성을 인류 최고의 성취로 여기는 계몽주의의 믿음과 다윈의 진화론은 그 합리성에 기반해 인류의 희생으로 진화적 진보를 이루는 가능성을 제시했기 때문입니다.

지난 수십 년 동안 학자들은 인공 지능의 위험에 대한 글을 수없이 썼습니다. 비록 인공 지능이라는 용어가 명확하게 나오지는 않았더라도, 인간이나 인간이 만든 제도보다 우월하고 더 빠르게 행동하는 존재가 나온다면 이 세상은 분명히 위험해질 겁니다.

챗GPT에 파이썬 코드 작성을 요청하면 이렇게 친절한 답을 얻을 수 있습니다./사진=챗GPT 캡쳐

이제는 많은 이들이 인간을 뛰어넘는 AI가 나타나 인류를 제거할지도 모른다고 생각합니다. 대형 언어 모델(LLM) 같은 “생성” AI가 거둔 엄청난 성공은 이 상상력을 부채질했습니다. 이 분야는 그야말로 눈부시게 발전하고 있지만, 그 이면에는 해결해야만 하는 문제가 존재합니다. 하지만 생각해 보세요, GPT-4 같은 것들이 정말로 인류를 위협할까요? 이런 프로그램은 패턴에 기반한 예측을 통해 소설이나 시를 쓰고, 코드를 짜고, 이미지나 음악, 영상을 만들어냅니다. 딥페이크 영상처럼 무언가 술수를 쓰는 데 사용될 수는 있겠지만, 이들이 “문명을 통제하는 힘”의 기반이 되거나 “인류를 대체”하는 모습은 상상하기가 어렵습니다. 아, 물론 그렇다고 해서 AI가 가져다주는 변화를 신경 쓰지 않아도 되는 건 아닙니다. 인생의 목표가 생존뿐이던가요? 세상을 멸망시키는 기술만이 세상을 바꾸지는 않습니다.

이제 우리는 인간처럼 대화하고, 언어를 이해하며 인간을 뛰어넘는 데이터 동기화, 패턴 인식 능력을 지닌 컴퓨터 프로그램으로 가득 찬 세상을 맞이하게 됐습니다. 그러면서 떠오른 유비쿼터스 “유사인지(pseudocognition)”는 AI의 발전 속도가 지금보다 느려지거나, 그럴 것 같진 않지만, 아예 중단된다고 할지라도 역사를 바꿔놓을 수 있는 존재가 되었습니다. 삶의 방식뿐 아니라 “인간성”이라는 개념도 변화할 것입니다.

비슷한 사례로는 컴퓨터와 경제를 바꾼 웹 브라우저와 지식에 대한 접근 방식에 혁명을 가져온 인쇄기, 인간이 스스로를 이해하는 방식을 변화시킨 심리 분석 세 가지를 들 수 있습니다.

인터넷 브라우저는 1990년대 초 파일 공유 방법으로 소개됐습니다. 이후 컴퓨터의 활용 방식과 컴퓨터 산업의 총체적인 구조, 그리고 정보의 구성 방식을 재편했죠. 컴퓨터가 네트워크로 연결되자 사람들은 자신이 어디에 있든 브라우저를 통해 응용 프로그램에 자유롭게 접근할 수 있게 됐습니다. 응용 프로그램과 그 응용 프로그램을 활용할 수 있게 만드는 인터페이스를 분리하는 게 가능해졌죠.

브라우저가 가진 힘은 얼마 지나지 않아 만천하에 드러났습니다. 이용자 유치를 위한 브라우저 간의 경쟁이 극심해졌고, 웹 주소와 관련된 거의 모든 기업은 눈먼 돈을 쓸어 담았습니다. 이후 경제가 무너지면서 반발이 생기기는 했지만 앞서 언급한 인터페이스와 애플리케이션의 근본적인 분리는 이어졌습니다. 아마존(Amazon), 메타(Meta; 페이스북) 그리고 알파벳(Alphabet; 구글)은 브라우저를 상품과 정보, 인간을 연결하는 통로로 만들면서 엄청난 성공을 거뒀습니다. 이제 누가 브라우저를 만들었냐보다는 그 브라우저가 플랫폼으로서 어떤 역할을 하느냐가 중요해졌습니다. GPT-4로 돌아가는 챗봇인 오픈AI(OpenAI)의 챗GPT(ChatGPT)가 출시되자, 업계에서는 몇 달 동안 그 유명한 닷컴 붐마저 한 수 접어줄 정도로 엄청난 열풍이 불었습니다. LLM 같은 소프트웨어에 기반한 프로그램은 정말 말도 안 되게 쉽습니다. 이용자는 프롬프트를 입력하고, 뭐가 나오는지 보기만 하면 되죠. 개발자에게도 마찬가지입니다. AI 업계의 동향에 대한 뉴스레터 서비스를 운영하는 영국의 한 기업가에 따르면 이런 프로그램은 “그냥 노트북을 펴서 모델과 상호 작용하는 코드 몇 줄만 쓰면” 만들 수 있습니다.

그 코딩 과정 자체에도 LLM이 점점 더 많은 도움을 줄 수 있습니다. 이 프로그램은 다량의 텍스트뿐 아니라 많은 코드를 훈련받았기에 아주 많은 프로그램의 구성 요소를 포함하고 있죠. 오픈 소스 코딩 커뮤니티인 깃헙(GitHub)의 프로그래머들은 절반에 가까운 코드를 LLM으로 만들고 있다고 합니다. 마이크로소프트(Microsoft)의 최고 기술 책임자(CTO)인 케빈 스캇(Kevin Scott) 역시 이와 같은 예측을 한 적이 있습니다. 결국 코딩은 사람의 언어를 코드로 “번역”하는 과정이기 때문입니다.

브라우저가 소프트웨어 애플리케이션에서 사용자 인터페이스를 분리했다면, LLM은 이 두 집단을 아예 해체할 것입니다. 브라우저가 나왔을 때도 그랬으니 LLM도 충분히 컴퓨터의 사용 방식과 이를 이용하는 비즈니스 모델의 패러다임을 전환할 수 있습니다.

브라우저가 인간이 만들어낸 콘텐츠와 코드에 대한 통로를 만들었다면, LLM은 스스로 콘텐츠를 만들어냅니다. LLM의 가장 큰 문제로 꼽히는 “환각”은 바로 이 과정에서 생성됩니다. 이는 프로그램을 교육하는 데이터 세트의 모순이나, 진실보다는 일관성을 우선하도록 설계된 LLM 자체의 특성에 기인하죠. LLM은 훈련받은 데이터 세트에 “있는 것과 비슷해 보이는” 것을 만듭니다. 즉 LLM의 세상은 훈련받은 텍스트와 이미지로만 이루어져 있습니다.

누구나 쉽게 딥페이크 영상을 만들 수 있게 도와주는 무료 프로그램 “딥페이스랩(DeepFaceLab)/사진=DeepfakeVFX 홈페이지 캡처

이렇게 그럴듯한 거짓말을 내뱉는 경향은 정치인을 비방하는 딥페이크와 조작 영상은 물론이고 누군가의 주문을 받아 가짜 웹사이트, 트위터 봇, 페이스북 페이지, 틱톡 피드를 생성하는 식으로 악용될 수 있습니다. 스탠포드 인터넷 옵저바토리(Stanford Internet Observatory)의 르네 디레스타(Renée DiResta)는 잘못된 정보가 곧 무한히 공급되리라 경고했습니다. 설마 그렇게 되겠냐고요? 글쎄요, 이론적으로는 충분히 가능합니다.

[해외DS] 유사인지의 세상, 어떻게 살아남아야 하나 (2)로 이어집니다.

Similar Posts