[해외 DS] DARPA, 언어 간 문화적 차이 인식하는 자연어 처리 모델 개발에 전폭적 지원한다

DARPA, 맥락 및 문화적 차이 이해하는 자연어 처리 모델 개발에 전폭적 지원 약속해 최근 발표된 조달 문서에 따르면 개선된 알고리즘은 전략적 용도로 사용될 예정으로 보여 전문가들, 해당 기술이 통역사의 불필요한 위험 감수 예방하고 국력에 큰 도움 될 것으로 예측해

20
pabii research

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (MDSA R&D)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.

사진= AI 비즈니스

최근 미국 국방부는 언어 번역은 물론 사회적 관습과 문화적 배경을 이해할 수 있는 고급 인공 지능 시스템 구축에 총력을 기할 것이라고 선언했습니다.

특히 방위 고등 연구 계획국(이하 DARPA) 관계자 A씨는 “사용자의 사회, 언어 및 집단 친밀도에 따라 적절한 감정・사회・문화적 규범 내에서 적절하게 결과를 출력하는 자연어 처리 기술을 찾고 있다”고 밝혔습니다. DARPA는 미국 국방성의 연구, 개발 부문을 담당하고 있으며 인터넷의 원형인 ARPANET을 개발한 것으로 알려져 있는 기관입니다.

또한 A씨는 “기존 우리가 사용하고 있는 CCU(Computational Cultural Understanding)알고리즘의 기술적 한계는 명확하고, 이보다 더 발전된 인공지능 기술이 필요하다”며, “당국은 기존 자연어 알고리즘의 개선을 위해 과학 및 시스템의 혁신적인 발전에 전폭적인 지원을 할 예정”이라고 말했습니다.

전투에 사용될 자연어 처리 기술

DARPA의 정보 혁신 프로그램 관리자인 William Corvey 박사는 “기존 자연어 처리 알고리즘은 학습된 언어와 다른 문화를 가진 사용자의 프롬프트를 제대로 이해하지 못하는 단점을 가지고 있다”고 전했습니다.

이어 그는 “차세대 자연어 처리 알고리즘은 문장 속에서 사회・문화적 요인을 해석하고, 문체의 미묘한 변화를 감지하는 등의 비언어적 요소를 분석하는 기능이 필수적”이라고 말했습니다.

최근 DARPA가 공개한 조달문서에는 기존 CCU 알고리즘에 대한 자세한 내용이 담겨 있으며, 해당 기술을 제공할 수 있는 기업의 경우 7월 2일까지 신청을 받습니다.

전문가들은 개선된 CCU는 현지 문화에 대한 훈련 데이터가 거의 필요하지 않고, 데이터에 라벨링이 되어 있지 않아도 학습이 되는 모델이 될 것으로 예상하고 있습니다. 또한 맥락에서 레이블이 지정되지 않은 대화의 의미를 유추할 수 있을 것으로 기대하고 있습니다.

아울러 인간의 감정을 이해하고, 의사소통에서 차질이 빚어질 경우 강조 표시를 하고, 타 문화간 실시간 대화를 지원할 것으로 보입니다.

한편 CCU는 결과를 출력하기 위해 청각 및 시각 데이터를 모두 입력값으로 받을 수 있습니다. 따라서 인간 통역사를 대체하거나 보조하는 데 사용될 수 있으며, 이에 DARPA는 군사 훈련 또는 사후 보고로부터 가져온 협상 시나리오에서 해당 기능을 테스트할 계획이라고 전했습니다.

이전에 이러한 시도가 없었던 것은 아닙니다. 기존에 미군용으로 ‘기계 외국어 번역 AI시스템’이 개발된 바 있습니다. 그러나 해당 시스템은 일부 번역 작업은 수행할 수 있었으나 문맥이나 문화를 이해할 수 없어 전략 수행에 있어 여러 차례 큰 차질을 겪었다고 보고되었습니다.

DAPRA는 CCU가 기존 AI 시스템의 단점을 극복하고 이를 전투상황에서 협상에 활용할 수 있을 것으로 보고 있습니다. 예컨대 아프가니스탄 분쟁 지역에서 수 백명의 현지 통역사가 겪었던 위험을 더 이상 반복하지 않아도 된다는 것입니다.

특히 비영리단체 No one Left Behind는 2014년부터 300명 이상의 아프가니스탄 통역사 또는 그 가족이 사망했다고 밝혔습니다.

한편 AI 국방 전문가들은 “자연어 처리 알고리즘의 문화・맥락 이해는 적군의 감정을 동요시켜 사기를 저하시키는 정보 작전에도 매우 요긴하게 사용될 수 있다”며 개선될 CCU에 대한 기대감을 내비쳤습니다.

이러한 모델을 구축하기 위해 DARPA는 연구를 세 가지 기술 영역으로 구분할 것이라고 전했습니다.

(1) 사회・문화 분석

(2) 이문화(Cross-Cultural)간 대화 분석

(3) 모델 개발 및 평가를 위한 데이터 생성

DARPA는 (1), (2)의 경우 참가한 여러 경쟁 회사에 다수 자금을 지원할 것이며, (3)은 단일 기업에만 자금을 지원할 예정이라고 말했습니다.

최종적으로 개발된 시스템은 미공개 연방 연구 센터뿐만 아니라 국립 표준 기술 연구소에서 평가할 것으로 알려졌습니다.

해당 모델은 미국의 군사 행동이 전 세계적으로 확산됨에 따라 다양한 언어와 문화에 적극적으로 활용될 것으로 예상됩니다. 2019년부터 현재까지 미군은 공식적으로 최소 14개 국가에서 전투 중이며, 26개국에서 군사훈련을 추가로 실시하고, 또 65개국에서 대테러 훈련을 실시하고 있습니다.

한편 DARPA 조달 문서는 모델이 처리할 수 있는 모든 언어와 문화를 자세히 명시하지는 않았습니다. 그러나 익명을 요구한 DARPA 관계자는 “알고리즘이 지원하는 언어 및 문화는 지속적으로 업데이트 될 것”이라며 “첫 번째 언어는 중국어가 될 것”이라고 밝혔습니다.


The US military wants to develop advanced artificial intelligence systems that can not only translate other languages, but understand social customs and cultural backgrounds.

The Defense Advanced Research Projects Agency (DARPA) is seeking “natural language processing technologies that recognize, adapt to, and recommend how to operate within the emotional, social, and cultural norms that differ across societies, languages, and group affinities.”

The agency admits that the Computational Cultural Understanding (CCU) program will require advanced artificial intelligence, far more complex than the technology used today.

With this in mind, DARPA said it was “specifically excluding” any evolutionary improvements to the existing state of practice, and would only fund “revolutionary advances in science, devices, or systems.”

Revolutionary science to quell revolutions

“To support users engaged in cross-cultural dialogue, AI-enabled systems need to go beyond providing language translation – they need to leverage deep social and cultural understanding to assist communication,” Dr. William Corvey, a program manager in DARPA’s Information Innovation Office, said when the program was announced earlier this year.

“Moving AI from a tool to a partner in this capacity will require significant advances in our machines’ ability to discover and interpret sociocultural factors, recognize emotions, detect shifts in communication styles, and provide dialogue assistance when miscommunications seem imminent – all in real-time.”

The latest batch of procurement documents provided more details about the CCU program. Potential businesses have until July 2 to apply.

The final outcome of the CCU is expected to be a machine learning model that requires minimal-to-no training data in local culture, and no labeled data. Instead, it is expected to infer the meaning of unlabeled discourse behaviors in context.

It will also be expected to understand and interpret human emotions, highlight when communication failure has occurred, and provide real-time dialogue assistance to cross-cultural interaction.

The system should rely on both audio and visual data to come to its conclusions.

Such a system could be used to replace or augment human interpreters, with DARPA planning to test prototypes against humans in negotiation scenarios drawn from military training resources and/or after-action reporting.

This would replace the existing ‘Machine Foreign Language Translation Systems’ AI model developed for the US military, which can handle basic two-way speech-to-speech machine translation on laptops or smartphones.

Also funded via DARPA, the older system can perform some translation tasks, but cannot understand context or culture, leading to potential miscommunication that could prove deadly.

Ultimately, DARPA suggests the CCU could be used in negotiations instead of humans. The US military uses hundreds of local interpreters in conflict zones, but has something of a track record of leaving them behind. With its withdrawal from Afghanistan, hundreds of interpreters are set to be abandoned.

Since 2014, more than 300 interpreters or their family members were killed because of their affiliation with the United States, non-profit group No One Left Behind found.

The AI-based systems funded by DARPA could also be used for wider covert and shadow warfare efforts.

“Cultural understanding is critical to successful Information Operations, which increasingly involve so-called ‘cognitive-emotional conflict,’ where feelings are targeted, as well as ideas,” procurement documents state.

To build these models, DARPA will split the research into three technical areas:

  • T1 – Sociocultural Analysis;

  • T2 – Cross-Cultural Dialogue Assistance;

  • T3 – and Data Creation for Development and Evaluation.

The first two are expected to be awarded to multiple competing companies, while the third, an effort to collect tens of thousands of documents per language (20 percent annotated and the other 80 percent unlabeled), will go to a single enterprise.

At key milestones, the systems will be evaluated by the National Institute of Standards and Technology, as well as an undisclosed federal research center.

The models are expected to work across different languages and cultures, given the global spread of US military actions. In Afghanistan, for example, the two main languages are Pashto and Dari, but there are more than 40 minor languages, with around 200 dialects. In Iraq, the two main languages are Kurdish and Arabic.

Many other languages and dialects are found in Syria, Yemen, Somalia, Libya, and Niger – all countries the US admitted it was at war with, back in 2018. As of 2019, US troops are officially in combat in at least 14 countries, undertake military exercises in 26 more, and conduct ‘counterterrorism training’ in yet another 65.

The DARPA procurement document does not detail every language and culture the model will be expected to handle, noting that “program language + culture pairs will be announced incrementally.”

It does, however, reveal that the first language and culture pair “will be Chinese (Mandarin).”

Similar Posts