[해외DS] AI가 외계 생명체를 처음으로 발견할까?

외계지적생명체탐사 프로그램 SETI, 외계 문명 보내는 인공 전자기파 신호 찾으려는 노력 Breakthrough Listen 프로젝트로 빅 데이터 문제 생겨, AI로 해결할 수 있을까 UCLA, 일반인 참여 SETI 머신 러닝 알고리즘 훈련 프로젝트 계획하기도

20
pabii research

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (MDSA R&D)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.

웨스트버지니아에 있는 로버트 C. 버드 그린 뱅크 망원경은 외계 문명을 찾는 데 도움이 되는 여러 망원경 중 하나입니다./사진=Jim West/Alamy Stock Ph\oto

웨스트버지니아의 언덕에서 호주 시골의 평지까지, 세계 곳곳에는 드넓은 우주의 소리에 귀를 기울이는 초대형 망원경이 있습니다.

이 망원경들은 ‘외계지적생명체탐사’ 프로그램, 즉 SETI(Search for extraterrestrial intelligence)를 위해 설치됐습니다. SETI는 우주 저 멀리에 ‘존재할지도 모르는’ 발전한 외계 문명을 찾으려는 프로젝트인데, 지구로 들어오는 전자기파 신호 중 의미가 있는 신호, 즉 외계 문명이 보냈으리라 추정되는 신호를 선별·분석하는 방식으로 진행됩니다. 최근에는 머신 러닝(Machine Learning) 덕분에 이 프로젝트에서 분석해야 하는 엄청난 양의 데이터를 좀더 빠르게 선별할 수 있게 됐습니다.

Scientific American은 관련된 연구 중 미국 시간으로 지난 1월 31일 발표된 연구에 주목했습니다. AI는 요즘 과학 분야에 엄청난 영향력을 발휘하고 있는데, 지구 밖 생명체를 찾으려는 움직임에는 어떤 변화가 생겼는지 확인해 보겠습니다.

캘리포니아주 마운틴뷰에 있는 SETI 연구소의 행성 천문학자 Frank Marchis는 Scientific American과의 인터뷰에서 “머신 러닝 기술 덕분에 SETI 연구가 새로운 시대로 접어들고 있다”고 말했습니다.

사실 SETI가 빅 데이터(Big Data) 문제로 골머리를 앓게 된 건 그렇게 오래 되지 않았습니다. 지난 수십 년 동안에는 데이터가 너무 없어서 문제였으니, 연구자들은 정말 당황스러울 겁니다. SETI 프로젝트를 창설한 인물은 미국의 천문학자 Frank Drake입니다. 첫 번째 SETI 연구는 1960년 웨스트버지니아주 Green Bank에서 진행됐는데, 당시 Drake는 망원경을 이용해 별 두 개에서 나온 라디오 전파를 잡아냈습니다. 이후 거의 모든 SETI 연구에서도 소수의 별만을 연구 대상으로 삼았습니다.

하지만 2015년, 엄청난 갑부 Yuri Milner가 등장해 판을 뒤집었습니다. Milner는 캘리포니아 버클리에서 진행된 역사상 최대 규모의 SETI 프로젝트 ‘Breakthrough Listen’에 자금을 댔습니다. ‘Breakthrough Listen’은 무려 백만 개나 되는 별을 연구하는 프로젝트입니다. 연구자들이 찾으려는 것은 ‘꾸준히’ 주파수가 변하는 전파인데, 만약 어떤 별에 외계인이 만든 ‘송신기’가 있다면 그 별이 있는 방향에서는 이런 전파가 발생할 것이라 합니다. 웨스트버지니아, 호주, 남아프리카공화국에 있는 거대한 망원경이 연구에 쓰였습니다.

상상도 못했던 데이터 폭탄!

문제는 휴대폰이나 GPS 등 현대인의 생활로 만들어지는 ‘잡음’인 ‘지구 간섭’입니다. 망원경으로 데이터를 확보할 땐 이런 지구 간섭을 걸러낼 수 없는데, 그 양이 정말 어마어마합니다. 결국 이 데이터에서 외계 문명의 신호를 찾아내려면 ‘사막에서 바늘 찾기’를 해야 하는 겁니다.

SETI 연구소 소속 천문학자 Sofia Sheikh는 Scientific American과의 인터뷰에서 “현재 SETI 신호를 찾는 데 있어 가장 큰 어려움은 데이터를 얻는 것이 아니다”라며 “문제는 인간이나 ‘지구 기술’에서 나온 신호를 우리가 찾고 있는 ‘은하계 어딘가에 존재하는 기술’에서 나온 신호와 구별하는 것이다”라고 말했습니다.

수백만 건에 달하는 관측 데이터를 하나하나 손으로 처리하는 건 실용적이지도 않고, 애초에 말도 안 되는 일입니다. 따라서 데이터를 처리할 땐 보통 천문학자들이 ‘생각하는’ 외계 신호 형태와 동일한 신호를 찾아내는 알고리즘이 이용됩니다. 하지만 이런 알고리즘으로는 천문학자들의 생각과는 좀 다르지만 한번 확인해 볼 만 한 신호를 잡아낼 수 없습니다.

바로 여기에서 머신 러닝이 진가를 드러냅니다. SETI 연구에 쓰이는 머신 러닝 알고리즘은 외계 신호가 아니라 지구 간섭의 특징을 학습합니다. 지구 간섭은 인간이 만들어내는 만큼, 훈련 과정에 쓸 데이터는 충분합니다. 이 알고리즘 덕에 연구자들은 보다 빠르게 SETI 신호를 분석할 수 있게 됐습니다.

잡아내지 못한 신호가 있을까?

버클리 캘리포니아대 소속 SETI 과학자 Dan Werthimer는 머신 러닝 방식이 기존의 범주에 속하지 않아 일반적인 방식으로는 찾지 못했던 ‘후보’ 외계 신호를 잡아내는 데도 뛰어나다고 평가했습니다.

캐나다 토론토대 소속 수학자·물리학자이자 이 논문의 주저자인 Peter Ma도 여기에 동의합니다. Ma는 “ET가 우리에게 무엇을 보낼지 항상 예상할 수는 없다”라고 말한 바 있습니다.

Ma와 동료 연구원들은 Breakthrough Listen 관측 데이터를 분석하기 위해 머신 러닝 알고리즘을 구축했습니다. 분석 대상 데이터는 거의 300만 개였는데(100미터짜리 Robert C. Byrd Green Bank 망원경으로 별 820개에서 나온 신호를 수집했습니다.), 알고리즘을 돌리니 거의 모두 지구 기반 간섭이었습니다. 이후 Ma는 20,000개 이상의 신호를 일일이 분석해서 ‘흥미로운 후보’ 8개를 선정했습니다.

여기까진 참 좋았는데, 사실 이 분석에서 얻은 건 없습니다. 연구팀은 후보 신호를 다시 들어 보니 신호 8개가 모조리 사라졌다고 밝혔습니다.

그렇다고 이 연구가 헛수고였던 건 아닙니다. 머신 러닝을 활용한 새로운 연구 방식이 훌륭한 건 변하지 않으니, 분석하는 데이터만 바꾸면 되는 문제입니다. Breakthrough Listen은 지난 12월부터 남아프리카에 있는 ‘MeerKAT 어레이(Array)’로 데이터를 수집하고 있는데, MeerKAT 어레이는 전파 망원경 무려 64개로 구성돼 있습니다. 당연히 데이터의 양이 엄청나기 때문에 이번 연구에 활용된 머신 러닝 알고리즘이 큰 도움이 될 겁니다. 또 Ma는 보관 중인 SETI 데이터도 머신 러닝 알고리즘으로 다시 분석할 수 있다며, 전에 못 찾은 신호가 있을지도 모른다고 덧붙였습니다.

일반인도 SETI 연구에 참여한다고?

머신 러닝은 곧 시작될 다른 SETI 프로젝트에서도 큰 역할을 할 전망입니다. 로스앤젤레스 UCLA(캘리포니아대) 소속 천문학자들은 2월 14일부터 일종의 ‘지역 사회 과학 프로젝트’를 진행할 예정입니다. 프로젝트의 목표는 Green Bank의 SETI 데이터를 분석하기 위한 머신 러닝 알고리즘을 만드는 것인데, 일반인 자원 봉사자가 참여합니다. 봉사자들은 무선 신호 이미지를 찾아내서 잠재적인 지구 간섭 유형으로 분류하게 됩니다.

AI는 SETI 프로젝트의 다른 과정에도 도움이 됩니다. 중국에는 500미터에 달하는 세계 최대 규모 단일 접시 망원경인 FAST 전파 망원경이 있는데, 이걸 이용해 데이터를 수집하는 SETI 프로젝트가 있습니다. 앞서 머신 러닝 방식을 칭찬했다고 언급했던 캘리포니아대 소속 과학자 Werthimer는 현재 동료들과 함께 머신 러닝 방식을 이용해 이 프로젝트에서 관찰할 별의 순위를 정하고 있습니다.

그렇지만 UCLA 소속 천문학자인 Jean-Luc Margot은 ​​SETI 데이터 분석에 고전적 접근 방식과 머신 러닝 접근 방식이 함께 이용될 것이라는 견해를 밝혔습니다. Margot은 고전적인 알고리즘은 여전히 ​​후보 신호를 선택하는 데 탁월하고, 머신 러닝은 “만병 통치약”이 아니라고 말했습니다.


SETI, the search for extraterrestrial intelligence, is deploying machine-learning algorithms that filter out Earthly interference and spot signals humans might miss

From the hills of West Virginia to the flats of rural Australia, some of the world’s largest telescopes are listening for signals from distant alien civilizations. The search for extraterrestrial intelligence, known as SETI, is an effort to find artificial-looking electromagnetic-radiation signals that might have come from a technologically advanced civilization in a far-away solar system. A study published today describes one of several efforts to use machine learning, a subset of artificial intelligence (AI), to help astronomers sift quickly through the reams of data such surveys yield. As AI reshapes many scientific fields, what promise does it hold for the search for life beyond Earth?

“It is a new era for SETI research that is opening up thanks to machine-learning technology,” says Franck Marchis, a planetary astronomer at the SETI Institute in Mountain View, California.

The problem of big data is relatively new for SETI. For decades, the field was constrained by having hardly any data at all. Astronomer Frank Drake pioneered SETI in 1960, when he pointed a telescope in Green Bank, West Virginia, towards two stars and listened for radio transmissions. Most of the SETI searches that followed were also limited to a small number of stars.

But in 2015, billionaire Yuri Milner funded the biggest SETI programme ever, in Berkeley, California: the Breakthrough Listen project to search one million stars for signs of intelligent life. Using telescopes in West Virginia, Australia and South Africa, the project looks for radio emissions that come from the direction of a star and that change steadily in frequency, as would happen if an alien transmitter were on a planet moving with respect to Earth.

DATA BLIZZARD

The trouble is that these searches yield a blizzard of data — including false positives produced by Earthly interference from mobile phones, GPS and other aspects of modern life.

“The biggest challenge for us in looking for SETI signals is not at this point getting the data,” says Sofia Sheikh, an astronomer at the SETI Institute. “The difficult part is differentiating signals from human or Earth technology from the kind of signals we’d be looking for from technology somewhere else out in the Galaxy.”

Going through millions of observations manually isn’t practical. A common alternative approach is to use algorithms that look for signals matching what astronomers think alien beacons could look like. But those algorithms can overlook potentially interesting signals that are slightly different from what astronomers are expecting.

Enter machine learning. Machine-learning algorithms are trained on large amounts of data and can learn to recognize features that are characteristic of Earthly interference, making them very good at filtering out the noise.

OVERLOOKED SIGNALS

Machine learning is also good at picking up candidate extraterrestrial signals that don’t fall into conventional categories and so might have been missed by earlier methods, says Dan Werthimer, a SETI scientist at the University of California, Berkeley.

Peter Ma, a mathematician and physicist at the University of Toronto, Canada, and lead author of today’s paper, agrees. “We can’t always be anticipating what ET might send to us,” he says.

Ma and his colleagues sifted through Breakthrough Listen observations of 820 stars, made using the 100-metre Robert C. Byrd Green Bank Telescope. They built machine-learning software to analyse the data; this netted nearly three million signals of interest but discarded most as Earth-based interference. Ma then manually reviewed more than 20,000 signals and narrowed them down to 8 intriguing candidates.

The search ultimately came up empty — all eight signals disappeared when the team listened again. But the methods could be used on other data, such as a flood of observations from the MeerKAT array of 64 radio telescopes in South Africa, which Breakthrough Listen began using in December. The machine-learning algorithms could also be used on archived SETI data, says Ma, to seek signals that might previously have been overlooked.

CITIZEN SETI

Machine learning is also at the heart of a separate SETI effort that will launch next month. On 14 February, astronomers at the University of California, Los Angeles (UCLA), will launch a community-science project in which volunteers from the public will sort through images of radio signals and classify them as potential types of interference, to train a machine-learning algorithm to search SETI data from Green Bank.

And AI can help with other stages of the SETI process. Werthimer and his colleagues have used machine learning to come up with a ranking of stars to be observed in an ongoing SETI project that uses the world’s largest single-dish telescope, the 500-metre FAST radio telescope in China.

Still, SETI will probably continue to use a mixture of classical and machine-learning approaches to sort through data, says Jean-Luc Margot, an astronomer at UCLA. Classical algorithms remain excellent at picking up candidate signals, and machine learning is “not a panacea”, he says.

Similar Posts