[해외DS] 머신 러닝으로 상어를 구하는 방법

UCSB 소속 과학자들, 연승어업 피해 받는 상어 돕기 위해 머신 러닝 활용 데이터 공백 많았음에도 ML 알고리즘 덕에 추세 추정 성공 AI Business, 참치 산업 영향 최소화하면서 상어 보호하는 더 나은 전략 활용 가능하게 됐다고 평가

2
pabii research

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (MDSA R&D)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.

사진=Unsplash

연승어업(longline Fishing)은 긴 줄 한 가닥에 일정한 간격으로 가짓줄을 달고 가짓줄 끝에 낚싯바늘을 단 어구를 이용해 바다를 말 그대로 쓸어담는 어업 방식입니다. 보통 대양에서 참치를 잡을 때 이용되고, 잡히는 참치의 상태가 좋아 비싸게 팔 수 있다고 합니다. 하지만 여기에는 치명적인 문제가 있습니다. 수많은 바다 생명체들이 함께 희생된다는 건데, 그 지역에 참치만 살고 있을 리는 없으니 당연한 결과입니다. 이렇게 참치를 잡기 위한 연승어업 어구에 다른 생명체가 잡히는 일을 ‘혼획’이라 부릅니다.

해양 생태계 먹이사슬 최상위에 있는 상어는 지금 ‘바람 앞의 등불’입니다. 기후 변화, 오염 그리고 남획으로 개체 수가 상당히 줄어들었는데 연승어업으로 인한 상어 혼획 문제까지 겪고 있기 때문입니다. 상어와 참치는 먹이를 공유하기에 벌어지는 현상인데, 상어는 참치처럼 빠르게 번식할 수 없어서 피해가 굉장히 심각합니다.

AI Business에 따르면 최근 산타바바라 캘리포니아대(UCSB) 소속 과학자들이 머신 러닝으로 상어를 도울 수 있다는 연구 결과를 발표했습니다. 상어 출현률이 높은 해양 지역을 대상으로 위험 분석을 수행하는 머신 러닝 알고리즘을 개발한 것입니다.

참치 어업이 이루어지는 다양한 지역의 데이터를 수집한 연구원들은 해당 지역의 상어 포획 데이터를 해수면 온도 같은 환경 요인이나 식량 공급에 영향을 미치는 요인과 연결했고, 상어의 종류별 시세 같은 경제적 데이터도 분석 대상으로 삼았습니다.

그러나 이런 데이터 중에는 비균일하고 구조화되지 않은 정보도 있었습니다. 구체적으로 ‘공백’이 많은 점이 문제가 됐는데, 어선이 제공하는 어획물 정보가 틀릴 때도 있었기 때문입니다.

머신 러닝 알고리즘이 여기에서 빛을 발했습니다. 부족한 데이터를 가지고도 추세를 뽑아낼 수 있기 때문입니다. 과학자들은 데이터에서 ‘경향’을 식별하고 불완전한 정보에서 결론을 도출할 수 있는 모델을 만들어냈습니다.

구축 과정은 세 단계로 요약됩니다. 1단계는 상어 종이 어떤 지역에서 왔는지 알아내는 단계입니다. 2단계는 그 상어 종이 잡힐 확률을 계산하는 단계, 마지막 3단계는 실제로 잡힌 상어의 수를 확인하는 단계입니다.

과학자들은 여러 의사 결정 트리의 출력값에 가중치를 부여하는 랜덤 포레스트 모델을 사용했습니다. 각각의 의사 결정 트리는 서로 다른 변수를 제시하는데, 모델은 이를 취합한 뒤 투표 과정을 거쳐 최종 예측값을 내놓습니다.

산타바바라 캘리포니아 대학 소속 환경 시장 연구소(Environmental Markets Lab, emLab) 해양 및 어업 프로그램의 공동 주 저자이자 공동 책임자인 Darcy Bradley는 “우리의 목표는 상어가 참치 연승어업 때문에 잡힐 확률이 가장 높은 곳을 찾아내는 것이었습니다”라고 말했습니다.

이 연구 결과는 Frontiers in Marine Science에 발표됐습니다.

AI Business는 이들의 발견 덕에 참치 산업에 미치는 영향을 최소화하면서 위협받는 상어 종을 보호하기 위한 더 나은 전략을 활용할 수 있게 됐다고 평가했습니다.


UCSB researchers create ML-powered shark mapping tool

New research from scientists at the University of California, Santa Barbara found that machine learning can help threatened shark populations from being accidentally caught by longline fishing.

Climate change, pollution and overfishing are jeopardizing sharks. While sharks are at the top of the food chain, they’re often caught in fishing lines used to catch tuna, a species that also preys on the same fish as sharks. Tuna can reproduce much more quickly than sharks. Shark bycatch—a term used for sharks accidentally caught by the fishing lines meant to catch tuna—has a considerable impact on vulnerable shark populations.

The UCSB scientists have developed an ML algorithm that can create a risk analysis of regions in the ocean where sharks are more prone. The data was collected from various regional tuna fisheries, which had nonuniform, unstructured information.

Several databases were used to develop the model. The researchers paired spatial shark catch data with environmental factors like sea-surface temperatures and factors that affect food supply. They included economic data, such as what fishers are paid for the various shark species they catch.

However, there were many gaps in their data. Fishing vessels didn’t always provide accurate accounts of their catches.

The scientists then created a model to identify trends and make conclusions from the imperfect information. The ML algorithms were able to extrapolate trends from the deficient datasets.

The first step was identifying whether a shark species was from the area. Next, the question was figuring out the probability the shark species would be caught. Lastly, the scientists assessed the number of sharks that were actually caught.

The scientists used a random forest model, which weighs the outputs of several decision trees. Each decision tree represents a different variable. The outcome has a vote for the eventual prediction.

“Our goal was to identify where sharks are at the highest risk of being caught by tuna longline fisheries,” explained Darcy Bradley co-lead author and co-director of the Ocean and Fisheries Program at the Environmental Markets Lab (emLab) at the University of California, Santa Barbara.

The results were published in Frontiers in Marine Science.

The findings could allow for better strategies to protect threatened shark species with minimal impact on the tuna industry.

Similar Posts