해외 기업들 Data Scientist 공고 샘플 정리

pabii research

국내의 많은 “데이터” (자칭) 기업들이 Data Scientist를 뽑는다고 그러면서,

사실은 개발자 중에 Data Engineer 업무를 하는 사람을 뽑고 있는 경우를 오랫동안 봐 왔다.

 

그간 저 회사들이 그냥 공돌이들한테 Brainwashing을 당해서 개발 = DS 라고 잘못 생각하는거라서,

Data Engineer를 뽑는데, 이름을 Data Scientist라고 달아놓으면 뽑기 좋을 것이라고 생각하는 줄 알았다.

무조건 딥러닝만 쓰면 다 된다고 잘못된 선입견이 돌았던 것, 정부 프로젝트들이 딥러닝 써서 99.9% 맞춰야된다는 “무식한” 조건을 달았던 이유도 있긴 하겠지.

(한국 기업문화의 가장 근본적인 문제는 공무원들의 무지에서 시작한다. 제발 세금 좀 제대로 쓰자…)

 

많은 국내 회사들이 “잘 몰라서” Data Engineering = Data Science 라고 착각하고 있는 것과 별개로,

일부 회사들은 Data Scientist라는 직군을 잘 모르는 상태에서 직원을 뽑아야 하는 중에,

다른 회사 공고를 보고 복붙해서 공고 올리고,

그렇게 코딩 잘 하는 직원 뽑아봤는데 딥러닝 해 봐야 아무런 도움이 되지 않는다는 걸 깨닫고 있더라.

 

그래서, 좀 제대로 된 잡 포스팅을 올려서 정말 필요한 훈련을 받은 인재를 뽑을 수 있도록,

해외 기업들이 올려놓은 공고들을 정리해볼까 한다.

복붙해서 공고 올릴꺼면, 제대로 된 공고를 올리면 어떨가?

 

아래의 모든 데이터는 Angel.co 라는 실리콘 밸리에서 꽤나 유명한 스타트업들의 잡 포스팅 웹페이지에서 본 내용들이다.

Angel.co에서 Data Scientist로 검색을 해 봤다.

(일부러 Recommendation engine 영향을 피하려고 Private mode에서 로그인 안 하고 뽑은 리스트들이다.)

1. 학부출신 경력직 Data Scientist 채용 공고 (B2C 기업)

VSCO 라는 회사의 공고인데, 이미지 처리 쪽에 포커싱된 스타트업이다.

매일매일의 업무로 소개된 내용을 보면,

  • 유저 유입 (Engagement), 재유입(Retention) 관련된 “설명가능한 분석”을 하고, 필요한 마케팅 전략 도출
  • 상품 개발 팀과 조율하에 신상품에 필요한 특징들을 잡아내고 데이터 기반 검증하는 업무
  • 개발팀 (Data Engineering)팀과 협조해서, 정기/특수 보고서의 데이터 퀄리티를 높이는 작업
  • 각 팀 별로 업무 성과를 파악할 수 있는 보고서 제작

이라고 되어 있다.

예전같으면 Data Analyst 라는 명칭으로 뽑았을 포지션으로 보이기는 하는데,

몇몇 부분에서 기본적인 Data Science 지식을 바탕으로한 모델링 작업이 들어가면 몸 값을 높일 수 있는 포지션이다.

 

지원자 요건 (Qualification)을 보면,

  • 통계, 응용수학, CS, 경제학 및 관련 분야의 학사 or 석사
  • 4년 이상의 Consumer internet 직군에서 Data Analyst, Data Scientist 업무 경력
  • SQL로 복잡한 구조의 데이터를 추출하고 R/Python으로 분석한 경험
  • ETL 및 데이터 파이프라인에 대한 이해 (Airflow, SQL, MapReduce)
  • 통계 분석 (가설검증, 회귀분석)에 대한 깊은 이해 & 업무 경험
  • 다른 팀과 업무 조율 능력 및 커뮤니케이션 스킬

이라고 되어 있는데, 정말 정확하게 내가 그리고 있는 Data Analyst -> Data Scientist 들이 갖춰야 하는 업무 능력이다.

 

Data Scientist는 개발자가 아니라, 통계학 훈련이 탄탄하게 된 “연구 능력(?)”을 갖춰야 하니,

매우 상식적인 Qualification으로 보인다.

국내처럼 Hadoop, Spark, PyTorch, Keras 이런 이야기는 없다.

Hadoop, Spark는 개발자들쪽 지식이고, PyTorch, Keras는 GPU를 이용한 연산에 도움을 주는, 그래서 그런 계산을 할 때만 쓰는 코딩 라이브러리다.

위의 업무를 하는데, 약간씩의 지식은 필요할지 모르겠다. 어찌됐건 개발자들이 만든 DB를 활용하고 데이터 작업을 해야하긴 하니까.

ETL 및 데이터 파이프라인에 대한 이해… 라고 적힌 부분이 아마 이런 내용 대부분을 커버할 것 같다.

 

그러나, 저런 지식은 회사와서 1-2달 구르면 알게되는 수준인 반면,

다른 Qualfication은 상당한 기간 동안 고급 Data Scientist가 될 수 있도록

통계학, 경제학, 마케팅 등등의 여러 주제를 총망라하는 폭넓은 지식과 사고방식을 기르는 훈련을 받아야 한다.

2. 학부출신 경력직 Data Scientist 채용 공고 (B2B 기업)

이번엔 Calm이라는 회사 공고인데, 의료 관련 상품을 파는거 같은데, 솔직히 난 잘 모르겠다.

매일매일의 업무로 소개된 내용을 보면,

  • B2B 팀 (아마 세일즈 팀)이 볼 수 있도록 데이터 기반 보고서를 자동화하는 업무
  • B2B 팀의 사내, 외부 보고서 작성 지원 업무
  • 서비스를 떠날 회사들 찾아내는 업무

정도로 요약할 수 있을 것 같은데, 역시 위와 같이 Data Analyst 가 했었을법한 업무인데,

이젠 제대로 된 Data Science 역량을 갖춰야 할 수 있는 업무로 업그레이드가 된 모습이다.

당장 서비스를 떠날 회사들을 찾는게 일종의 대출 업무에서 파산 위험 확률 계산하는 것과 같은 방식인데,

이런 종류의 Extreme case는 단순히 Deep Learning을 돌려서 해결하는 계산이 아니라,

Poisson event를 찾아내는 모델을, 최소한 읽고 이해는 할 수 있어야 한다.

단순히 SQL로 데이터 뽑고 그래프나 그리던 예전의 Data Analyst 역량으로는 “야매로” 밖에 못하는 업무를 해야하는 자리가 됐다.

 

지원자 요건 (Qualification)을 보면,

  • 가설 기반으로 문제를 구체적으로 파악하고 분석하는 능력
  • 확률/통계에 대한 깊은 지식으로 데이터의 노이즈를 제거하고, 필요한 전략을 도출하는 분석적 능력
  • 복잡한 SQL 쿼리를 짤 수 있는 능력
  • Tableau, Mode 같은 데이터 시각화 프로그램 활용 능력
  • Jupyter notebook (Python, R)을 이용한 경험
  • 통계 추정, 머신러닝, 기타 “실험 디자인” 능력

같은 항목들이 나열되어 있다.

위의 업무 소개에서 예상했던대로 확률 통계 기반의 탄탄한 지식을 요구한다는 걸 볼 수가 있는데,

정작 국내 회사들이 엄청나게 좋아하는 “머신러닝”은 그렇게 강조되어 있질 않다.

 

정리하며 – Data Scientist vs. Research Scientist

다른 회사들을 봐도 거의 비슷비슷하게 써 놨다.

N년 이상의 “데이터를 이용해 기업의 문제를 풀어낸 경험”

“SQL”, “Statistics” 같은 용어들이 대부분의 Data Scientist 채용 공고에 들어가 있다.

우리나라처럼 “머신러닝”, “딥러닝”, “인공지능”, “개발경력”, “Hadoop” 이런 단어들이 아예 없는걸 직접 눈으로 볼 수 있을 것이다.

 

개발자를 뽑는게 아니라, 정말 데이터를 이용해서 모델링을 할 사람들, 그 중에서 학부 출신으로 좀 스킬이 부족한 사람을 뽑고 있기 때문이다.

예전 같았으면 Data Analyst로 뽑았던 포지션인데, 이젠 요구 수준이 예전보다 훨씬 더 높아져 있는걸 볼 수 있고,

덕분에 학사 출신이 아니라 석사 이상 출신만 받는 곳들도 많더라.

 

그 외에 요즘들어 석/박 훈련을 제대로 받은 사람을 뽑는 회사들은

Data Scientist라는 표현 대신에 Research Scientist라는 표현도 종종 쓰기도 한다.

(여기에도 머신러닝, 딥러닝, 인공지능, Hadoop 같은 단어는 안 나온다. 아래 스크린 샷 참조)

 

당연히 업무 내용은 회사가 외부에 서비스하는 내용들을 좀 더 복잡한 수학을 이용해서 해결하는 능력을 요구하기 때문에,

학위 과정에서의 훈련도를 높게 보더라.

저 위에 언급한 Calm에서 뽑는 Research Scientist 뽑는 공고인데,

자기네가 하고 있는 의료 분야에 특화된 연구를 한 박사 학위자를 뽑고 있는 걸 볼 수 있다.

제일 마지막 라인에 conduct data analysis and interpret findings 라는 문구가 눈에 띈다.

 

꼭 Angel.co 가 아니더라도 요즘 가끔 영어권의 Data Scientist 공고를 보면,

한국에서 “데싸~ 데싸~” 거리는 사람들이 열광하는 코딩 매니악을 뽑고 있다는 느낌을 전혀 받을 수가 없다.

제대로 수학/통계학을 활용해서 현실의 문제를 풀 수 있는 능력을 따져 뽑아야

제대로 그 인력으로 효과를 볼 수 있다는 걸 이제 다 알고 있는 것이다.

 

국내는 아직도 Data Scientist = Data Engineer 라고 생각하는 경향이 짙던데,

아마 IT학원들이 부트캠프 수준의 코딩 교육 시켜놓고 그런 학생들을 취직시키려다가보니 잘못된 신호효과가 시장에 주어져 있는 것 같다.

좀 잘나가는 스타트업들을 가보면 개발 팀과 데이터 팀을 안 나눠놨더니 싸우더라는 경험치가 쌓인 분들도 생겼더라.

특히 통계학 훈련을 탄탄하게 받은 인력으로 데이터 팀을 구성한 회사들일수록 이런 이야기가 자주 들린다.

우리나라도 너무 늦지 않게 Data Scientist 채용 요건을 제대로 쓰는 회사들이 많이 생겨나면 좋겠다.

Similar Posts