Search Results for:

암호화폐? 가짜화폐의 끝

암호화폐? 가짜화폐의 끝

지난 2월 14일, JP Morgan의 CEO인 Jamie Dimon이 블록체인 기반의 코인 JPM Coin을 발행했다. 지난 2015년부터 줄곧 Bitcoin will not survive Bitcoin is going nowhere Bitcoin is a fraud 라는 말을 입에 달고 살았던 투자은행계의 초대형 거물이 코인을 발행했다는 이유를 들어 비트코인이 대박날 것이다, 암호화폐가 곧 세상을 점령한다는 종류의 이야기들이 또 엄청나게 쏟아져 나왔다. 심지어…

데이터 사이언스 학원말고 대학원을 가라

데이터 사이언스 학원말고 대학원을 가라

개발자 채용 중 특정 학원 출신인 분을 여럿 뵈었던 적이 있다. 신입 개발자 지원하는데 포트폴리오가 너무 좋아서 신입치고 높은 희망연봉을 제시해도 면접을 진행했었는데, 그 학원 출신 분들 몇몇을 뵙게 되면서 포트폴리오의 화려함만큼 기초 실력이 탄탄한 분들이 아니라는 사실을 인지하게 되었다. 오랜고민 끝에 결국 채용하게 된 개발자 분은 포트폴리오가 화려하지도 않고, 경력이 긴 분도 아닌, 학부…

빅데이터를 이용한 비지니스 모델

빅데이터를 이용한 비지니스 모델

빅데이터 “Integrated Intelligence”를 이용한 비지니스 모델 Pabii 블로그의 가장 큰 흐름을 2개만 잡으라면 하나는 수학과 통계학같은 기초학문이 탄탄해야 요즘 인공지능이라고 불리는 데이터 사이언스 작업을 이해할 수 있다는 포인트와, 빅데이터란 용량만 많은 데이터가 아니라 많은 사람들의 행동 패턴을 추적할 수 있는 데이터라는 포인트다. 그 중 빅데이터에 대한 관점을 좀 전문 용어를 빌려쓰면 집단지성 (Collective Intelligence)과 통합지성 (Integrated…

데이터 전처리란?

데이터 전처리란?

개발자 면접을 보다보면, 파비의 사업모델은 뭐냐, 기술 역량은 얼마나 뛰어나냐,  비지니스 철학은 뭐냐 같은 종류의 질문을 받는 경우가 있다. (더불어서 돈 많냐, 월급 떼어먹는거 아니냐 등등의 스타트업이 으레 받을법한 부끄러운 질문도 가끔 받는다ㅋㅋ 우리 돈 많다ㅋㅋ) 보안 이슈 때문에 이미 회사 홈피나 다른 블로그 글에 다 공개되어 있는 부분 이상으로 딱히 더 설명해 줄 부분은…

의학계와 데이터 사이언스

의학계와 데이터 사이언스

얼마전 의학 연구직으로 있는 학창 시절 친구를 만났다. 자기네가 데이터 작업을 하고 있는데, 여기에 머신러닝인지 인공지능인지라는걸 쓰면 뭔가 좀 더 획기적인 정보를 찾아낼 수 있냐고 묻더라. 논문을 한 번 읽고, 두 번 읽고, 세 번 읽고, 아무리 생각해봐도 별 대단할게 없는 사회학자들 데이터 리서치하는 수준의 정보들인데, 여기에 머신러닝을 어떻게 써보겠다는건지 잘 이해가 안 되더라. Pabii…

여성차별하는 AI….일까?

여성차별하는 AI….일까?

아마존(Amazon.com)이 인공지능 인력 채용 프로그램을 폐기했다는 신문 기사가 떴다. 짜놓은 알고리즘을 따라가면 여성 지원자들을 안 뽑는 방식으로 결론이 나온단다. (Source: Reuters) 저 프로세스에 대한 기술적인 평가나 도덕적인 판단을 내리기 전에, 일반적인 서류 선별 (Resume screening) 작업을 한번 생각해보자. 대학 졸업반 시절에 B 모 전략컨설팅 회사에서 잠깐 인턴을 했던 적이 있다. 그만 둘 날짜가 며칠 안…

머신러닝, 딥러닝, 블록체인과 NVidia

머신러닝, 딥러닝, 블록체인과 NVidia

미국에 교수로 있는 석/박사시절 친구 하나가 사무실에 놀러왔었다. 무슨 비트코인 어쩌고 하는 걸로 사업하는거 아니냐고 농담하길래, 내 성격 알면서, 사업을 안 했으면 안 했지 내가 그런 사기치겠냐고 웃고 넘어갔었다. 처음 코인 바람이 불었을 때부터 예상했던대로 코인에 대한 (투기적) 수요는 지난 1년간 빠르게 증발했고, 덕분에 “비트코인 가격 예측할 수 있는 인공지능 알고리즘 만드는 가격은 얼마냐?”고 묻는…

타겟 마케팅 – 4.사기 클릭(Fraud Click) 찾아내기

타겟 마케팅 – 4.사기 클릭(Fraud Click) 찾아내기

Telltale이라는 영어단어가 있다. 남기고 간 흔적이 다 이야기해 준다는 뜻을 가진 단어다. 추리소설에서 자주 볼 수 있는 단어다. 그리고 빅데이터에 인공지능을 적용한다…. 는 비지니스에서 자주 등장해야하는 단어이기도 하다. (불행히도 많은 사람들이 “신경망 모델이라는거에 넣으면 그냥 척척 가르쳐주는거 아니야?”에 머물러 있긴 하지만) 비슷한 예시로, 주가 대폭락을 예측한다는 “인공지능” 모델이라는 것도 결국에는 특이하게 움직이는 변수 k개의 특정…

굳이 블록체인이어야 할까?

굳이 블록체인이어야 할까?

몇 달전 어느 대기업 부장님께 회사 사업 모델을 설명 드리는 자리가 있었다.  Pabii 사업 모델에 주어진 도전을 크게 3가지로 구분할 수 있는데, 첫째는 스마트폰의 OS가 막아놓은 일부 정보를 불법적이지 않게 받아오는 개발자의 도전, 둘째는 그 데이터를 개인정보보호법에 저촉되지 않도록 가공처리한 후에도 타게팅 광고가 돌아가는 알고리즘에 대한 도전, 셋째는 우리 앱을 많이 설치하도록 유도하는 도전이다. 그동안…

Blockchain 시리즈 – Smart Contract

Blockchain 시리즈 – Smart Contract

비트코인 가격 (대)폭락으로 코인에 대한 일반 대중의 관심은 많이 시들해졌지만, 여전히 “차세대” 코인이라는 이더리움 (Ethereum) 류의 가상화폐에는 관심이 남아있는 걸 종종 보게 된다. “앞으로 기술이 더 발전하면 나아지지 않을까?” 라는 뒷맛을 남기는 코멘트에는 언제나 이더리움이 등장하더라. 이더리움이 Smart Contract를 상징하는 대표 코인이라는 점을 미뤄볼 때, 슬슬 블록체인 Hype이 한풀 꺾이고, 요즘은 Smart Contract가 대세로 자리잡고…

빅데이터 vs. 스몰데이터

빅데이터 vs. 스몰데이터

언론사 기자 분이 취재 요청이 왔다. 요청 내용 중에 빅데이터 시대가 끝나고 스몰데이터 시대가 온다는 주장에 대한 코멘트를 해달라고 하시더라. 모르는건 모른다고 시원하게 지르고, 전화를 끊으면서 스몰데이터가 뭔지 구글링을 해 봤다. 이미 단순 대용량 데이터가 빅데이터가 아니라는 주장, 개인화 + 동적 데이터가 결합되어서 Multi-pattern을 추적할 수 있는 데이터일 때 “빅데이터”라는 Label을 붙일 수 있다는 주장을…

Data Scientist 면접 질문들

Data Scientist 면접 질문들

오랜만에 WorkingUS.com을 들어가봤다. 미국에서 일하는 한인들의 모임인데, 가끔은 Data Science 관련 분야에 대한 질문 & 답변도 올라오고, 한국 상황이 아니라 미국 상황에 맞는 답변이 많기 때문에 필요하신 분은 참고하시면 좋겠다. 링크의 어느 댓글을 보다가 필자기 2016년에 받았던 여러가지 질문들이 생각나서 한번 정리해본다. 참고로 링크를 보면 느끼게 되겠지만, 한국처럼 코딩을 얼마나 해 봤냐, C언어는 쓸 줄…

타겟 마케팅 – 3. 기업들이 DSP를 써야하는 이유

타겟 마케팅 – 3. 기업들이 DSP를 써야하는 이유

기업들 세일즈 미팅이나 외부 특강을 가면 꼭 듣는 질문들이 있다. 우리가 가입자들 데이터를 내부적으로 굉장히 많이 갖고 있는데, 우리보다 더 많은 데이터를 갖고 있는가? 우리가 자체 DMP를 만들어서 광고할 유저를 뽑아내는 것보다 타게팅 알고리즘이 더 나은가? 어차피 구매할려고 했던 유저들에게 다시 광고 보여줘놓고 효율 좋다고 우기는건 아닌가? 우리가 모든 앱 이용자들에게 광고 메세지를 보내는 건…