현직자 데이터 사이언스 직무 경험 공유 스토리
데이터 사이언스
일반적인 흐름
- 스타트업 입사 초반에는 우리 회사 데이터베이스가 이렇게 생겼구나, 쿼리를 이렇게 짜야하는구나 등등 공부하고 실습 하며 시간을 보냄.
- SQL이 익숙해진 뒤에는 기존의 쿼리 유지 보수, 쿼리를 통해 나오는 결과를 사람들이 보고 인사이트를 얻을 수 있게 대시보드 형태로 개발
- 점차 복잡하고 비즈니스적인 고급 분석을 하게됨. 관심 있으면 모델링이나 기술적인 부분도 하게 됨.
: 시작은 쿼리다. 쿼리 공부가 주니어들에게는 중요.
데이터 사이언스 직군 분류
1. 데이터 애널리스트
2. 데이터 엔지니어
3. 머신러닝 엔지니어
데이터 애널리스트
- 주로 분석에 집중
- 비즈니스에 도움이 될 만한 인사이트 추출
- 비즈니스에 대한 이해와 경험도 중요
머신러닝 엔지니어
- 주로 모델링에 집중
- 문제해결을 위한 모형 자체를 잘 만드는 것
모델링 : 문제를 풀기 위한 로직을 만드는 일
데이터 사이언티스트
: 데이터 사이언스 직군 전체를 아우르는 말, 혹은 머신러닝 엔지니어에 가까운 의미로 쓰임
데이터 사이언티스트의 업무
신입사원, 주니어가 할만한 업무
- 루틴한 일
- 분석 및 모델링 프로젝트
루틴한 일
1. 지표관리
- 지표 : 어떤 대상(서비스, 프로덕트, 사람 등)의 성과 평가 기준 ex) 노출수, 클릭률, 전환율
- 분석을 위해 어떤 지표를 추출할지
- 데이터를 적절히 뽑아낼 수 있는 능력 중요
- 주니어 레벨에서는 DB에서 데이터 추출하는 경우가 대부분 : SQL 활용능력이 중요하다
2. 데이터 추출 요청 처리
- 이러이러한 데이터 뽑아주세요
- 대부분의 데이터 요청은 아주 모호함. ex) 이번 달 페이지 접속자 좀 뽑아주세요.
: 이번 달의 기준은? 이번달은 아직 안지났는데 유의미할까? 접속자의 중복은?
- 요청이 꼬리를 무는 경우가 많음. ex) 접속자 중 신규 가입자는? 그 중 3개월 후에도 사용하는 사람들 비율은?
- 요청한 사람의 의도 파악, 궁금해 할 만한
- 단순 데이터 추출 보다는 인사이트를 제시해야 함
- 비슷한 데이터 요청이 반복되는 경우가 많음 : 필요하다면 적극적으로 주기화, 자동화
분석 및 모델링 프로젝트
1. 주제 선정
2. 탐색적 데이터 분석(EDA)
3. 데이터 정제 및 전처리
4. 분석 및 모델링 (학습, 예측, 검증)
5. 시각화 및 분석 보고서 작성
6. 자동화 및 주기화
면접에서도 분석 단계에 맞춰서 체계적으로 말하는 게 좋음
필요한 역량
1. 프로그래밍 능력
- 실무에서는 필요한 정보를 빠르게 찾고, 다른 사람이 짜 놓은 코드를 이해하고 그걸 가져다 쓸 수 있으면 됨
- 자료 구조, 알고리즘, 데이터베이스는 어느정도 잘 알아둘 필요가 있음
- 데이터 분석 뿐만 아니라 웹, 앱 프로그래밍 등 '개발'을 할 수 있으면 많은 도움이 됨.
2. 통계학
- 데이터 사이언스의 기반
- 선형대수, 미적분도 중요
3. 머신러닝
- 인간이 잘 하는 걸 기계가 대체하는 게 트랜드.
- 인간이 잘 하지만 기계에게 시키기는 아직은 어려운 분야 - 발전 가능. 트랜드.
- 각 알고리즘을 필요할 때에 적절히 활용할 수 있는 능력이 중요
- 모든 알고리즘을 전부 자세히 알고 있어야하는 것은 아님
- 이 방법이 언제 쓰이는지, 이 방법 대비 다른 방법은 어떤 장단점이 있는지 공부
- 머신러닝이나 AI쪽으로 넘어가면 확실히 대세는 R보다는 파이썬
얼마나 알고 있나 보다는
앞으로 부족한 부분을 계속 보완하고 공부해 나갈 의지와 흥미가 더 중요..
지금 잘 알아도 계속 발전하는 분야이기에 계속 공부해야함.
새로운 것에 민감해야함
신입이어도 역량만 충분하면 충분히 경쟁력 있음
연차가 쌓이더라도 계속 공부하지 않으면 도태됨. 연차와 경력이 오래되면서 오는 장점이 크지는 않음.
데이터 사이언티스트가 되기 위해
세 가지 역량 쌓기
1. 프로그래밍(Python)
2. 통계학, 수학
3. 머신러닝
역략을 쌓을 수 있는 방법
1. 관련 학과
2. MOOC - Coursera, Udemy
3. 이외에 다양한 강의, 자료, 책 등
금융권에서 데이터사이언티스트를 하고 싶다
금융관련 지식이 중요한가? 자격증 필요한가?
금융과 관련된 지식을 아는 것 보다 데이터 사이언티스트의 역량이 훨씬 더 중요하다. 도메인 지식보다 더 중요하다
이력서, 자소서 쓰기
- 세 가지 역량을 바탕으로 실제(와 유사한) 분석 프로젝트를 해 본 경험이 중요
- 인턴, 캐글 혹은 데이콘(추천), 과제
테스트
1. SQL 테스트
- 테이블 주고 SQL 작성
- 생활코딩, Codecademy
2. 자료구조, 알고리즘에 기반한 간단한 프로그래밍 문제
- 프로그래머스 스쿨, Codility, Oncoder
3. 실제 분석 과제
- 데이터 전처리 과정에서 너무 많은 시간을 소요하지 않도록 주의
면접
- 세 가지 역량에 대한 질문과 경험에 대한 질문 위주
- 인터넷에 '데이터 사이언스 인터뷰 질문 모음집' 검색
채용 공고를 많이 찾아봐라
뭘 준비해야 될지 감이 잡힘. 사람인, 잡코리아, 잡크레딧, 원티드 등
'취업' 카테고리의 다른 글
[2024년 상반기 IBK기업은행 신입행원 채용][디지털] 최종면접 합격 후기 (9) | 2024.06.16 |
---|---|
[2024년 상반기 IBK기업은행 신입행원 채용][디지털] 실기시험 합격 후기 (84) | 2024.06.15 |
[2024년 상반기 IBK기업은행 신입행원 채용][디지털] 필기시험 합격 후기 (46) | 2024.06.15 |