personal

데이터 자격증 후기(ADsP, SQLD, 빅분기)

patrck_jjh 2021. 12. 31. 21:59

 

intro 

1. 동기

 경제학을 전공했고 금융 도메인의 데이터 사이언티스트를 꿈꾸며 역량을 키워나가고 있습니다. 데이터 사이언스 관련 공부를 하며 이왕 공부하는거 이와 관련된 자격증도 같이 따보자는 생각을 했습니다. 물론 취업을 함에 있어서 가산점이 부여되는 케이스도 있기도 하고 데이터 사이언스를 함에 있어서 본격적으로 입문한다는 생각을 가지고 시험에 임했습니다.

 

2. 베이스

 계량경제학(경제원리를 데이터로 검증하고자 하는 과목)과 같은 통계관련 과목들을 그래도 챙겨들은편입니다. 그래서 기본적인 통계 지식과 회귀분석, 시계열 등에 대해서 기초적인 개념들은 파악하고 있었습니다.

 또한 본격적으로 R과 Python을 활용하여 머신러닝 관련된 개념들을 공부하고 코딩해본 기간은 1년정도 되었습니다. SQL은 기초적인 쿼리문들을 배우고 몇번 실행해봤습니다.

 

3. 목표

2021년 8월 말~ 12월 초 까지 빅데이터분석기사 필기, 실기 그리고 ADsP, SQLD 총 4번의 시험에 합격하기

 

 

 

 

 

 

환불 규정은 예외에 해당하지 않는다면 기본적으로 다음과 같습니다.

 

접수기간동안은 100%

시행 5일 전까지 50%

이후부터 환불 불가

 

 

https://www.dataq.or.kr/www/sub/readme/refund.do

 

데이터자격시험

- 직계가족((외)조부모, 부모, 형제, 자매, 배우자, 배우자의 부모, 자녀에 한함) 사망으로 접수마감일 다음날부터 시험시행후 30일까지 환불요청 : 전액 환불 - 본인의 사고 및 질병으로 입원하여

www.dataq.or.kr

 

 

 


 

 

첫번째 SQLD시험은 급한일로 불가피하게 응시하지 못했습니다.

이를 제외하면 다행이도 나머지는 초시에 합격할 수 있었습니다.

 

 

 

<후기 내용 목차>

 

1. 교재

 

2. 수험 후기

 

3. 과목별 후기

 


 

1. ADsP(Advanced Data Analytics Semi-Professional)

1-1. 교재

https://wikibook.co.kr/adsp2021/

 

이지패스 2021 ADsP 데이터분석 준전문가

◎ 빠르고 효율적인 공부를 위한 ADsP 수험서 방대한 데이터 분석 콘텐츠를 ADsP 출제 경향에 맞게 컴팩트하게 정리하여 시간에 쫓기는 수험생들에게 최대한 공부 효율을 높일 수 있도록 구성했습

wikibook.co.kr

위키북스의 교재 한권을 활용했습니다. 사실 이 책 한권으로 ADsP시험의 모든 문제들이 커버가 되는 것은 아니지만 합격선인 60점은 충분히 커버 가능하다고 생각합니다. 

 

 

1-2. 수험 후기

 2주 정도 전 부터 책을 틈틈히 봤습니다. 일주일 정도는 목차와 책의 전체적인 구조에 대해 틈틈히 읽었습니다. 그리고 그 다음부터 본격적으로 개념에 포커스 맞춰서 2회독하고, 이틀 남기고 과목별 문제, 모의고사 등 문제들에 집중했습니다. R을 복습할 겸 코드도 돌려보려고 했으나 사실 코드가 나오는 부분도 암기로 풀수 있는 수준이라 그렇게까지 하지는 않았습니다.

 

 

1-3. 과목별 후기

데이터 이해 과목은 데이터를 다루는 직무를 함에 있어서 기초적으로 알아야할 교양과 관련된 개념을 담고있어 흥미로우면서도 가볍게 지나갈 수 있었습니다.

 

데이터 분석 기획은 닭가슴살을 먹는것과 같이 퍽퍽한 느낌의 과목입니다. 암기해야하는 부분이 적지 않음과 동시에 유기적으로 연결해서 머리 속에 넣기가 쉽지 않았습니다. 그래도 루틴이라고 할만한 부분이 있기 때문에 시험에 나오는 문제 기준으로 반복하면 과락을 충분히 면할 수 있을 것이라고 생각합니다.

 

데이터 분석이 메인 과목입니다. 크게 전통적인 통계분석 기법과 머신러닝 기법으로 나눌 수 있습니다. 데이터 사이언스를 하고자 한다면 기초적으로 알아야 할 개념들 입니다.

 

 

 

 

 


 

2. SQLD(SQL Developer)

 

턱걸이 합격이라는 관점에서 오차가 0에 달하는 성적

 

 

2-1. 교재

http://www.yes24.com/Product/Goods/33524934

 

 SQLD를 준비한다면 꼭 봐야한다는 노랭이에 올인했습니다. 실제로 책과 동일하게 출제된 문제들이 여럿 있었고 책에서 나오는 문제와 개념들을 잘 숙지한다면 합격 가능하다고 생각합니다.

 

 

2-2. 수험 후기

 SQLD도 2주 정도 기간을 잡고 처음 일주일은 DBian에서 나온 SQLD교재를 봤습니다. 그런데 생각보다 처음 보기에는 어려움을 느꼈고 다시 검색해보니 노랭이만 봐도 합격선에 문제없다는 의견이 많아서 나머지 일주일은 노랭이만 보기로 결심했습니다. 이상하게 SQLD를 볼 때면 바쁜일이 생겨서 시험 공부를 제대로 못하다가 하루 전날에 밤새워서 2회독 했습니다. 그러다 보니 불안한 마음으로 시험을 치렀고 합격이 될지 의심되는 정도의 느낌으로 시험을 마무리 했습니다.

 

 

2-3. 과목별 후기

 데이터 모델링의 이해는 암기과목으로 노랭이의 문제와 옆에 딸린 개념들만 숙지해도 별문제 없이 넘어갈 수 있습니다. 주관식을 대비해서 구체적으로 단어를 떠올릴 수 있을 정도로 개념을 숙지한다면 더 좋을것 같습니다

 

 SQL 기본 및 활용은 본격적으로 쿼리문을 이해하고 적용하는 부분입니다. 처음부터 긴 쿼리문들을 이해하기는 어려웠기 때문에 1분정도 노력해보고 이해안되면 다음 문제로 넘어가는 식으로 익혔습니다. 차근차근 쉬운개념부터 쌓아나가면 긴 쿼리문도 자연스럽게 이해될 것이라고 생각합니다. 특기할만한 부분으로 SQL 최적화 기본 원리라는 파트도 있는데 이부분은 잘 출제가 안되는 것으로 알고 있고 제가 합격했던 43회에서도 출제되지 않았습니다.

 

 데이터 사이언스를 한다면 SQL 쿼리문을 통해 데이터를 자유자재로 가져오는 것이 중요하다고 합니다. 가능하면 SQL쿼리문을 직접 작성하며 개념들을 이해하고 체화한다면 더 좋을 것 같습니다. 

 

 

 

 


 

3. 빅데이터 분석기사 필기

 

 

 

3-1. 교재

https://wikibook.co.kr/bigdata2021/

 

위키북스의 빅데이터 분석기사 필기를 활용했습니다. ADsP와 마찬가지로 책 한권으로 모든 문제가 커버 불가능하지만 합격선에 도달하는 건 문제없다고 봅니다.

 

 

 

3-2. 수험 후기

 내용을 보니 ADsP와 호환되는 내용들이 상당히 많았습니다. 다만 전체적으로 과목별로 살이 더 붙어있는 편이고 결과 해석이라는 파트도 별도로 있어서 공부할 내용이 더 많았습니다. 그래도 ADsP를 먼저 공부하기도 했고 기존에 익숙했던 내용들도 많았기 때문에 일주일 정도 틈틈히 투자하며 ADsP를 준비했던 것과 비슷한 느낌으로 시험을 치렀습니다. 

 

 

3-3. 과목별 후기

과목1 빅데이터의 이해는 ADsP의 과목1과 과목2를 합쳐놓은 것과 비슷합니다. 여전히 암기하는데 적응이 안되지만 문제를 먼저보고 자주나오는 루틴을 파악하고 머리속에 넣으면 될 것 같습니다.

 

과목2 빅데이터 탐색 과목은 데이터 처리부터 기초적인 통계 기법에 대한 내용입니다.

과목3 빅데이터 모델링 과목은 말그대로 다양한 알고리즘을 통해 모델링을 하는 파트입니다

과목4 빅데이터 결과 해석은 모델의 성능 평가지표와 방식, 해석과 관련된 파트입니다.

 

빅데이터 분석기사는 과목2~과목4가 모두 데이터 사이언스에 있어서 핵심적인 내용입니다. ADsP에 비해서 내용이 방대하고 복잡한 식도 있지만 처음엔 목차위주로 읽고 거기에 속해있는 개념들이 무었이 있는지 파악하는게 우선인 것 같습니다. 그 다음 계속해서 반복하며 세부적인 내용에 대해 익히시면 합격선에 충분히 도달할 수 있다고 생각합니다.

 

 

4. 빅데이터 분석기사 실기

 

 

 

4-1. 교재

https://www.kaggle.com/agileteam/bigdatacertificationkr 

 

위의 사이트를 참고하여 빅데이터분석기사 실기에 특화된 실습을 할 수 있었습니다.

 

 

4-2. 수험 후기

 데이터를 전처리하고 모델링하고 성능평가하는 일련의 과정은 데이터 사이언스를 공부하다보면 자연스럽게 접하게 되는 부분입니다. 적어도 저는 개념적으로는 이러한 부분을 파악하고 있다고 생각했습니다. 그럼에도 불구하고 걱정되었던 점은 빅데이터 분석기사 실기의 프로그래밍 환경입니다. 저희가 일반적으로 활용하는 환경이 아닌 별도의 환경에서 코딩을 해야하기 때문에 이에 적응할 필요가 있습니다. 또한 패키지 혹은 라이브러리를 검색할 수 없기 때문에 기본적인 패키지 이름을 머리 속에 넣고 help(), dir()과 같은 기능들을 활용하여 모듈을 불러오는 방법을 숙지해야합니다.

 

 

4-3. 과목별 후기

단답형은 필기시험에서 본 베이스 그대로 준비하면되지 않을까 생각하여 나올만한 단어들만 눈으로 대강 준비했습니다. 아무래도 객관식이 아니고 답을 직접 떠올려서 써야해서 정확한 단어가 떠오르지 않았습니다. 반타작만 해도 잘했다고 생각했을 것 같은데 18점을 받았고 생각보다 답을 인정해주는 부분이 관대했던 것 같습니다.

 

작업형 제 1유형은 조건에 따라서 데이터를 가져오거나 결과 값을 도출하는 유형입니다. 답이 정해져 있는 문제이기 때문에 조건에 따라 답을 잘 print하면 문제없다고 생각합니다.

 

 

 작업형 제 2유형은 데이터 전처리, 모델링, 성능평가까지 머신러닝 모델링의 전반적인 과정을 수행하는 과목입니다. 제가 치렀던 3회에서는 고객 정보를 통해 여행 보험상품에 가입할지 안할지를 이진분류하는 문제였던 것으로 기억합니다. 결측치는 없었고 크게 전처리할 부분도 없었습니다. 모델링 할 때도 기본적인 의사결정나무, 랜덤포레스트, Xgboost 정도 사용했고 랜덤포레스트의 성능이 월등이 잘 나와 이를 선택했습니다. 

 

 다만 최종적인 결과값을 csv로 저장해 제출하는 과정에 주의할 필요가 있습니다. 제 경우에는 1에 해당하는 클래스에 속할 '확률'을 y_pred라는 컬럼명으로 데이터프레임 형태로 변환하고 csv로 제출해야 했습니다. 즉 0과 1에 해당하는 클래스를 잘 구분하여 값을 도출하고 그 값이 '확률'인지 '라벨'인지 잘 구분할 필요도 있습니다. 개념 자체는 큰 문제 없지만 이런 디테일한 부분에 신경을 써야 점수를 잘 받을 수 있지 않을까 생각합니다.

 

 

 


 

종합

 

  • 높은점수는 아니지만 투입대비 성과측면에서 효율적이었다고 생각합니다.
  • 빅데이터 분석기사를 도전하기 전에 ADsP를 먼저 공부하는 것도 괜찮은 방법입니다.
  • SQLD는 합격의 측면에서 노랭이가 진리입니다.
  • 빅데이터 분석기사 실기는 초기단계라 그런지 개념적으로 어려운 부분은 없었습니다.

 

 

 자격증 취득만을 위한 공부보다 실질적인 실력을 위한 공부를 하고자 했지만 턱걸이 수준의 점수들도 있는 것을 봐선 이러한 마음 가짐을 잘 실천했는지에 대해서 반성하게 됩니다. 한편 자격증 시험을 공부하면서 거시적인 관점에서 개념들을 익힐 수 있다는 점이 장점으로 다가왔습니다. 

 

감사합니다.