어쩌다 코딩

MSBA 데이터 처리 및 머신러닝 에필로그

데이터 읽는 남자 J 2021. 4. 20. 09:10

책의 맨 뒷부분 내용이지만 먼저 여기 부분 부분 공개합니다.

책의 코딩은 너무 방대해서 블로그에 올리지 못하는 점 양해해 주세요.

 

MSBA 에필로그.

 

 

지금까지 내용을 읽어주신 독자분들께 감사드린다. 책에 쓰여진 내용은 2년동안 미국대학 MSBA 과정을 통해서 배운 것을 집대성한 것이라서 한꺼번에 이해하기가 쉽지 않을 있다.

 

우리가 제시한 프로젝트 모두 이진값(binary) 타겟변수를 설정하였다. 때문에 독자들은 프로젝트 모두에서 연속형 구간 타겟변수는 다루지 않는가 하고 의구심이 들지 모른다. 좋은 질문이다. 당연히 우리 책의 프로젝트 모두 연속형 구간 타겟변수를 설정하고 분석할 있다. 절차는 거의 유사하며 해석이 약간 다를 뿐이다. 예를 들어 3장의 프로젝트는 주택가격(VALP) 타겟변수로 설정하면 된다. 그럼에도 불구하고 프로젝트 모두 이진값 타겟변수를 고수한 이유는 교육목적상 이진값 타겟변수 모델이 쉽게 배울 있고 시각화도 용이하며 결과 해석도 다양하게 있기 때문이었다. 독자 여러분이 여력이 되면  타겟변수를 연속형 구간 변수로 바꾸어서 시도해도 된다. 그럼 배우는 점이 있을 것이다.

 

두번째 질문으로 책과 같은 내용을 추가로 교육받으려면 미국 MSBA학과에 진학하면 되는지 알고 싶을 있다. 참고로 MSBA M Master과정의 약자여서 과정은 2 혹은 1 반짜리 대학원 과정이다. 짧은 영어실력이지만 내가 좋아하는 영어표현으로 답변을 드리겠다. It may be or may not be (그럴 수도 있고 그렇지 않을 수도 있다). 그것은 본인이 미국 수업에서 개인별, 팀별 연구 프로젝트를 얼마나 수행했느냐에 달려있다. 지도교수님의 연구조교가 돼서 수행하는 연구 프로젝트도 포함된다. 결론을 이야기하자면 미국 MSBA 가더라도 연구 프로젝트를 수행하지 않고 수업만 듣는다면 좋은 교육성과를 기대하기 힘들다. 모든 것은 연구 프로젝트 수행 여부에 달려있다.

 

만약에 독자들이 읽어보기에 책의 구성이 참신하고, 처음부터 끝까지 독자 여러분이 직접 프로젝트를 수행하고 있는 느낌이  들었다면, 그건 저자가 2 동안의 미국 MSBA 과정에서 수행한 연구 프로젝트를 여기 요약해서 풀어 썼기 때문이다.  저자는 SAS Enterprise Miner라는 상용 프로그램으로 너무나 쉽게 머신러닝 모델링을 배웠다가 지도교수님의 추천으로 연구 프로젝트로 과정을 파이썬으로 만들어보게  되었다.

 

처음에는 정말 엉망진창이었다. 파이썬 수업을 1학기 들었고 시험도 나쁘지 않게 봐서 뭔가 안다고 생각했는데, 정작 프로젝트를 시작해 보니 파이썬 수업 교재가 거의 도움이 되었다. 관련 내용이 있는 아는데 찾아보기 힘들었거나, 아니면 아예 내가 필요한 기능은 책에 없었다. 황당함이란 이루 말할 없었다. 그때부터 웹에 검색을 시작했고 Stack Overflow사이트와 친구가 되었다. 물론 처음엔 Stack Overflow 올라온 설명도 해석을 못했다. 영어를 모르는 것이 아니고 머신러닝 용어조차도 서툴러서 해석에 걸렸다. “Tuple? Indexing?, … , 소리야?” 하면서 말이다. 정말 한심한 출발이었다.

 

이런 우여곡절끝에 크고 작은 파이썬 프로젝트 대여섯  정도 수행하고 같다. 지금 나의 자산은 프로젝트 수행 경험이며 경험을 바탕으로 책을 썼다. 지도교수님께서도 나의 지적 호기심을 자극시켜 주시면서 필요한 방향으로 적절한 조언으로 프로젝트 수행을 적극적으로 도와주셨다. 이점은 지금도 깊이 감사드리고 제가 몹시 운이 좋았다고 생각한다. 빈말이 아니라 지도교수님이 아니었으면 책은 엄두도 냈을 것이다.