데이터처리 3

MSBA 데이터 처리 및 머신러닝 에필로그

책의 맨 뒷부분 내용이지만 먼저 여기 부분 부분 공개합니다. 책의 코딩은 너무 방대해서 블로그에 올리지 못하는 점 양해해 주세요. MSBA 에필로그. 지금까지 긴 내용을 읽어주신 독자분들께 감사드린다. 이 책에 쓰여진 내용은 2년동안 미국대학 MSBA 과정을 통해서 배운 것을 집대성한 것이라서 한꺼번에 이해하기가 쉽지 않을 수 있다. 우리가 제시한 프로젝트 두 개 모두 이진값(binary) 타겟변수를 설정하였다. 때문에 독자들은 두 프로젝트 모두에서 왜 연속형 구간 타겟변수는 다루지 않는가 하고 의구심이 들지 모른다. 좋은 질문이다. 당연히 우리 책의 두 프로젝트 모두 연속형 구간 타겟변수를 설정하고 분석할 수 있다. 절차는 거의 유사하며 해석이 약간 다를 뿐이다. 예를 들어 3장의 프로젝트는 주택가격(..

어쩌다 코딩 2021.04.20

(가칭) MSBA 파이썬 데이터 처리 및 머신러닝 with Python 목차

제가 쓰고 있는 책의 목차입니다. 목차 1장. 유용한 사전지식 1-1. 교수님 과목 순서가 바뀌었어요. 1-2. 머신러닝 모델을 먼저 돌려 봐? 1-3. 이 책의 구성 2장. 아나콘다 내비게이터 설치 및 파이썬 3장. 프로젝트1. 미국 주택시장 가격 분석 3-1. 궁금한 게 뭔데? – 문제 제기 3-2. 어디서 데이터를 구하지? – 데이터 구하기 3-3. 타겟변수 설정 3-4. 데이터 처리 (Data Cleaning) 3-4-1. 데이터 불러오기 3-4-2. ID변수 설정 3-4-3. 데이터 병합 3-4-4. 타겟변수 생성 3-4-5. 기타 변수 데이터 처리1 3-4-6. 기타 변수 데이터 처리2 3-5. 탐색적 자료분석 및 시각화 3-5-1. 결측값50% 초과 변수 제거 3-5-2. 요약통계 및 도수분..

어쩌다 코딩 2021.04.19

[공지] 미국 MSBA 파이썬 데이터 처리 및 머신러닝 책 집필이 거의 완료되었습니다.

미국 주립대학교 UCO (University of Central Oklahoma)의 MSBA 학과를 졸업하고 귀국한지 약 석달 반 정도 됩니다. 그간에 미국 대학교 지도교수님과 상의해서 2년 동안의 MSBA 학과에서 배운 내용을 책으로 집필해 보았습니다. 거의 완성됐고 지금은 저자인 제가 1차로 책 내용을 재정리까지 했습니다. 하지만 코딩 관련 책이라 책 내용에 에러가 있으면 안돼서 아마 2~3주간 추가적인 퇴고 작업이 필요할 것 같습니다. ​ 책의 맛보기 차원에서, 그리고 책을 왜 썼는지에 대한 사유 등은 공유하는 게 좋을 것 같아서 시간이 날 때마다 여기에 조금씩 올리겠습니다. 본격적인 내용은 코딩이 복잡해서 책이 6~7월경에 출간되면 책으로 찾아주시면 감사하겠습니다. 서문 ​ 내가 미국에서 파이썬을..

어쩌다 코딩 2021.04.17