본문 바로가기

빅데이터분석기사실기

(2)
[빅데이터분석기사실기] 학습 데이터 세트 빅데이터분석기사 실기 교재 실습을 위한 데이터 세트입니다. 주로 기본 데이터분석 라이브러리에서 제공하는 데이터를 사용하지만 일부 데이터 세트가 따로 필요한 경우에만 외부 데이터를 사용하니 다운로드 받은 후 교재에 나온대로 학습하시면 될 것 같습니다. 기출문제를 풀기 위한 데이터 세트로 1회, 2회 구분하여 제공합니다. 문의사항 있으시면 댓글 또는 이메일로 문의주세요. (bigdataleader@naver.com)
[빅데이터분석기사_실기] 2. 결측치 대체 안녕하세요, 여러분. 지난 시간 다뤄본 결측치 확인과 삭제 방법은 잘 보고 오셨죠? 이번에는 결측치를 대치하는 방법에 대해서 학습하겠습니다. 다음 시간 기출문제를 풀어보기 위해서 반드시 알아두셔야 합니다. 만약 R 기초를 아예 모르시는 분들은 블로그에 온라인 강의가 있으니 듣고 오시면 좋을 것 같습니다. :-) 1) 결측값 처리 방법 - 평균 대치법(Mean Imputation) 평균 대치법이란 결측값을 데이터의 평균, 중위수 등으로 대체하는 방법입니다. 대체하는 방법 중 가장 많이 쓰이는 방법입니다. 두 가지 방식으로 대치하겠습니다. 사용된 데이터는 R 내장 데이터인 airquality입니다. Ozone 변수와 Solar.R 변수에 각각 결측치가 있는 것을 확인할 수 있습니다. ifelse 조건문을 활..