본문 바로가기

무료빅데이터

(6)
[빅데이터분석기사_실기] 2. 결측치 대체 안녕하세요, 여러분. 지난 시간 다뤄본 결측치 확인과 삭제 방법은 잘 보고 오셨죠? 이번에는 결측치를 대치하는 방법에 대해서 학습하겠습니다. 다음 시간 기출문제를 풀어보기 위해서 반드시 알아두셔야 합니다. 만약 R 기초를 아예 모르시는 분들은 블로그에 온라인 강의가 있으니 듣고 오시면 좋을 것 같습니다. :-) 1) 결측값 처리 방법 - 평균 대치법(Mean Imputation) 평균 대치법이란 결측값을 데이터의 평균, 중위수 등으로 대체하는 방법입니다. 대체하는 방법 중 가장 많이 쓰이는 방법입니다. 두 가지 방식으로 대치하겠습니다. 사용된 데이터는 R 내장 데이터인 airquality입니다. Ozone 변수와 Solar.R 변수에 각각 결측치가 있는 것을 확인할 수 있습니다. ifelse 조건문을 활..
[빅데이터분석기사_실기] 1. 결측치 처리 데이터 전처리에서 결측치를 확인하고 처리하는 과정은 기본 중 기본입니다. 빅데이터분석기사 실기 시험에 실제 결측치 처리(단순 대치법)문제가 나왔습니다. 공부해봅시다 ! ! :-) 1) 결측치란? -결측치는 관측되지 않은 값으로서 NA(Not Available)로 표시됩니다. -데이터에 결측치가 포함되어 있으면 산술연산과 같은 데이터 분석을 제대로 할 수 없습니다. 2) 결측치 데이터 처리 순서 (***) -결측치 확인 -결측치 처리 방법 결정 (삭제 or 대치) -결측치 삭제 -결측치 대체 결측치 처리 순서 잘 보셨나요? 이 순서대로 R로 학습하도록 하겠습니다. -필요한 데이터 세트 : airquality(내장 데이터) , 생성 데이터 -필요한 패키지 : dplyr 1. 결측치 확인 is.na(x) 데이..
[김민지_빅데이터강의] 울산시_과학기술 멘토와의 만남 특강 2021년 10월 27일 울산광역시에서 주최하는 과학기술 멘토와의 만남에 초대되어 ‘데이터 리터러시, 선택이 아닌 필수다.’ 라는 주제로 특강을 진행하였습니다. 제가 지금까지 진행 해온 강의 중 가장 많은 수강생이 있었습니다. 그래서 그만큼 긴장이 되었는데 몇 십명의 수강생분들이 호응도 너무 잘해주시고 채팅방에 댓글도 많이 달아주셔서 힘이 쑥쑥나고 재밌었습니다. ღ’ᴗ’ღ ! ! 지금 생각해도 기쁘고 뿌듯하네요. 우리가 살아가기 위해 열심히 한글을 배우고 의사소통능력을 기르듯이, 앞으로의 세상은 더더욱 자신이 무슨일을 하는지와는 무관하게 데이터 리터러시 능력을 가지고 살아가야합니다. 현실세계의 데이터를 제대로 인식하고, 또 스스로 현실 세계의 데이터를 정보화 시킬 수 있는 능력이 뒷받침 되어야 빅데이터 ..
[빅데이터 학습 Q&A, 빅데이터 공부 어떻게 시작해야 할까?] 안녕하세요. 김민지입니다 :-) 빅데이터에 대한 세간의 관심이 뜨겁습니다. 그에 따라 많은 사람들이 빅데이터 학습을 많이 염두해 두고 있는데요. 아무래도 전공자가 아니거나 현실적인 문제에 부딪히다 보면 학습을 시작하기도 전에 포기할 가능성이 큽니다. 빅데이터 학습을 언제, 어떻게 시작해야겠는지 모르겠거나 너무 많은 정보에 지치신 분들을 위해서 많은 분들이 물어봐주셨던, 그리고 제가 고민했던 내용 5가지를 Q&A형식으로 정리해드리겠습니다. 꼭 읽어보시고, 빅데이터 학습을 시작하시는 모든 분들의 첫 출발이 순조롭길 바라겠습니다. Q1: 광범위한 빅데이터, 언제 어떻게 시작해야 할까요? A1: 이제 모두가 빅데이터를 배우고, 배울 수 있는 시대가 성큼 다가왔습니다. 현재 어떤 전공을 하고 있던, 어떤 직무에서..
[빅데이터분석, R프로그래밍으로 시작하기 학습코드 무료배포] 안녕하세요. 김민지입니다 :-) 빅데이터분석, R프로그래밍으로 시작하기 학습코드 배포해드립니다. 각 PART 01-04까지 사용된 모든 코드가 포함되어 있습니다. 가급적이면 책을 보시면서 직접 작성해보시는 것이 가장 좋은 방법이나, 시간이 부족하시거나 오류가 발생하시는 분들은 복사하여 활용하셔도 좋을것 같습니다. 다운로드 하시는 분들은 댓글/공감 올려주시면 더 좋은 컨텐츠로 보답하겠습니다. :)
[빅데이터분석기사 자격증] 안녕하세요. 김민지입니다 :-) 이번 게시물은 최근 정말 핫한 자격증인 빅데이터 분석기사 시험 범위 및 한국산업인력공단에서 제시한 시험 주요 내용에 대해 알아보겠습니다. (반드시 잘 체크하시고 시험을 대비하시길 바랍니다!) 빅데이터분석기사란? : 대용량의 데이터 집합으로부터 의미있는 정보를 찾고, 결과를 예측하기 위해서 분석 목적에 따른 분석 기술과, 방법론을 기반으로 정형, 비정형 데이터를 수집, 가공, 분석, 시각화 등 빅데이터를 자유자재로 다룰 수 있는 전문가를 말합니다. 빅데이터분석기사의 주요 업무 한국산업인력공단에서 공개한 빅데이터 분석기사 국가기술자격 종목 개발 연구 내용입니다. 수행능력 단위 수행능력 세부사항 1. 분석기획 1-1. 분석과제 정의 및 분석 목표 1-2. 데이터 이해 1-3. ..