본문 바로가기

빅데이터분석기사 공부

(3)
[빅데이터분석기사_실기] 5. 이상치 기출문제풀이 안녕하세요, 여러분 :) 다들 열심히 공부하고 계신가요. 11/8일부터 빅데이터분석기사 실기 접수가 시작되었어요. 놓치시지 마시고 꼭 접수하시길 바라겠습니다. 오늘은 이상치 기출문제를 함께 풀어보도록 할게요. 2021년 2회 실기 기출문제 풀이 [2021년 2회 실기 작업형 제 1유형 문제 13] 다음은 Insurance 데이터 세트이다. Charges 항목에서 이상값의 합을 구하시오. (이상값은 평균에서 1.5 표준편차 이상인 값) 이 문제에서 주의해야할 점은 이상값의 기준을 딱 명시해주었기 때문에 그에 맞게 기준선을 정하고 이전까지는 이상치를 제거한 데이터의 범위를 출력해봤다면, 이 문제는 이상치들의 합을 구한다는거에요. 여기에 주의하시고, dplyr 패키지를 통해서 간단하게 문제를 풀어보겠습니다. ..
[빅데이터분석기사_실기] 4. 이상치 판별 -1 안녕하세요, 여러분 :-) 지난 시간에 배운 결측치는 모두 잘 이해하셨겠죠? 데이터 분석에 있어서 데이터 전처리는 핵심이고 데이터 전처리에서 결측치와 이상치 처리는 기본 중 기본이므로 열심히 학습하시길 바랄게요. 이번엔 이상치에 대해서 배워보도록 하겠습니다. 1) 이상치(Outlier)란? -이상치는 관측된 데이터의 범위에서 너무 크거나 작은 값을 의미합니다. -이상치 관측 원인은 입력 오류, 데이터 처리 오류, 샘플링 오류 등이 있습니다. 2) 이상치 판별 -이상치를 판별 할 수 있는 방법은 크게 2가지로 정리할 수 있습니다. R 함수 활용 -R의 outliers 패키지를 설치하여 outlier 함수로 이상치를 판별합니다. 사분위수 활용 -제 3사분위수에서 제 1사분위수의 값을 뺀(Q3-Q1)다음 1...
[빅데이터분석기사 자격증] 안녕하세요. 김민지입니다 :-) 이번 게시물은 최근 정말 핫한 자격증인 빅데이터 분석기사 시험 범위 및 한국산업인력공단에서 제시한 시험 주요 내용에 대해 알아보겠습니다. (반드시 잘 체크하시고 시험을 대비하시길 바랍니다!) 빅데이터분석기사란? : 대용량의 데이터 집합으로부터 의미있는 정보를 찾고, 결과를 예측하기 위해서 분석 목적에 따른 분석 기술과, 방법론을 기반으로 정형, 비정형 데이터를 수집, 가공, 분석, 시각화 등 빅데이터를 자유자재로 다룰 수 있는 전문가를 말합니다. 빅데이터분석기사의 주요 업무 한국산업인력공단에서 공개한 빅데이터 분석기사 국가기술자격 종목 개발 연구 내용입니다. 수행능력 단위 수행능력 세부사항 1. 분석기획 1-1. 분석과제 정의 및 분석 목표 1-2. 데이터 이해 1-3. ..