본문 바로가기

빅데이터 공부

(6)
[빅데이터분석기사_실기] 4. 이상치 판별 -1 안녕하세요, 여러분 :-) 지난 시간에 배운 결측치는 모두 잘 이해하셨겠죠? 데이터 분석에 있어서 데이터 전처리는 핵심이고 데이터 전처리에서 결측치와 이상치 처리는 기본 중 기본이므로 열심히 학습하시길 바랄게요. 이번엔 이상치에 대해서 배워보도록 하겠습니다. 1) 이상치(Outlier)란? -이상치는 관측된 데이터의 범위에서 너무 크거나 작은 값을 의미합니다. -이상치 관측 원인은 입력 오류, 데이터 처리 오류, 샘플링 오류 등이 있습니다. 2) 이상치 판별 -이상치를 판별 할 수 있는 방법은 크게 2가지로 정리할 수 있습니다. R 함수 활용 -R의 outliers 패키지를 설치하여 outlier 함수로 이상치를 판별합니다. 사분위수 활용 -제 3사분위수에서 제 1사분위수의 값을 뺀(Q3-Q1)다음 1...
[김민지_빅데이터강의]빅데이터분석기사 필기 자격증 대비반_군포시문화재단 안녕하세요, 김민지입니다. 다들 3회차 빅데이터분석기사 필기 시험 잘 보셨나요~? 열심히 공부하신분들에게 좋은 결과가 있으시길 바라겠습니다. 저도 9월 한 달동안 군포시 문화재단과 함께 빅데이터 분석기사 필기 자격증 대비반 수업을 진행했었는데요. 한 달이라는 짧은 시간이었지만, 많은 분들이 열심히 잘 따라와주셔서 강의를 마무리 할 수 있었습니다. 수업은 1차시당 3시간씩 총 7차시로 구성되어 오후 7시부터 10시까지 Zoom 강의로 진행하였습니다. (중요한 부분은 온라인 강의로 학습하실 수 있도록 제공하였습니다.) 수강료는 무료로 진행되었고, 모집이 시작되자마자 마감이 되어버려 아마 많은 분들이 아쉬워하셨을 것 같습니다. 수강하지 못하신 분들은 다음 번에 꼭 참여해주세요. :-) 빅데이터분석기사는 비전공..
[김민지_빅데이터강의] 강동대학교 보건의료행정학과 특강-1 [2021.04.28] '빅데이터, 융합의 시대를 열다.'의 주제로 강동대학교 보건의료행정학과 특강을 다녀왔습니다. 충북에 위치해있는 강동대학교 보건의료행정학과는 2019년 기준 의료정보관리사 전국 1위 합격률을 기록할만큼 매년 높은 합격률을 보여주고 있고 훌륭한 보건행정인을 많이 양성하고 있습니다. 보건의료빅데이터는 2020년부터 국가가 본격적으로 데이터를 개방하기 시작하고, 개인과 밀접한 데이터로서 데이터의 활용가치가 높아 많은 사람들의 관심이 주목되는 분야이기도 합니다. 강동대학교 보건의료행정과는 보건의료, 빅데이터 과정을 추진하여 학생들이 방대한 보건의료 빅데이터를 처리하고 더 나아가 분석을 통해 보건의료산업에 기여할 수 있는 보건의료 빅데이터 실무인재 양성을 목표로 하고 있습니다. 저는 아직 빅..
빅데이터분석,R프로그래밍으로시작하기_활용데이터배포 안녕하세요. 김민지입니다. :-) 빅데이터분석, R프로그래밍으로시작하기 학습 진행하시면서, 분석에 활용할 데이터입니다. 한번에 다운로드 받으셔서 워킹 디렉토리에 옮겨 두고 실습 진행하시면 됩니다. 학습 중 문의사항이 있으시면 언제든 연락주세요. (bigdataleader@naver.com)
[빅데이터 학습 Q&A, 빅데이터 공부 어떻게 시작해야 할까?] 안녕하세요. 김민지입니다 :-) 빅데이터에 대한 세간의 관심이 뜨겁습니다. 그에 따라 많은 사람들이 빅데이터 학습을 많이 염두해 두고 있는데요. 아무래도 전공자가 아니거나 현실적인 문제에 부딪히다 보면 학습을 시작하기도 전에 포기할 가능성이 큽니다. 빅데이터 학습을 언제, 어떻게 시작해야겠는지 모르겠거나 너무 많은 정보에 지치신 분들을 위해서 많은 분들이 물어봐주셨던, 그리고 제가 고민했던 내용 5가지를 Q&A형식으로 정리해드리겠습니다. 꼭 읽어보시고, 빅데이터 학습을 시작하시는 모든 분들의 첫 출발이 순조롭길 바라겠습니다. Q1: 광범위한 빅데이터, 언제 어떻게 시작해야 할까요? A1: 이제 모두가 빅데이터를 배우고, 배울 수 있는 시대가 성큼 다가왔습니다. 현재 어떤 전공을 하고 있던, 어떤 직무에서..
[빅데이터분석, R프로그래밍으로 시작하기 학습코드 무료배포] 안녕하세요. 김민지입니다 :-) 빅데이터분석, R프로그래밍으로 시작하기 학습코드 배포해드립니다. 각 PART 01-04까지 사용된 모든 코드가 포함되어 있습니다. 가급적이면 책을 보시면서 직접 작성해보시는 것이 가장 좋은 방법이나, 시간이 부족하시거나 오류가 발생하시는 분들은 복사하여 활용하셔도 좋을것 같습니다. 다운로드 하시는 분들은 댓글/공감 올려주시면 더 좋은 컨텐츠로 보답하겠습니다. :)