[방송통신대학교 컴퓨터과학과] 데이터정보처리입문- R 프로그래밍
본문 바로가기
etc./방송통신대학교

[방송통신대학교 컴퓨터과학과] 데이터정보처리입문- R 프로그래밍

by DHan- 2020. 5. 9.
728x90

 

R - 프로그래밍 언어


 

 

R (프로그래밍 언어) - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. R은 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경이자 프리웨어이다.[2] 뉴질랜드 오클랜드 대학의 로버트 젠틀맨(Robert Gentleman)과 로스 이하카(Ross Ihaka)에 의해 시작되어 현재는 R 코어 팀이 개발하고 있다. R는 GPL 하에 배포되는 S 프로그래밍 언어의 구현으로 GNU S라고도 한다. R는 통계 소프트웨어 개발과 자료 분석에 널리 사용되고 있으며, 패키지 개발이 용이해 통계

ko.wikipedia.org

R은 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경이자 프리웨어이다.[2] 뉴질랜드 오클랜드 대학의 로버트 젠틀맨(Robert Gentleman)과 로스 이하카(Ross Ihaka)에 의해 시작되어 현재는 R 코어 팀이 개발하고 있다. R는 GPL 하에 배포되는 S 프로그래밍 언어의 구현으로 GNU S라고도 한다. R는 통계 소프트웨어 개발과 자료 분석에 널리 사용되고 있으며, 패키지 개발이 용이해 통계 소프트웨어 개발에 많이 쓰이고 있다.

 

표본평균, 표본분산, 표본표준편차


 

R 명령어


평균 mean() 

분산 - 관찰지의 퍼진 정도 var() 

표본분산 var(data)*(length(data)-1)/length(data) 

표준편차 - 관찰치의 퍼진 정도 sd()          sqrt(var(data)) 

표준오차 - 추정치의 표준편차 sd(data)/sqrt(length(data)) 

변동계수 sd(data)/mean(data)          Boxplot        boxplot(data, col="blue") 

Q-Q Normality plot - 데이터가 정규분포에 얼마나 근접한지 확인할때, qqnorm(data)           qqline(data) 

표본추출 sample() 

히스토그램 hist(data, probability=TRUE)        lines(density(data), col="red")

 

줄기-잎 그림, 히스토그램, 상자그림


 

상자그림, 히스토그램 : https://m.blog.naver.com/PostView.nhn?blogId=ljh0326s&logNo=220963987252&proxyReferer=https:%2F%2Fwww.google.com%2F

 

[확률과 통계] 수치를 통한 연속형 자료의 요약 - 3 (상자그림등) 2017- 03 - 29 내용 추가

상자그림(box plot) 자료로부터 얻는 다섯 가지의 요약 수치인 최솟값, Q₁, Q₂, Q₃, 최댓값을 가지고...

blog.naver.com

줄기-잎 그림, 히스토그램, 상자그림 : https://stat-and-news-by-daragon9.tistory.com/62

 

[기초] 2. [R]줄기-잎 그림, 히스토그램, 상자그림

## 작성일: 2017-09-21 ## 작성자: 춤추는초코칩 ## 줄기-잎 그림, 히스토그램, 상자그림 ## 1. 줄기-잎 그림(Stem-Leaf Plot) x = runif(100,0,1) stem(x) # 도수가 68개를 초과하면 '+' 기호 뒤에 숫자로 표현됨..

stat-and-news-by-daragon9.tistory.com

 

 


R : https://media.fastcampus.co.kr/knowledge/dataanalysis-python-r/

 

데이터 분석 입문, R로 시작할까 파이썬으로 시작할까?

시작하지 않으면 큰일 날 것 같은 데이터 분석, 본격적으로 시작하려는 사람이라면 누구나 마주하는 문제가 있을 텐데요, 바로 '어떤 툴을 활용해 공부해야 하지? 입니다. 고민이 많을 분들을 위해 준비했습니다. 파이썬이냐, R이냐!

media.fastcampus.co.kr

R :https://thebook.io/006723/ch07/02/01/

 

R을 이용한 데이터 처리 & 분석 실무: 표본 평균, 표본 분산, 표본 표준 편차

 

thebook.io

참조 : https://corock.tistory.com/344

 

[R] 기초통계량

6. 기초통계량 6.1 데이터 분석 과정 6.1.1 정의 단계 : 문제의 정의 고객으로부터 최대한의 정보를 얻어내야 함 6.1.2 분해 단계 : 작은 단위로 분할한 후에 단계별로 해결 확보한 데이터를 분할된 ��

corock.tistory.com

참조 : http://www.kwangsiklee.com/2017/04/%EA%B0%9C%EB%B0%9C%EC%9E%90%EA%B0%80-%EB%B0%B0%EC%9A%B0%EB%8A%94-r-4%EA%B0%95-%EA%B8%B0%EC%B4%88%ED%86%B5%EA%B3%84-%ED%95%A8%EC%88%98-%EB%B0%B0%EC%9B%8C%EB%B3%B4%EA%B8%B0/

 

개발자가 배우는 R : 5강, 기초통계 함수 배워보기

개요 이번 포스팅에는 R에서 사용하는 기초통계 관련 함수들을 알아본다. 해당강의에서는 기초통계학의 내용은 다루지 않고 기초통계학에서 사용하는 기법들을 R에서 어떻게 적용하는지 다룬��

www.kwangsiklee.com

명령어 : https://1004jonghee.tistory.com/entry/R%EC%9D%98-%EA%B8%B0%EC%88%A0%ED%86%B5%EA%B3%84-%EB%AA%85%EB%A0%B9%EC%96%B4

 

R의 기술통계 명령어

평균 mean() 분산 - 관찰지의 퍼진 정도 var() 표본분산 var(data)*(length(data)-1)/length(data) 표준편차 - 관찰치의 퍼진 정도를 나타 sd() sqrt(var(data)) 표준오차 - 추정치의 표준편차 sd(data)/sqrt(leng..

1004jonghee.tistory.com

 

728x90

댓글