본문 바로가기
KNOU

[데이터 통계] R 프로그래밍 언어 소개 및 명령어 정리

by bottlesun 2023. 3. 6.
728x90

R이란?

R은 통계 계산 및 그래픽을 위한 프로그래밍 언어 및 소프트웨어 환경이다.

데이터 분석, 데이터 시각화 및 통계 모델링을 위해 데이터 분석가 및 연구원들 사이에서 널리 사용된다.

R 의 특징

  1. 데이터 조작: R은 데이터 세트 정렬, 필터링, 병합 및 재구성과 같은 데이터 조작을 위한 다양한 기능을 제공한다.
  2. 데이터 시각화: R에는 산점도, 히스토그램 및 히트 맵과 같은 다양한 차트, 그래프 및 기타 시각화를 생성할 수 있는 강력한 도구가 있다.
  3. 통계 모델링: R에는 선형 회귀, ANOVA 및 로지스틱 회귀와 같은 통계 분석 및 모델링을 수행하기 위한 다양한 기능이있다.
  4. 기계 학습: R에는 caret, randomForest 및 xgboost와 같은 기계 학습용 라이브러리가 점점 늘어나고 있다.
  5. 데이터 가져오기 및 내보내기: R은 다양한 데이터 형식을 지원합니다. CSV, Excel, SQL 및 SAS를 포함하며 데이터 가져오기 및 내보내기 기능을 제공다.
  6. 재현성: R은 코드, 결과 및 시각화를 문서화하고 저장하는 방법을 제공한다. (쉽게 재현할 수 있는 단일 파일)

R 의 명령어

명령  설명
help(topic) 지정된 주제 또는 명령에 대한 도움말 정보를 표시합니다.
?topic 지정된 항목 또는 명령에 대한 도움말 정보를 표시합니다.
ls() 현재 R 세션의 모든 개체를 나열합니다.
rm(object) R 세션에서 지정된 개체를 제거합니다.
getwd() 현재 작업 디렉토리를 반환합니다.
setwd(directory) 현재 작업 디렉토리를 설정합니다.
install.packages(pkg) 지정된 패키지를 설치합니다.
library(pkg) 지정된 패키지를 로드합니다.
data(dataset) 내장 데이터세트를 R 세션으로 로드합니다.
read.csv(file) CSV 파일에서 데이터를 읽습니다.
read.table(file) 텍스트 파일에서 데이터를 읽습니다.
str(object) 개체의 구조를 표시합니다.
summary(개체) 개체에 대한 요약 통계를 표시합니다. object.
dim(object) 객체의 크기를 반환합니다.
head(object) 객체의 처음 몇 행을 표시합니다.
tail (객체) 객체의 마지막 몇 행을 표시합니다.
names(object) 데이터 프레임의 열 이름을 반환합니다.
class(object) 다음의 클래스를 반환합니다. 개체.
typeof(object) 개체의 데이터 유형을 반환합니다.
is.na(object) 어떤 값이 NA인지 나타내는 논리 벡터를 반환합니다.
which(조건) 지정된 조건을 충족하는 값의 인덱스를 반환합니다. condition.
subset(object,subset) 지정된 조건에 따라 개체의 하위 집합을 추출합니다.
merge(object1, object2) 지정된 변수를 기반으로 두 개의 데이터 프레임을 병합합니다.
aggregate(object, by) 지정된 변수를 기반으로 데이터를 집계합니다.
plot(x,y) 두 변수의 산점도를 만듭니다.
hist(object) 숫자 변수의 히스토그램을 생성합니다.
boxplot(object) 숫자 변수의 박스 플롯.
summary(개체) 개체에 대한 요약 통계를 표시합니다.
lm(y ~ x) x에 y의 선형 회귀 모델을 맞춥니다.
anova(model) 적합 모델에 대해 ANOVA를 수행합니다.
predict(model , newdata) 적합 모델.
summary(model) 적합 모델에 대한 요약 통계를 표시합니다.
cor(object) 변수 집합의 상관 행렬을 계산합니다.
cov(object) 변수 집합의 공분산 행렬을 계산합니다.
t.test(x, y) 두 평균의 차이에 대해 t-테스트를 ​​수행합니다.
chisq.test(x, y) 카이제곱 독립 검정을 수행합니다.
ks.test(x, y) 두 분포 간의 차이에 대해 Kolmogorov-Smirnov 테스트를 수행합니다.
wilcox.test(x, y) 두 중앙값 간의 차이에 대한 Wilcoxon 순위 합계 테스트를 수행합니다.
728x90

댓글