R이란?
R은 통계 계산 및 그래픽을 위한 프로그래밍 언어 및 소프트웨어 환경이다.
데이터 분석, 데이터 시각화 및 통계 모델링을 위해 데이터 분석가 및 연구원들 사이에서 널리 사용된다.
R 의 특징
- 데이터 조작: R은 데이터 세트 정렬, 필터링, 병합 및 재구성과 같은 데이터 조작을 위한 다양한 기능을 제공한다.
- 데이터 시각화: R에는 산점도, 히스토그램 및 히트 맵과 같은 다양한 차트, 그래프 및 기타 시각화를 생성할 수 있는 강력한 도구가 있다.
- 통계 모델링: R에는 선형 회귀, ANOVA 및 로지스틱 회귀와 같은 통계 분석 및 모델링을 수행하기 위한 다양한 기능이있다.
- 기계 학습: R에는 caret, randomForest 및 xgboost와 같은 기계 학습용 라이브러리가 점점 늘어나고 있다.
- 데이터 가져오기 및 내보내기: R은 다양한 데이터 형식을 지원합니다. CSV, Excel, SQL 및 SAS를 포함하며 데이터 가져오기 및 내보내기 기능을 제공다.
- 재현성: R은 코드, 결과 및 시각화를 문서화하고 저장하는 방법을 제공한다. (쉽게 재현할 수 있는 단일 파일)
R 의 명령어
명령 | 설명 |
help(topic) | 지정된 주제 또는 명령에 대한 도움말 정보를 표시합니다. |
?topic | 지정된 항목 또는 명령에 대한 도움말 정보를 표시합니다. |
ls() | 현재 R 세션의 모든 개체를 나열합니다. |
rm(object) | R 세션에서 지정된 개체를 제거합니다. |
getwd() | 현재 작업 디렉토리를 반환합니다. |
setwd(directory) | 현재 작업 디렉토리를 설정합니다. |
install.packages(pkg) | 지정된 패키지를 설치합니다. |
library(pkg) | 지정된 패키지를 로드합니다. |
data(dataset) | 내장 데이터세트를 R 세션으로 로드합니다. |
read.csv(file) | CSV 파일에서 데이터를 읽습니다. |
read.table(file) | 텍스트 파일에서 데이터를 읽습니다. |
str(object) | 개체의 구조를 표시합니다. |
summary(개체) | 개체에 대한 요약 통계를 표시합니다. object. |
dim(object) | 객체의 크기를 반환합니다. |
head(object) | 객체의 처음 몇 행을 표시합니다. |
tail (객체) | 객체의 마지막 몇 행을 표시합니다. |
names(object) | 데이터 프레임의 열 이름을 반환합니다. |
class(object) | 다음의 클래스를 반환합니다. 개체. |
typeof(object) | 개체의 데이터 유형을 반환합니다. |
is.na(object) | 어떤 값이 NA인지 나타내는 논리 벡터를 반환합니다. |
which(조건) | 지정된 조건을 충족하는 값의 인덱스를 반환합니다. condition. |
subset(object,subset) | 지정된 조건에 따라 개체의 하위 집합을 추출합니다. |
merge(object1, object2) | 지정된 변수를 기반으로 두 개의 데이터 프레임을 병합합니다. |
aggregate(object, by) | 지정된 변수를 기반으로 데이터를 집계합니다. |
plot(x,y) | 두 변수의 산점도를 만듭니다. |
hist(object) | 숫자 변수의 히스토그램을 생성합니다. |
boxplot(object) | 숫자 변수의 박스 플롯. |
summary(개체) | 개체에 대한 요약 통계를 표시합니다. |
lm(y ~ x) | x에 y의 선형 회귀 모델을 맞춥니다. |
anova(model) | 적합 모델에 대해 ANOVA를 수행합니다. |
predict(model , newdata) | 적합 모델. |
summary(model) | 적합 모델에 대한 요약 통계를 표시합니다. |
cor(object) | 변수 집합의 상관 행렬을 계산합니다. |
cov(object) | 변수 집합의 공분산 행렬을 계산합니다. |
t.test(x, y) | 두 평균의 차이에 대해 t-테스트를 수행합니다. |
chisq.test(x, y) | 카이제곱 독립 검정을 수행합니다. |
ks.test(x, y) | 두 분포 간의 차이에 대해 Kolmogorov-Smirnov 테스트를 수행합니다. |
wilcox.test(x, y) | 두 중앙값 간의 차이에 대한 Wilcoxon 순위 합계 테스트를 수행합니다. |
728x90
댓글