먼저 데이터 구조와 기본적인 문법을 익혀보도록 하겠습니다.
기본적으로 R은 다음과 같은 데이터 구조를 갖습니다.
a. Vector
b. Matrix
c. Array
d. Data.frame
e. List
a. Vector(벡터)
벡터는 숫자, 문자 또는 논리형 데이터를 취할 수 있는 일차원 배열입니다. 이때 벡터 안에는 반드시 하나의 유형의 데이터만 들어갈 수 있습니다.
b. Matrix(행렬)
행렬은 요소들이 동일한 모드(숫자, 문자 등)인 이차원 배열입니다.
c. Array(배열)
배열은 행렬과 비슷하지만 두개보다 많은 차원을 가질 수 있습니다.
d. Data.frame(데이터 프레임)
데이터프레임은 열마다 다른 데이터 유형을 포함 할 수 있다는 장점이 있습니다. 데이터 프레임은 R에서 활용하는 가장 일반적인 데이터 유형입니다.
e. List(리스트)
리스트는 복잡합니다. 리스트는 서열화된 객체들의 집합체입니다. 음.. 예를들어 목록은 벡터, 행렬, 데이터프레임, 리스트들의 결합이 될 수 있습니다.
실습을 하기 전 먼저 <- 가 뭔지에 대해 알아야 합니다. 변수란 값을 저장하는 공간입니다. 보통 문법이 길어지기 때문에 변수를 만들어 연산값을 대입하여 사용하면 편리합니다. 이때 <-를 사용합니다. 오른쪽의 값을 왼쪽에 대입합니다. 변수입력은 다음과 같이 사용합니다.
x <- 10
x
a <- c(1,2,3,4,5,6,-2,-4)
b <- c("a", "b", "c", "d", "e")
c <- c(TRUE, TRUE, FALSE, TRUE, FALSE)
R의 기본 문법을 익혀보도록 하겠습니다.
기본 연산자
#산술연산자
#+
10+1 = 11
#-
10-1 = 9
#*
10*2 = 20
#/
10/2 = 5
#%%
10%%2 = 0
#^, **
10^2 = 100
10**2 = 100
문자형
문자형 데이터를 입력할 때는 쌍따옴표("입력문자"), 또는 홑따옴표('입력문자')를 사용합니다.
b <- c("a", "b", "c", "d", "e")
#원하는 모양으로 데이터가 입력되었는지 확인합니다.
b
#해당 변수의 데이터 형을 확인하고 싶다면 class()함수를 활용합니다.
class(b)
논리문
데이터를 비교하여 참, 거짓을 판단해줍니다. 참일경우 TRUE, 거짓일 경우 FALSE를 반환합니다.
d <- 2
d == 2
d != 2
R도 반복문과 조건문이 존재합니다.
반복문
아래 코드는 for문을 돌려서 i를 1,2,3 순서대로 입력하는 코드입니다. for문이 돌면서 i를 출력합니다.
for (i in 1:3){
print(i)}
조건문
다음 코드는 n에 4를 입력하였습니다. 그리고 if문을 실행합니다. 만약 n이 3이면, TRUE를 출력하고, 아니면 FALSE를 출력하는 코드를 짰습니다. 이를 실행시키면 FALSE가 출력됩니다. n은 4이기 때문이죠.
n <- 4
if (n == 3){
print("TRUE")
} else{
print("FALSE")
}
여기까지 간단한 R 문법을 알아보았습니다. 워낙 다양한 문법 및 활용법이 있기 때문에 자세히 알고 싶으신 분은 다음 링크를 참조해 주세요. 수고하셨습니다.
https://cran.r-project.org/doc/manuals/r-release/R-lang.html
'데이터분석 저장소 > R 저장소' 카테고리의 다른 글
워드클라우드('19년도', '관광') (0) | 2020.05.15 |
---|---|
워드클라우드 (0) | 2020.05.07 |
데이터 핸들링 (0) | 2020.03.26 |
R studio 다운로드 및 설정 (0) | 2020.03.21 |
R 설치 (0) | 2020.03.20 |