본문 바로가기

데이터분석 저장소/R 저장소

데이터 핸들링

Data handling

Data handling

Woonn

2020-03-27

먼저 reshape2 패키지가 필요합니다.

패키지를 불러왔으니 실습을 위해 score라는 변수에 학생 10명의 3과목 성적을 랜덤하게 입력해 보겠습니다. set.seed는 여러분과 저의 결과물이 동일하게 나오도록 랜덤추출한 수치를 고정시켜주는 역할을 합니다.

score가 제대로 생성 되었는지 확인합니다.

위와 같은 표를 melt함수를 이용해서 녹여보도록 하겠습니다. 이때 각 컬럼명을 설정해주는데, id.vars 아래엔 기준이 되는 항목, variable.name 아래엔 컬럼명, value.name 아래엔 실제 값들이 들어갑니다.

반대로 melt로 녹인 데이터를 다시 굳혀주는 함수도 있습니다. 이름하야 cast 함수입니다.

cast 함수를 활용하여 범주형 데이터로 변환할 수도 있습니다. 해당 값의 빈도를 출력해 줍니다.

여기까지 데이터를 원하는 형태로 가공하는 방법인 melt와 cast에 대해 알아보았습니다. 이를 잘 활용하면 분석시 원하는 결과물을 얻는데 도움을 줍니다. 수고하셨습니다.

'데이터분석 저장소 > R 저장소' 카테고리의 다른 글

워드클라우드('19년도', '관광')  (0) 2020.05.15
워드클라우드  (0) 2020.05.07
R 데이터 구조 및 기본 문법  (0) 2020.03.22
R studio 다운로드 및 설정  (0) 2020.03.21
R 설치  (0) 2020.03.20