[데이터 처리를 위한 R 패키지] data.table, dplyr, plyr, reshape2, sqldf

[R] 데이터 가공 함수

AI gina 2022. 4. 21. 11:04

데이터 처리를 위한 R 패키지

데이터 처리 과정

- 데이터의 전처리

- 변환

- 필터링

1. 데이터 전처리를 위한 R 패키지

- data.table : 대용량 자료의 빠른 처리

- dplyr : Hadley Wickham가 작성, C++로 작성, data frame+pliers(집게)+R (디플라이알)

-> dplyr 패키지는 데이터 프레임을 핸들링하는 함수군으로 구성

- plyr : R로 작성, 처리 속도가 느림, pliers(집게)+R (플라이알)

- reshape2

-> reshape2::melt(): wide format의 데이터를 long format으로 변환

-> reshape2::cast(): long format의 데이터를 wide format으로 변환

- sqldf : R의 데이터프레임 객체를 SQL을 이용하여 조작하도록 지원하는 패키지

- Single table 함수 비교

dplyr 함수 dplyr함수 내용 base패키지 함수

- Two-table 함수

dplyr함수 기본함수