[R] 데이터 가공 함수
DPLYR vs. DATA.TABLE
AI gina
2022. 4. 22. 15:03
PACKAGE:DPLYR과 PACKAGE:DATA.TABLE의 비교
- data.table의 문법은 DT[i, j, by/keyby=, .SDcols= ][]로 나타낼 수 있다.
- i는 행을 선택하거나 순서를 조정한다.
- j는 열을 선택하거나, 열 또는 데이터 테이블 전체(.SD)에 어떤 함수를 적용한다.
- by(또는 keyby)는 집단을 나눈다.
- .SDcols=는 j를 수행하기 이전에 열을 선택한다.
- 마지막의 []는 생략하거나, 열을 정렬하거나([order()]), :=이후에 데이터 테이블을 출력할 때([]) 사용할 수 있다.
- dplyr과의 비교
dplyrdata.table
slice(1:10) | DT[1:10] |
filter(cola == 3) | DT[cola==3] |
select(cola, colb) | DT[.(cola, colb)] |
mutate(colc = cola*colb) | DT[, colc := cola*colb] |
transmute(colc = cola*colb) | DT[, .(colc=cola*colb)] |
arrange(cola) | DT[order(cola)] |
group_by(cola) | DT[,,by=cola] |
*출처: http://ds.sumeun.org/?p=1035