[R] 데이터 가공 함수

DPLYR vs. DATA.TABLE

AI gina 2022. 4. 22. 15:03

 

PACKAGE:DPLYR과 PACKAGE:DATA.TABLE의 비교

  • data.table의 문법은 DT[i, j, by/keyby=, .SDcols= ][]로 나타낼 수 있다.
    • i는 행을 선택하거나 순서를 조정한다.
    • j는 열을 선택하거나, 열 또는 데이터 테이블 전체(.SD)에 어떤 함수를 적용한다.
    • by(또는 keyby)는 집단을 나눈다.
    • .SDcols=는 j를 수행하기 이전에 열을 선택한다.
    • 마지막의 []는 생략하거나, 열을 정렬하거나([order()]), :=이후에 데이터 테이블을 출력할 때([]) 사용할 수 있다.
  • dplyr과의 비교

dplyrdata.table

slice(1:10) DT[1:10]
filter(cola == 3) DT[cola==3]
select(cola, colb) DT[.(cola, colb)]
mutate(colc = cola*colb) DT[, colc := cola*colb]
transmute(colc = cola*colb) DT[, .(colc=cola*colb)]
arrange(cola) DT[order(cola)]
group_by(cola) DT[,,by=cola]

 

*출처: http://ds.sumeun.org/?p=1035