Pozadí
Mám d
, datovém:
d <- data.frame(ID = c("a","a","a","a", "b","b"),
event = c("G12","G12","O99","O99","B4","B2"),
date = as.Date(c("2011-01-01","2011-01-01","2011-12-23","2011-12-23","2011-01-01","2011-07-12")),
stringsAsFactors=FALSE)
Jak můžete vidět, ID a
má 4 řádky, z nichž 2 se opakuje na základě event
a date
(řádky 2 a 4 jsou duplikáty).
Problém a Požadovaný Výstup
Chtěl bych odstranit tyto duplicitní řádky tím, že žádá R
odstranit řádky v rámci ID
, které mají stejné event
a date
. Jinými slovy, rád bych něco, co vypadá takto:
d <- data.frame(ID = c("a","a", "b","b"),
event = c("G12","O99","B4","B2"),
date = as.Date(c("2011-01-01","2011-12-23", "2011-01-01","2011-07-12")),
stringsAsFactors=FALSE)
Co jsem se snažil
Udělal jsem pokus, ale není to docela tam:
d2 <- subset(d, duplicated(d$ID, d$event))
Nějaké nápady?