Teď mám dva údaje, název a text, a chci vypočítat počet výskytů každého jména v názvu v letošním roce v textu, který je, jak generovat data výsledek. Jak toho dosáhnout? Snažil jsem se lapply a grepl, ale oba zklamali. Díky moc!
name=data.table(year=c(2018,2019,2020),
name0=list(c("A","B","C"),c("B","C"),c("D","E","F")))
text=data.table(year=c(2018,2018,2019,2019,2020),
text0=list(c("DEF","BG","CG"),c("ART","CWW"),c("DLK","BU","FO"),
c("A45","11B","C23"),c("EIU","CM")))
result=data.table(year=c(2018,2018,2018,2019,2019,2020,2020,2020),
name0=c("A","B","C","B","C","D","E","F"),
count=c(1,1,2,2,1,0,1,0))
text
jsou více než 100 milionů, takže R zprávy Error: memory exhausted (dosáhl limitu?). Víte, jak tento problém vyřešit?