Jsem začátečník s R a potřebují pomoc s úkolem. Výstup figuríny dataset s dput (skutečný soubor je opravdu velký):
structure(list(CODE = c(453, 463, 476,
798, 885, 582, 626, 663, 457, 408
), CATEGORY = c("CIG", "BET", "CIG", "CIG", "ARI", "CRR", "ARI", "CIG",
"CIG", "BET"), AMOUNT = c(22, 5, 6, 52, 16, 11, 6, 70, 208, 5),
PRICE = c(5.56, 8.29, 3.89, 3.8, 4.05, 3.99, 3.55, 7.69, 6.75,
5.2), BRAND = c("ROTHMANS", "ALLINO", "MARLBORO", "ROTHMANS", "AURIELO",
"SOLINOS", "CHLEBLO", "MARLBORO", "LD", "SOLINOS"
)), row.names = c(NA, -10L), class = c("tbl_df",
"tbl", "data.frame"))
Co je třeba udělat: sloupec, který bude zobrazovat podíl každé ZNAČKY v procentech by měla být přidána. První, co jsem udělat, je vytvořit nový sloupec "HODNOTA" tímto způsobem:
df$VALUE <- with(df, AMOUNT*PRICE)
Teď sloupci PODÍL musí být vytvořeny takovým způsobem,: součet hodnot (sloupec HODNOTA) z konkrétní značky v určité kategorii vydělí součtem hodnot z celé kategorie. Například, "ROTHMANS" je v kategorii CIG, součet hodnot je 319.92, součtu pro celou CIG kategorie je 2285,56, takže PODÍL=14%. A to by měla být vypočtena v každém případě. Myslím, že knihovna dplyr může být vhodné, ale nemůžu najít řešení.