Můj úkol je dostat celkové příchozí vede pro skupinu zákazníků, vede po měsíci pro stejnou skupinu zákazníků a konverzní poměr z těchto zájemců.
Dataset jsem vytáhl ze je 20 milionů záznamů, takže nemůžu dotazu na celou věc. Úspěšně jsem udělal první krok (získání celkem vést počítat pro každou org s tímto:
inbound_leads <- domo_get_query('6d969e8b-fe3e-46ca-9ba2-21106452eee2',
auto_limit = TRUE,
query = "select org_id,
COUNT(*)
from table
GROUP BY org_id
ORDER BY org_id"
DOMO je bi nástroj projedu a domo_get_query je interní funkce, z vlastní knihovna má společnost postavena. To trvá dotaz argument, který je mysql query)a různé další, které nejsou teď důležité.
vzorek dat vypadá takto:
org_id, inserted_at, lead_converted_at
1 10/17/2021 2021-01-27T03:39:03
2 10/18/2021 2021-01-28T03:39:03
1 10/17/2021 2021-01-28T03:39:03
3 10/19/2021 2021-01-29T03:39:03
2 10/18/2021 2021-01-29T03:39:03
Podíval jsem se přes mnoho agregace, on-line výukových programů, ale žádný z nich se zdá jít nad tím, jak získat údaje potřebné pre-agregace (např. počet zájemců za měsíc na org, které není možné jednou agregace došlo, protože ve výše uvedeném vzorku agregace by odstranit schopnost vidět více než jednu instanci org_id 1 například) ze souboru dat, které musí být seskupeny v pořadí, které mají být přístupné na prvním místě. Možná jsem prostě nechápu to dost znát správné otázky klást. Libovolném směru ocenil.