Byl jsem čtení článků a dokumentace, prohlížení videa z youtube, atd a nemohu najít proces použít tidymodels workflow pro on-průběžně.
Například, https://tune.tidymodels.org/reference/last_fit.html předepisuje "dalším krokem by mělo být, aby se vešly použití celé trénovací množiny a ověření výkonnosti pomocí testovací data."
Chci naladit model s školení/zkoušek, údaje o vytvoření last_fit, a pak aplikovat na data, pro které je výkon nemůže být ověřeny, protože není označené/nemá výsledek.
V mém konkrétním případě jsem vytvořil klasifikaci modelu předpovědět, zda konkrétní výrobek předplatné bude chrlit nebo obnovit. V předstihu, řekněme, 30 dnů, chci vytvořit predikci pro dané předplatné je výsledek (nebo pro všechny odběry, které vyprší v příštích 30 dnech).
Pokud můžu říct, rsample
neobsahuje způsob, jak rozdělit data tímto způsobem, nebo ještě bych to udělal. Cítím, že musí být něco chybí jednoduché, ale mohu jen najít příklady, kdy lidé používají zcela označené data.
extract_workflow()
a dělat, že konečné wf, bylo to, co jsem potřeboval a nenašel. Nyní problém mám, je, že některé z transformací z receptu, který jsem použil na rozdělení dat je třeba udělat na moje předpověď set. Pro jednoduchost, můžete se zaměřit na jednom: já používámstep_dummy(all_nominal_predictors())
. Jak mohu použít to, aby moje nová data? Zkoušel jsem dělat kopii receptu, uplatnění na mé nové údaje, a pak workflow z toho ale objekt vytváří není workflow a nemůžu se přidal dofinal_wf