Trénoval jsem a BERTE model pomocí pytorch asi milion textových dat na klasifikaci úkol. Po testování, tento model s novými daty jsem se Falešně Pozitivních a Falešně Negativních výsledků. Teď chci přeškolit stávající model pouze s FN a FP. Nechci se připojit FN a FP na existující dataset a pak vlak celý model znovu. Jak mohu rekvalifikovat to berte pouze model s těmito FN a Fp přes previosuly vyškolených modelu.
0
Bez znalosti kódu pro váš vlak smyčky, nápad by to vypadat nějak takhle po tréninku:
results = model(data)
wrong_datapoints = []
for i, result in enumerate(results)
if result != labels[i]:
wrong_datapoints.append((data[i],labels[i]))
(data_new, labels_new) = list(zip(*wrong_datapoints))
model.train(data_new, labels_new)
Pokud chcete něco více konkrétního, budete muset poskytnout kódu své aktuální vlakové smyčky.
děkuji vám za zpětnou vazbu. Ale chci, aby model, verzi, od té doby trénujeme každý týden, budeme model verze. A také iterace milion záznamů bude trvat hodně času. Přemýšlel jsem, že načítání předchozí verze bin soubor(v1.0) a pak přeškolit to pouze s novým datapoints vytvořit další verzi v2.0
Patricia
Možná budete chtít vyjasnit vaši otázku státu. Nicméně, dělat verzí neodstraňuje potřebu sledovat výsledky datových bodů po tréninku, vyžadující jeden smyčku přes vlak data po tréninku je hotovo. Musíte zjistit, jaké "nové datapoints" jsou, po tom všem.
Kroshtan