Nový NN. CNN může být vyškoleni k detekci jednoho objektu v obrázku. Nicméně, co když nějaký obraz v dataset může obsahovat libovolné n # objektů. To může představovat problém CNNs jako výstupní hustá vrstva musí být pevné velikosti? Jak by se ti vyřešit tento problém?
Například: Řekněme, že jsem náhodně vybraných 2 obrázky z této sady. Obrázek 1 má 2 objekty a obrázku 2 má 5 objektů. Y označení pro img1 by obsahovat vymezovací rámeček souřadnice pro 2 objekty; y označení pro img2 by obsahovat souřadnice pro 5 objektů-mnohem větší, y vektor, než img1.
Možné řešení? :
Já bych třeba najít obrázek s největší # objektů (určit tuto hodnotu jako M). Pojďme si také říci, objekt má 4 souřadnice. Pokud M = 5, potřeboval bych y vektor 20. Pokud obrázek obsahuje 1 objekt, y vektor bude obsahovat 4 nenulové hodnoty A 16 nulových hodnot. 4 nenulové hodnoty představují souřadnice a 16 nulové hodnoty představují souřadnice další neexistující objekty.