1. Så många som möjligt. Det är extremt viktigt att datan väl representerar din domän.
2. Så många som du vill kunna klassificera.
3. Se 1.
4. Prova dig fram. Kan vara lämpligt att börja med 500x500 px?
5. Se 1.
Det svåraste med bildigenkänning är inte att träna sin modell, det är att hitta bra data. Det finns företag som bara jobbar med att ta fram högkvalitativ test/träningsdata.
Samtidigt är det ingen idé att lägga ner asmycket tid på att ta fram bra träningsdata, om modellen sedan kommer användas i en miljö där din träningsdata inte längre är representativ. Återigen, det handlar om 1. ovan. Du ska ha så mycket data som möjligt, som representerar din domän.