K-Nearest Neighbor och träningsdata

Trädvy Permalänk
Avstängd
Plats
Uppsala
Registrerad
Nov 2016

K-Nearest Neighbor och träningsdata

Hej.

Någon som vet vilken mängd träningsdata som är normalt för att få en bra träffsäkerhet i K-Nearest Neighbor?

Har använt språket R för att göra lite "småtester" enligt nedan.

Jag har en datamängd på 216st observationer.

När 100st av dem är träningsdata och 116st är testdatan så blir träffsäkerheten 89%

När jag använder 140st av dem som träningsdata så blir träffsäkerheten 100% enligt nedan

Hur brukar man fördela tränings VS testdata?