Skrivet av GuuFi:
Klart jag gör, varför skulle jag se slumpmässigt plockad information som spegling av verkligheten?
Speciellt när man själv och så många andra aldrig får frågan, kanske bara är enstaka procent som får den överhuvudtaget?
Då är det ju ren gissning och sannolikhetsspel, inget man använder som fakta när man har 25 miljoner unika användare dagligen.
Skrivet av SleeZy:
Det fetade som jag inte håller med om.
Det är ju så enkelt att se, om vi säger att vi har 100 miljoner användare denna månaden. 10.000 av dessa får en förfrågan.
Då får du ju endast data för en ytterst liten del. Och att sedan använda denna data som korrekt blir ju fel.
Det lär ju finnas långt över 1 miljon med 1060 t.ex kanske 2 miljoner med 1050. 5 miljoner med 970. Osv osv. Dessa blir ju inte representerade i denna data.
Skrivet av SleeZy:
Jo och det är ju det jag inte köper riktigt. Men känner att jag bara kommer repetera mig själv nu.
Men jag ser inte hur du kan få bra statistik från 100.000 användare när det finns 99 900 000 som aldrig blev tillfrågade.
Inte direkt riktat mot er två, men för alla de som inte tror att på att en korrekt slumpmässigt valt urval inte speglar verkligheten.
Det går att testa pratiskt.
Kan ni programmera?
Skapa en större array med antal olika värden, dra sedan säg 1000 slumpmässigt, helst utan att lägga tillbaka, från den och jämför sedan urvalet med hela populationen. Testa att öka eller minska antalet ni drar.
Som exempel, riksdagsvalet 2018.
Citat:
6.476.725 giltiga röster
fördelade på
M 1.284.698 (19,84%)
C 557.500 (8,61%)
L 355.546 (5,49%)
KD 409.478 (6,32%)
S 1.830.386 (28,26%)
V 518.454 (8,00%)
MP 285.899 (4,41%)
SD 1.135.627 (17,53%)
FI 29.665 (0,46%)
ÖVR 69.472 (1.07%)
Och lite R kod, som man kan testakör här:
https://rdrr.io/snippets/
giltigaroster <- c(
rep('M', 1284698),
rep('C', 557500),
rep('L', 355546),
rep('KD', 409478),
rep('S', 1830386),
rep('V', 518454),
rep('MP', 285899),
rep('SD', 1135627),
rep('FI', 29665),
rep('OVR', 69472)
)
samplesize = 1000;
table(sample(giltigaroster,samplesize,replace = FALSE))/samplesize*100
Som alltid är det värt att påpeka urvalet skall vara korrekt gjort, gör man en opinionsundersökning så går det ju inte bara att ställa sig på Sergels Torg och fråga 1000 förbipasserande hur de kommer att rösta om man vill veta hur hela Sverige kommer att rösta.
Gör man en undersökning gällande hårdvara så kan man inte bara fråga kineser, det skulle bli aningen fel. Men hur Steam utför sin undersökning (antalet som utfrågas varje månad, hur dessa väljs, osv) är mig veterligen inte något de berättar.
När det gäller tex grafikkort i Steam undersökningen, så handlar det om väldigt små andelar och då kommer man behöva fråga fler för att det inte skall flukturera för mycket.
Det är ju klart att ju fler man frågar desto bättre blir uppskattningen, men det innebär ju också en mycket högre kostnad.
-----
Sen så tror jag lite mycket på undersökningar på sweclockers som på aftonbladets hemsida.... Men det är en annan sak...