Skrivet av Kilroy:
Jag har sällan känt mig så korkad som när jag faktiskt förstod att det där trappstegsresonemanget bara är trams och såg det bevisat på ett väldigt enkelt sätt.
Och det är ju självklart, det digitala trappsteget vi ser är en representation av en analog vågsignal, det kan inte vara trappsteg!
Samma sak med det argumentet kring halva steg osv, om man har 2 efterföljande digitala punkter med samma värde som är sammankopplade via en vågsignal så kommer vågen ta det halva steget även om dom digitala representationerna inte visar det.
Eller har jag missförstått den biten?
Det är inte helt uppenbart, men det hör långsökt ihop med att den digitala samplingen är bandbreddsbegränsad. Som Monty ritar vid 07:06 i video 2 så skulle man ju kunna tänka sig vilka kringelikrokiga vågformer som helst som skulle kunna passa en viss digital sampling, men i och med att signalen är bandbreddsbegränsad så finns det en unik vågrepresentation (unika koefficienter till Fourierbasfunktioner, om man så vill) som passar under den givna bandbreddsbegränsningen. Vad Nyquist ger oss är att den maximala frekvensen som är representerbar är kopplad till samplingsfrekvensen, där samplingsfrekvensen måste vara mer än dubbelt så stor som våglängden för att den ska kunna representeras (det är en strikt olikhet i gränsen, vilket är viktigt; inte minst för min bild nedan ). 44.1 kHz som på en CD ger att frekvenskomponenter på < 22.05 kHz kan representeras exakt genom de punkter som lagrats. Om man redan i remasterprocessen då "skär av" (bandbreddsbegränsar) ljudet till detta (det är ändå över vad människan kan höra), så kommer den digitala avbilden avforma signalen exakt rätt (bortsett från det kvantiserade bitdjupet, men det gör i praktiken ingen skillnad för örat).
Låt säga att man har två digitala samplade punkter, och det förekommer en frekvenskomponent som "studsar till" precis "mellan" dessa två. Först en implementationsdetalj: en reell samplingsmetod kommer av naturen "integrera" signalen över en kort period vilket gör att punkterna på var sin sida om denna impuls måhända kommer registrera ett högre värde än det exakt momentana värdet. En jämförbar effekt kan man se om man skalar en bild till halva upplösningen med t ex gaussisk interpolation: en vertikal svart linje på vit bakgrund som var en pixel bred i originalupplösningen försvinner i sig, men samplingspunkterna runt omkring påverkas, och man får en gråaktig "rest", där punkterna runt "signalen" har "integrerat" den ursprungliga "impulsen". I praktiken så kan utrustning inte registrera ett perfekt momentant värde precis där samplingsmetoden triggar — stig- och falltid hos utrustning påverkar mätningen. I praktiken kan detta säkert bli "ganska bra", men det är en detalj som kan vara bra att nämna, för att ha en mer praktisk koppling till vad som händer.
Men bortsett från det: en signal som "studsar" till på det sättet skulle beskriva en komponent i frekvensspektrat som var utanför bandbreddsbegränsningen, och därmed inte kunna representeras för den givna samplingsfrekvensen. I fallet vinyl vs CD så skulle denna impuls än mindre kunna representeras på vinylskivan av rent materialtekniska begränsningar, så det är inget "problem", och i och med att CD:n representerar alla frekvenser inom mänsklig hörsel så skulle denna impuls inte ens kunna höras "live". Detta är alltså inget inneboende "analog vs digital"-problem, utan en implementationsdetalj. Det är bra mycket enklare att få bättre allmänna egenskaper hos digital än analog utrustning idag.
Däremot, så bara för att två samplingar i rad i en lång representation är av samma magnitud så betyder inte det att D/A-omvandlaren kommer binda samma dessa med en "rak linje", utan det beror på omgivande punkter. Ett exempel är att tänka sig en vågtopp i en perfekt sinuskurva som råkar hamna symmetriskt mellan två samplingspunkter: den "riktiga" toppen kommer ligga högre än dessa samplingspunkter, men så länge kurvan som beskrivs har en frekvens lägre än Nyquists kriterium så kommer den kunna återskapas perfekt, inklusive sin "kulle" mellan dessa punkter.
Nyquists gräns är ganska naturlig om man tänker på en ideal sinuskurva: säg att man tar viss mängd samplingar och dessa alla ger värde 0. En möjlig representation av detta är just en "identiskt noll"-signal hela vägen. Men en annan möjlig signal är ju just A sin(π t f), där t är samplingstiden, f samplingsfrekvensen och A en godtycklig amplitud. Denna funktion kommer också vara 0 precis varje gång vi samplar! Därtill kommer alla heltalsmultipler av vinkelargumentet. Försöker mig på en hophackad bild, med sampling varannan tidsenhet och några kurvor inritade:
Alla uppritade signaler i bilden ovan passar in var för sig på mätpunkterna. Eftersom A kunde väljas godtycklig och alla heltalsmultipler av frekvensen också duger så finns det oändligt många signaler som passar in utanför Nyquistkriteriet: det är därför vi måste bandbreddsbegränsa, och vid återskapning säga: "strunta i att försöka passa in signaler över denna frekvens: vi kunde ändå inte fånga upp dem entydigt när vi samplade".
Vad Nyquist också säger, vilket inte är helt uppenbart, är att alla signaler med en frekvens lägre än den högsta kurvan i grafen skulle gå att återskapa exakt med samplingsfrekvensen ovan, och även alla kombinationer av sådana signaler. "Exakt" antar "oändligt" bitdjup, men det är också en implementationsdetalj som inte är en begränsning i Nyquists utsaga. 16 bitar är gott och väl nog för ljud avsett för mänskliga örat.
Om vi inte följer Nyquists råd så får vi så kallad aliasing (på ett datorforum så känner många säkert till begreppet "anti-aliasing"). Alla kurvor i bilden ovan är exempel på aliaskurvor, dvs kurvor som alla passar in på en viss sampling. Den länkade Wikipediaartikeln har en alternativ bild för samma sak, där både blå och röd signal skulle passa in på givna datapunkter (där röd alltså är bortom Nyquists gräns):
Jag slutar här. Kom på alldeles nyss att man kanske borde börjat med Fouriers försäkran om att man kan bygga upp vilken funktion som helst (nåja) utifrån dess oscillerande frekvenskomponenter (då dessa bildar en fullständig bas). Någonstans i textkaskaden fanns kanske svaret på frågan, och troligen mycket som inte var direkt relevant till just denna . Trots att det var många ord så är det långt ifrån fullständigt, men förhoppningsvis inte rent av felaktigt (åtminstone inte så att min förmåga kan upptäcka det).