Nvidias forskare ökar kvaliteten på videosamtal med AI

Permalänk
Medlem
Skrivet av talonmas:

Hur kan folk tycka att 90% reducering av bandbredden är något dåligt? Vad vill ni ha för att en ny teknik ska vara bra?

Har ni redan glömt att världen skruvade ner alla inställningar för att spara bandbredd i somras? Misstänker att ni tänker utifrån ert eget perspektiv och inte ser till den globala användningen kanske?

This. Precis som du säger är vi välsignade med en väldigt bra infrastruktur i Sverige. Har ingen här rest utomlands?

Crappy hotell Wifi eller överbelastade radionät är fortfarande en verklighet i "typ" hela världen.

Permalänk
Medlem

Jag har en bättre idé: ha ingen kamera alls. Bandbreddsreducering: 100%. Jag: 1, Nvidia: 0.

Nej, men tekniken i sig är väl lite intressant, omän väldigt begränsad.

Visa signatur

5950X, 3090

Permalänk
Medlem

Känns som det finns risk för att kusliga dalen kan infinna sig.

Permalänk
Medlem
Skrivet av xpanterx:

Imponerande, undrar om detta kan användas på övervakningskameror, film på brottslingar brukar se ut som minecraft ungefär...

Nej, för AI måste ändå gissa sig fram till hur bilden "ska" se ut. Nog för att den är bra på att gissa, givet att den vet hur en människa ska se ut, men den kan inte veta hur en viss enskild människa ser ut.

edit:
Förr sa man att video/bild inte kan förbättras förbi en viss gräns, för den innehåller helt enkelt inte tillräckligt med information. Bildförbättring var ju egentligen bara att man förstärker vissa saker som redan finns i bilden, men man kan aldrig skapa nytt.
Nu med AI så kan man komma förbi den gränsen, givet att man tar med information om saker som man känner till om världen vi lever i. T.ex just information om hur en människa brukar se ut, hur träd brukar se ut, hur bilar och föremål brukar se ut. Detta gör att man kan skapa bilder som är skarpa och fina, MEN den nya informationen är nödvändigtvis inte rätt information. Du kan få en bra bild på EN människa, men du får inte en bra bild på RÄTT människa. Ju mer information saknas i originalet, desto mer måste AIn gissa och desto mindre "rätt människa" får man som resultat. Detta är oerhört viktigt i just övervakningsbilder på brottslingar.

Permalänk
Medlem

Coolt om vi landar i ett läge i framtiden då bara våra ai-gubbar sitter och har möten med varandra. Och vi....ja jag vete fanken, vi målar väl tavlor eller nått.

Permalänk
Sötast

I samarbete med Apple, så de slapp sätta i nya webbkameror i sina laptops?

Permalänk
Medlem
Skrivet av backfeed:

Jag har en bättre idé: ha ingen kamera alls. Bandbreddsreducering: 100%. Jag: 1, Nvidia: 0.

Nej, men tekniken i sig är väl lite intressant, omän väldigt begränsad.

Känns som vi redan är där i många fall. Majoriteten av alla möten jag haft är med mötesdeltagare som valt att stänga av kameran. Jobba hemifrån görs nog rätt mycket i kalsonger

Visa signatur

There are two kinds of people: 1. Those that can extrapolate from incomplete data.
Min tråkiga hemsida om mitt bygge och lite annat smått o gott: www.2x3m4u.net

Permalänk
Medlem
Skrivet av medbor:

Alltså bara för att det går så betyder det inte att det ska göras, vad händer när man vill visa något annat än sitt ansikte eller bara snurrar på stolen? Kan man ens gapa eller visa ansiktsuttryck?

Sitter alla på 2G eller vad är problemet? Detta hade behövts på 80-talet med modem, men känns lite overkill idag när man har flera megabit över större delen av jorden och Starlink och liknande lösningar kommer allt närmare...

Detta är ju bara ’Animojis’ eller vad apple kallade dem, men med dig själv? Meh...

Dels är det bra många människor som inte har tillgång till snabbt internet idag och Starlink kommer inte precis vara globalt imorgon.

Men det finns en annan potentiell fördel för hemarbete även hos folk med bra internet. Där jag jobbar är det problem då och då med att bandbredden till företaget inte räcker till, speciellt om det är många som behöver VPN + videomöten samtidigt. Att spara bandbredd är kanske inte så viktigt för den som sitter hemma, men VPN servern som behöver hantera 1000 tals remotearbetare som har videosamtal + vanliga arbete (filservern, intranät etc) kommer definitivt uppskatta en reduktion i behövd bandbredd.

Permalänk
Medlem
Skrivet av Superolle:

This. Precis som du säger är vi välsignade med en väldigt bra infrastruktur i Sverige. Har ingen här rest utomlands?

Crappy hotell Wifi eller överbelastade radionät är fortfarande en verklighet i "typ" hela världen.

Dude, Do noooot use crappy hotell wifi!
Gäller visserligen all hotell wifi istort sett.

Visa signatur

TV: LGOLED65B1
PC:
Corsair Crystal 570X - ASUS ROG Strix B560-A GAMING - i9 11900K - ZOTAC 3080Ti AMP EXTREME HOLO - SAMSUNG 960 EVO 250GB - WD Blue SSD 1,5tb RAID - Corsair Vengeance RGB PRO DDR4 3600MHz 32GB - Corsair RM1000i - ASUS VG27BQ - Steel Series Apex Pro - Steel Series Rival 5.
Mobil: OnePlus 10 Pro

Permalänk
Medlem
Skrivet av Pzyber:

Heeeelt fantastiskt klipp hahaha

Visa signatur

TV: LGOLED65B1
PC:
Corsair Crystal 570X - ASUS ROG Strix B560-A GAMING - i9 11900K - ZOTAC 3080Ti AMP EXTREME HOLO - SAMSUNG 960 EVO 250GB - WD Blue SSD 1,5tb RAID - Corsair Vengeance RGB PRO DDR4 3600MHz 32GB - Corsair RM1000i - ASUS VG27BQ - Steel Series Apex Pro - Steel Series Rival 5.
Mobil: OnePlus 10 Pro

Permalänk
Medlem

Hoppas detta kan användas när man har filmat ett eventuellt spöke eller ett UFO.

Alltid när det kommer ett sådant klipp ser det ut som om det filmades med en potatis från 1800 talet.

Visa signatur

There is grandeur in this view of life, with its several powers, having been originally breathed into a few forms or into one; and that whilst this planet has gone cycling on according to the fixed law of gravity, from so simple a beginning endless forms most beautiful and most wonderful have been, and are being, evolved.

Permalänk
Medlem

Nästa steg är att det räcker med en profilbild i Teams och så sköts det på klientsidan så att alla som pratar blir videomaterial med lipsynk. Alltså ingen video som skickas över nätverket.

Visa signatur

Windows 11 Pro | Intel i7 8700 | ASUS Prime Z370-P | Corsair 16GB 3000MHz | ASUS GTX 1080 | Fractal Design Define S | Corsair RM750x | Hyper 212 EVO

Permalänk
Sötast

För en svensk slutanvändare så kanske det kvittar om det kostar 90kb/s eller 10kb/s för ett röstsamtal.

Men för ett företag med 30.000 anställda och 200.000 slutanvändare så är det en kostnadsreducering på 9x på datatrafiken vilket kan resultera i enorma kostnadsbesparingar.

(Självklart är exemplet endast ett exempel och används endast för att peta fram en poäng)

Trafik är inte billigt

Permalänk
Medlem

Påminner mig om en redditpost...

I upscaled and colorized the footage about the earliest born person ever (1905) to be caught on film which was posted online yesterday by u/Ainsley-Sorsby

https://imgur.com/Nhux2qU

Permalänk

Jag trodde "måla efter nummer" var den bästa tekniken.

Visa signatur

Alfred E. Neuman

Permalänk
Medlem
Skrivet av medbor:

Alltså bara för att det går så betyder det inte att det ska göras, vad händer när man vill visa något annat än sitt ansikte eller bara snurrar på stolen? Kan man ens gapa eller visa ansiktsuttryck?

Sitter alla på 2G eller vad är problemet? Detta hade behövts på 80-talet med modem, men känns lite overkill idag när man har flera megabit över större delen av jorden och Starlink och liknande lösningar kommer allt närmare...

Detta är ju bara ’Animojis’ eller vad apple kallade dem, men med dig själv? Meh...

Använder du videosamtal i jobbet?
Idag satt jag med en polack där det inte gick att dela skärm, allt annat än ljud så dök hans lina.
En svensk kollega fick stänga av videon förra vecka för ljudet bara klippte annars.
Det är mer regel än undantag att någon har problem med anslutningen på jobbet.

Nu beror det nog mer på deras sunkiga wifin än begränsning i uppkoppling men det här hjälper ju till med att lösa problemet oavsett.

Visa signatur

"When I get sad, I stop being sad and be awsome instead, true story."

Permalänk
Medlem
Citat:

Med hjälp av tekniken kan en enskild bildruta i en videoström reduceras från cirka 97 kilobyte till endast 0,1 kilobyte

97 kB/frame är drygt 23 Mbps vid 30 fps. För en extremt lågupplöst statisk video med riktigt usel kvalitet. En 4K-stream på Netflix har lägre bitrate och löjligt mycket bättre bildkvalitet.

🤔

Visa signatur

Assembly är ett högnivåspråk.

Permalänk
Keeper of the Bamse
Skrivet av Tea42BBS:

jag vill ha Pro-varianten, där man säger "Start Lazze v2.0" och så ritar AIn upp mig när jag dricker kaffe och frågar hur alla mår och ber om status. Svaren som kommer in, blir automagiskt antecknade i min Onenote

// Lazze...sAI

Du skämtar, men detta finns tyyyyp idag. Det var en kille som var så trött på att sitta i telefonmöten, så han skrev en bot som gjorde speech-to-text via IBMs Watsons med öppna APIer.

Sen när någon säger hans namn så triggas ett meddelande på hans skärm och han får dom senaste 60 sekundrarna av mötet i textformat, och spelar automatiskt upp en ljudfil som säger "sorry, I was on mute". På så sätt fick han 15 sekunder på sig att läsa ifatt sig i det som hade sagts i mötet, och han behövde inte sitta och lyssna!

https://github.com/joshnewlan/say_what

"This script listens to meetings I'm supposed to be paying attention to and pings me on hipchat when my name is mentioned.

It sends me a transcript of what was said in the minute before my name was mentioned and some time after.

It also plays an audio file out loud 15 seconds after my name was mentioned which is a recording of me saying, "Sorry, I didn't realize my mic was on mute there.""

Visa signatur

i7 10770K, NH-D15. 16GB corsair. RTX 3080. 3TB nvme. Samsung G9. Fractal Torrent Compact. Corsair RM850.
Logitech G pro wireless mouse. Logitech TKL915 wireless. Logitech Pro X Wireless.
Macbook pro M1 (16GB, 512GB). HP Reverb G2.
www.bamseclockers.com

Permalänk
Medlem

Döballt men vilken hårdvara behöver klienterna för detta ? låter ju inte direkt som något du gör på en chromebook.

Visa signatur

CPU: 5600x
GPU: 3080
RAM: 32GB

Sluta gömma din identitet, skaffa en till istället

Permalänk
Medlem
Skrivet av Pzyber:

Tekniken har blivit så bra att du inte upptäckte att det inte är det riktiga klippet , utan något som någon gjort för någon kurs...

Det riktiga klippet gick inte och hitta på youtube, så jag fick länka till dailymotion istället...

Permalänk
Medlem

Undrar om den hade fått bilder inmatade tidigare eller om den "bara" kopierade hans vänstra sida av ansiktet och klistrade in det på hans högra sida.
Bra som sagt om det kan minska bandbreddskravet, men vad krävs det för hårdvara.

240p p-rullar i 4k snart (●'◡'●)

Dold text
Visa signatur

www.fckdrm.com - DRM år 2024? Ha pyttsan.

Permalänk
Medlem
Skrivet av Joppis:

Nästa steg är att det räcker med en profilbild i Teams och så sköts det på klientsidan så att alla som pratar blir videomaterial med lipsynk. Alltså ingen video som skickas över nätverket.

...Och efter det har AIn möte med sig själva, så kan man jobba istället för att gå på möten

Permalänk
Medlem
Skrivet av medbor:

Alltså bara för att det går så betyder det inte att det ska göras, vad händer när man vill visa något annat än sitt ansikte eller bara snurrar på stolen? Kan man ens gapa eller visa ansiktsuttryck?

Sitter alla på 2G eller vad är problemet? Detta hade behövts på 80-talet med modem, men känns lite overkill idag när man har flera megabit över större delen av jorden och Starlink och liknande lösningar kommer allt närmare...

Detta är ju bara ’Animojis’ eller vad apple kallade dem, men med dig själv? Meh...

Nu börjar jag undra, är det bara min krets som tidivs har problem med video kvailitet i samtal(teams, messanger o.s.v)? Jag skulle säga att minst hälften av mötena uppvisar någon form av problem med bilden. Oftast är dock inte kvalitén avgörande i dessa samtal, bara att man ser varandra.

Om saker kan bli bättre, varför inte? Det tar oss kanske en bit närmare framtidien och kanske bidrar det till något avgörande.

Visa signatur

CPU : AMD Ryzen 5 5600X Moderkort : ASUS ROG Strix B550-F GAMING Grafikkort :EVGA GeForce GTX 1080 Ti FTW3 iCX Gaming HDMI 3xDP 11GBMinne : Corsair 16GB Chassi :Fractal Design Define 7 Compact Nätdel : Corsair RM750x Skärm #1 : Asus VG349Q Ultrawide Skärm #2 : Acer X34 Ultrawide

Permalänk
Medlem
Skrivet av Don_Tool:

Nice! Snart är vi där gamla spionfilmer är. Du säger bara Enhance, och sedan gör AI resten

Visa signatur

Intel i5 12600K | Asus TUF Gaming Z690-Plus D4 | Asus Geforce RTX 3060 Ti | 32 GB DDR4 | Fractal Design North | Corsair iCue Link H100i | Cooler Master V750 Gold i Multi

Permalänk
Medlem
Skrivet av lillaankan_i_dammen:

Jag åker också tåg, där ett ställe där tusentals pendlar varje dag. 10 minuter av resan är mottagningen så dåligt så det ej går att ringa riktigt med 2G nätet, samtal avbrytts, brus, ibland går det ej ringa alls.
Orsak. Det är glesbyggd och de har sprängt och byggt spåret så det är nedsänkt. Man ser inte ett skit mer än bergväggar och liknande när man tittar ut. Tåget går dock i nästan 200km/h, så spåret är ej dåligt.

Absolut! Men även denna teknik kräver ju kontinuerlig och stabil uppkoppling, den reducerar bara datatrafiken, så kommer inte nödvändigtvis hjälpa mycket i ett sådant scenario.

Alla klienter jag använt senaste åren reducerar redan kvalitet om länken blir sämre, så länge ljudet är okej så är resten sekundärt. Inte så man sitter och kollar efter varandras smilgropar på mötena. Dessutom kräver detta aktivering av gpu och/eller mer cpu/ai att räkna ut allt. Inte alls säkert att det förbättrar t.ex. batteri

Permalänk
Medlem
Skrivet av Söderbäck:

Relevant i sammanhanget är att även fiber byggs ut - och nya trådlösa tekniker så som 5G rullas ut för att klara morgondagens efterfrågan på bandbredd. Hade 4Gnätet inte byggts ut utan vi bara hade haft 3Gnätet för trådlös uppkoppling så hade din 3Guppkoppling laddat bilder pixelrad för pixelrad i dagsläget. För nätet hade varit tokigt överbelastat. Vi hade alltså fått sämre uppkoppling med tiden.

"Jaha - men det har väl inte med saken att göra?"

Mjaa. Jo men det finns en intressant koppling här.
Vi blir konstant fler och fler som använder nätet till mer saker hela tiden. Och tjänsterna som används slukar även mer data för varje år. För att hantera det här kan man effektivisera på lite olika sätt. Ett sätt är vad jag nämnde ovan. Bygg ut mer infrastruktur som klarar fler användare.
Men man kan även angripa problemet från andra hållet. Minska dataanvändningen med mer effektiva överföringsmetoder.
Samma typ av fördelar kan ses när bättre video codecs används. Mindre data behöver överföras för att få över samma kvalité som tidigare.

På individnivå är det här kanske mindre intressant.
Men för infrastrukturen gör det en enorm skillnad om exempelvis allt videomaterial använder 20% eller 50% mindre data över alla "motorvägar" för internetuppkoppling.

Du har så klart rätt i sak och till viss del, men den realistiska skillnaden på just denna nyhet är väl inte ens en promille av total bandbredd?

Har man inget att visa har man kameran avstängd oftast, ingen vill se dina kalsonger...

Dessutom är det sällan folk sitter still med ansiktet som enda rörliga del, det kommer in händer, kaffekoppar, ... dessa saker optimeras inte här.

Som jag sagt i ett annat svar så krävs ju fortfarande en stabil länk med låg latens oavsett, då brukar det också finnas tillgång till lagom mängd bandbredd.

Hade detta kunnat appliceras mer generellt hade jag absolut sett det som mer positivt, men som det presenteras här är det i det närmaste meningslöst. Tekniken kan säkert generaliseras en del för framtiden och ska bli intressant att se vad det blir av det om vi nu får höra om det igen alls.

Just nu känns detta bara som ett sett att få ut Nvidias varumärke utanför nördar och att de ska kännas relevanta för dagens problem. Tror de kommer vara nöjda med denna våg av press (som de även fick för rtx-audio eller vad det hette)

Pessimistisk kanske, men svårt att se att det kommer magiskt förändra världen...

Permalänk
Medlem
Skrivet av cheben:

Dels är det bra många människor som inte har tillgång till snabbt internet idag och Starlink kommer inte precis vara globalt imorgon.

Men det finns en annan potentiell fördel för hemarbete även hos folk med bra internet. Där jag jobbar är det problem då och då med att bandbredden till företaget inte räcker till, speciellt om det är många som behöver VPN + videomöten samtidigt. Att spara bandbredd är kanske inte så viktigt för den som sitter hemma, men VPN servern som behöver hantera 1000 tals remotearbetare som har videosamtal + vanliga arbete (filservern, intranät etc) kommer definitivt uppskatta en reduktion i behövd bandbredd.

Bra poäng!

Dock känns det ju som dags att uppgradera er it om ni ens riskerar sådana problem... personal-timmar kostar mycket om de läggs på väntetider och annat onödigt.

Jag menade inte alls att tekniken är helt meningslös till allt, bara att det är lätt att missa att det är ett extremt smalt användningsområde och att det lätt övertolkas vad detta kan åstadkomma.

Främst ville jag skapa lite diskussion, och det är alltid kul att läsa andras perspektiv

Permalänk
Medlem
Skrivet av xpanterx:

Imponerande, undrar om detta kan användas på övervakningskameror, film på brottslingar brukar se ut som minecraft ungefär...

Då sätter dom väl dit varenda jävel

Permalänk
Medlem
Skrivet av Neon:

Nu börjar jag undra, är det bara min krets som tidivs har problem med video kvailitet i samtal(teams, messanger o.s.v)? Jag skulle säga att minst hälften av mötena uppvisar någon form av problem med bilden. Oftast är dock inte kvalitén avgörande i dessa samtal, bara att man ser varandra.

Om saker kan bli bättre, varför inte? Det tar oss kanske en bit närmare framtidien och kanske bidrar det till något avgörande.

Det är inte min erfarenhet och jag kör bara 4G nu för tiden. Men mitt bolag kör inte VPN så mycket längre kanske har med det att göra? Eller så är det teams som är överlägset?

Permalänk
Hedersmedlem
Skrivet av medbor:

Du har så klart rätt i sak och till viss del, men den realistiska skillnaden på just denna nyhet är väl inte ens en promille av total bandbredd?

Har man inget att visa har man kameran avstängd oftast, ingen vill se dina kalsonger...

Dessutom är det sällan folk sitter still med ansiktet som enda rörliga del, det kommer in händer, kaffekoppar, ... dessa saker optimeras inte här.

Som jag sagt i ett annat svar så krävs ju fortfarande en stabil länk med låg latens oavsett, då brukar det också finnas tillgång till lagom mängd bandbredd.

Hade detta kunnat appliceras mer generellt hade jag absolut sett det som mer positivt, men som det presenteras här är det i det närmaste meningslöst. Tekniken kan säkert generaliseras en del för framtiden och ska bli intressant att se vad det blir av det om vi nu får höra om det igen alls.

Just nu känns detta bara som ett sett att få ut Nvidias varumärke utanför nördar och att de ska kännas relevanta för dagens problem. Tror de kommer vara nöjda med denna våg av press (som de även fick för rtx-audio eller vad det hette)

Pessimistisk kanske, men svårt att se att det kommer magiskt förändra världen...

Det är väl högst vettiga funderingar från ditt håll tycker jag.

För de som faktiskt sitter med sämre uppkoppling idag - och kommande år kan det säkert göra relevant skillnad. Rätt vanligt med halvsjaskig uppkoppling på global nivå ändå ;).
Jag har exempelvis gigabit till hemmet - men jobbdatorn är långt bort med wifi så jag har rätt så knackig lina för just jobbdatorn.

Om man får gissa lite så tror jag bara vi är i början när det kommer till att förbättra bildkvalité med AI i alla möjliga sammahang. Går väl egentligen att tillämpa på all rörlig bild - och även stillbilder på lite olika sätt.
Aja - vi får väl se vad som händer här närmsta åren

Visa signatur

🎮 → Node 304 • Ryzen 5 2600 + Nh-D14 • Gainward RTX 2070 • 32GB DDR4 • MSI B450I Gaming Plus AC
🖥️ → Acer Nitro XV273K Pbmiipphzx • 🥽 → VR: Samsung HMD Odyssey+
🎧 → Steelseries arctic 7 2019
🖱️ → Logitech g603 | ⌨️ → Logitech MX Keys
💻 → Lenovo Yoga slim 7 pro 14" Oled