Finskt företag vill göra din processor 100 gånger snabbare

Permalänk
Melding Plague

Finskt företag vill göra din processor 100 gånger snabbare

Flow Computing vill se sin PPU som en del av de stora tillverkarnas processorer.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Hmm tror inte på det tills det är bevisat av tredjepart.

Om de har något i närheten av vad de säger skulle många av företagen slängt pengar på dom

Permalänk
Medlem

"Däremot är det svårt att bekräfta Flows påståenden just nu då PPU:n inte finns ännu. Företaget har enbart genomfört simuleringar som visar att tekniken går att utveckla."

Jag menar det finns ju gott om företag som påstår saker som inte lever upp till förväntningarna så jag tar det här med den största skopan salt.

Permalänk
Medlem

Hade ju varit fränt om det var ett instickskort

Visa signatur

JJ2 Multiplayer
JJ2 ZStats

[1] Ryzen 5800X | 5500XT | Kingston A2000 | Lenovo G24-10 144Hz [2] Ryzen 5700G | RX 480 | WD Blue SN550 [3] Ryzen 5600G | Kingston A2000 [4] Ryzen 3600 | GT 740 | 850 EVO [5] Ryzen 3600 | Geforce 405 | 850 EVO (alla är i bruk)

Permalänk
Medlem

Tror vi kommer se det här ungefär samtidigt som Glaze 3D grafikkortet släpps.

Permalänk
Hedersmedlem
Citat:

– Apple skulle exempelvis kunna köra sin nyligen uppvisade Apple Intelligence lokalt på en enhet i stället för att köra den från molnet, säger han.

... men det är ju det de redan gör? Och till stor del därför de har NPU i sina enheter.

Visa signatur

Asus ROG STRIX B550-F / Ryzen 5800X3D / 48 GB 3200 MHz CL14 / Asus TUF 3080 OC / WD SN850 1 TB, Kingston NV1 2 TB + NAS / Corsair RM650x V3 / Acer XB271HU (1440p165) / LG C1 55"
NAS: 6700K/16GB/Debian+ZFS | Backup (offsite): 9600K/16GB/Debian+ZFS

Permalänk
Medlem

"upp till 100ggr snabbare, men fördubbla vilken kod som helst"
Vad är det som gör den bättre än att stoppa in en extra CPU kärna tex? Som också kan öka prestandan teoretiskt med 100%.
I vilket sammanhang är den 100ggr bättre än en till cpu kärna?
Om det är specifik kod som den är optimerad för, som tex AVX512, eller GPU kärna osv, så visst kan det göra skillnad i sådana fall om den är optimerad för den workloaden.
Men i vilka sammanhang är den bättre än att en CPU tillverkare inte bara optimerar någon del av sin CPU till just den workloaden istället?
Sen utöver det så finns det ju massor av flaskhalsar om man inte integrerar denna på samma kisel som en CPU, eller chiplet nära CPUn.

Visa signatur

Citera för svar!
9800X3D, ASUS ROG STRIX B650E-F, 32gb @6000 CL30, RTX 4080s FE

Permalänk
Medlem

Detta är väl bara en GPU?

Permalänk
Festpilot 2020, Antiallo

Verkar vara ett luftslott, inte minst så som det är upplagt "Gör alla chip 100x snabbare". Det förutsätter att det inte finns några bottle-necks alls idag.

Om de har något konkret att komma med så borde de väl skrivit det på sin hemsida?

Visa signatur

 | PM:a Moderatorerna | Kontaktformuläret | Geeks Discord |
Testpilot, Skribent, Moderator & Geeks Gaming Huvudadmin

Permalänk
Medlem
Skrivet av Thomas:

... men det är ju det de redan gör? Och till stor del därför de har NPU i sina enheter.

Apple kör såvitt jag hört någon hybrid-setup, med enklare modeller lokalt och tyngre grejer som körs i molnet istället.

Se t.ex. https://www.theverge.com/2024/6/13/24175985/apple-intelligenc...

Visa signatur

Desktop spel m.m.: Ryzen 9800X3D || MSI X870 Tomahawk Wifi || MSI Ventus 3x 5080 || Gskill FlareX 6000 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Arbetsstation: Ryzen 7945HX || Minisforum BD790i || Asus Proart 4070 Ti Super || Kingston Fury Impact 5600 65 GB || WD SN850 2TB || Samsung 990 Pro 2TB || Fractal Ridge
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem
Skrivet av maweric:

Hade ju varit fränt om det var ett instickskort

Justfan, jag måste ju köpa en PCIe-hubb så jag får plats med fler PPUer! Attans att jag inte körde eATX från början...

Visa signatur

Ryzen 7 7800X3D | RTX 3070 | 2x32GB DDR5-5600 | B650M Pro RS WiFi
Define R5 Blackout | Noctua NH-U14S | EVGA G2 SuperNOVA 850W
G502 Proteus Spectrum | Vortex Pok3r RGB

Permalänk
Medlem
Skrivet av medbor:

Detta är väl bara en GPU?

Nej?

Däremot luktar det ormolja. Men vi får se.

Permalänk
Medlem
Skrivet av dlq84:

Nej?

Däremot luktar det ormolja. Men vi får se.

Parallell processering av data är ju exakt det en GPU gör, en NPU är samma sak (bara effektivare för att de kör lägre precision)

Nu menar jag beräkningsenheterna alltså, inte allt som finns på ett grafikkort

Permalänk
Festpilot 2020, Antiallo
Skrivet av medbor:

Parallell processering av data är ju exakt det en GPU gör, en NPU är samma sak (bara effektivare för att de kör lägre precision)

Nu menar jag beräkningsenheterna alltså, inte allt som finns på ett grafikkort

Denna beskriver snarare någon form av interleaving av instruktionerna på processorn (vilket förutsätter att critical path inte existerar). Idag är det just critical path som är begränsningen i processorbegränsade instruktioner (hur lång tid tar signal mellan två olika klockade register).

Detta kommer ju inte ändras alls oavsett om man stoppar in en Flow-modul innan eller efter CPU-kedjan. Däremot kan minnesmissar kanske avhjälpas, men det gör man redan till stor del med speculative computing, branch-predictors, prefetch, hyperthreading etc.

Känns snarare som att de försöker pumpa modulerna med fler instruktioner samtidigt som man ska hålla koll på arbetet som trillar ut, något som kommer kosta enormt i statiska förluster (massa extra register), lite som att man gör om varje enskild tråd till något som liknar en SPARC-modul med revolver-design. Fast då kan man ju lika gärna köpa en SPARC-processor....

Visa signatur

 | PM:a Moderatorerna | Kontaktformuläret | Geeks Discord |
Testpilot, Skribent, Moderator & Geeks Gaming Huvudadmin

Permalänk
Medlem

Undrar om de faktiskt förstår hur en processor faktiskt fungerar. Vi löser ju redan paralellisering, till viss del, genom att slänga på flera kärnor, hybridkärnor och hyperthreading. Men även parallelisering har begränsningar, då arbeten måste startas på och synkas med main thread.

Och det kan ingen mirakelkrets/instickskort ändra på.

För att sedan inte tala om prestandaförlusterna som uppstår pga av fysiska avstånd. Det finns en god anledning till varför man har börjat använda sig av processorns eget cache minne för att lagra och hämta data, för att uppnå ökat prestanda med Data Orienterad Programmering.

Visa signatur

| Corsair Obsidian 500D | Intel Core i7-3770K 3.9GHz med Corsair iCUE H115i Elite Capellix XT | Asus Z77 Sabertooth | Corsair Vengeance Pro Black 4x8GB 1866MHz CL9 | 2x EVGA GeForce GTX TITAN X 12GB, SLI | X-Fi Titanium Fatal1ty Pro | Samsung 870 EVO 2TB, Samsung 870 EVO 1TB, 2x Seagate Barracuda 2TB | Corsair AX860i | DELL P991 Trinitron | Windows XP/10 Dual-Boot |

Permalänk
Medlem

släpps den innan Euclideon infinite detail motorn kanske?

*sarkasm

Permalänk
Medlem

Får lite bitboys vibbar av detta

Visa signatur

“When a clown moves into a palace he doesn’t become a king, the palace instead becomes a circus.”

Permalänk
Hedersmedlem
Skrivet av evil penguin:

Apple kör såvitt jag hört någon hybrid-setup, med enklare modeller lokalt och tyngre grejer som körs i molnet istället.

Se t.ex. https://www.theverge.com/2024/6/13/24175985/apple-intelligenc...

Aha, det där hade jag missat. Jag trodde det var lokalt förutom när den (efter att ha frågat användaren) skickade frågan till ChatGPT.

Visa signatur

Asus ROG STRIX B550-F / Ryzen 5800X3D / 48 GB 3200 MHz CL14 / Asus TUF 3080 OC / WD SN850 1 TB, Kingston NV1 2 TB + NAS / Corsair RM650x V3 / Acer XB271HU (1440p165) / LG C1 55"
NAS: 6700K/16GB/Debian+ZFS | Backup (offsite): 9600K/16GB/Debian+ZFS

Permalänk
Medlem
Skrivet av medbor:

Detta är väl bara en GPU?

Tänkte spontant samma tanke, att detta liknar "NPU"-delarna i GPUerna som släpps.
Dvs en beräkningsenhet specialiserad för neurala nät.
Finns i så fall redan i GPUerna sedan ett par generationer tillbaka.
Vad är vinsten att flytta in dem i CPUn?

Permalänk
Medlem
Skrivet av zOlid:

"upp till 100ggr snabbare, men fördubbla vilken kod som helst"
Vad är det som gör den bättre än att stoppa in en extra CPU kärna tex? Som också kan öka prestandan teoretiskt med 100%.
I vilket sammanhang är den 100ggr bättre än en till cpu kärna?

För att 100 ggr inte är samma sak som 100%..

Permalänk
Medlem

När man läser detta så är väl våra hjärnor BPU:er. Bullshit processing units.

Visa signatur

Hur många datorer är för många?

Permalänk
Medlem
Skrivet av Thomas:

Aha, det där hade jag missat. Jag trodde det var lokalt förutom när den (efter att ha frågat användaren) skickade frågan till ChatGPT.

Tycker det låter som att du beskriver i princip samma upplägg (men jag vet inte specifikt vilka bekräftelser som behövs och vilka modeller det kan vara som konsulteras).

Visa signatur

Desktop spel m.m.: Ryzen 9800X3D || MSI X870 Tomahawk Wifi || MSI Ventus 3x 5080 || Gskill FlareX 6000 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Arbetsstation: Ryzen 7945HX || Minisforum BD790i || Asus Proart 4070 Ti Super || Kingston Fury Impact 5600 65 GB || WD SN850 2TB || Samsung 990 Pro 2TB || Fractal Ridge
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem

Den här nyheten känns lite grand som viskleken. En marknadsdrönare har fått något förklarat för sig, och skrivit det han har förstått i ett pressmeddelande. Sen har en nyhets-site återgett det något vinklat fel, och sen har en andra nyhet-site återgett det igen...

Vad det handlar om är en ny slags CPU-arkitektur som är massivt parallell.
Förenklat skulle man kunna säga att processorn gör allt i vektor-enheten.
Vektorlängden är variabel: i vanlig rak kod är den 1, men loopar är i regel vektoriserade.
Sen finns det flera små oortodoxa detaljer i arkitekturen för att kunna vektorisera vanlig kod så långt som möjligt.

Visa signatur

“It is difficult to get a man to understand something, when his salary depends upon his not understanding it!”

Permalänk
Medlem
Skrivet av Findecanor:

Den här nyheten känns lite grand som viskleken. En marknadsdrönare har fått något förklarat för sig, och skrivit det han har förstått i ett pressmeddelande. Sen har en nyhets-site återgett det något vinklat fel, och sen har en andra nyhet-site återgett det igen...

Vad det handlar om är en ny slags CPU-arkitektur som är massivt parallell.
Förenklat skulle man kunna säga att processorn gör allt i vektor-enheten.
Vektorlängden är variabel: i vanlig rak kod är den 1, men loopar är i regel vektoriserade.
Sen finns det flera små oortodoxa detaljer i arkitekturen för att kunna vektorisera vanlig kod så långt som möjligt.

Låter som MMX/SSE/AVX? Det funkar ju inte på (som Sweclockers skriver) "vilken kod som helst". Det här är ju som att läsa Aftonbladet!

Permalänk
Medlem

Lägger den här nyheten under kategorin "intressant men skeptisk"

Permalänk

En miljard biljard kviljarmeter mycket mer kraftfullhet. Ge mig pengar så fåru se

Jag lovar. Lillfinger-lovar till och med.

Permalänk
Medlem
Skrivet av Findecanor:

Den här nyheten känns lite grand som viskleken. En marknadsdrönare har fått något förklarat för sig, och skrivit det han har förstått i ett pressmeddelande. Sen har en nyhets-site återgett det något vinklat fel, och sen har en andra nyhet-site återgett det igen...

Vad det handlar om är en ny slags CPU-arkitektur som är massivt parallell.
Förenklat skulle man kunna säga att processorn gör allt i vektor-enheten.
Vektorlängden är variabel: i vanlig rak kod är den 1, men loopar är i regel vektoriserade.
Sen finns det flera små oortodoxa detaljer i arkitekturen för att kunna vektorisera vanlig kod så långt som möjligt.

Börjar inte det här påminna lite om Itanium, med flera instruktioner kodade i långwords och sedan vektorierat? Det skulle väl vara vektoriseringen som är det nya här då, det andra har ju provats.

Permalänk
Medlem

Tror inte för en sekund på det som tas upp i artikeln, det finns inte ens något konkret bevis utan man hänvisar till simuleringar.
Kom igen nu, vem som helst kan simulera något som är otroligt mycket bättre än det vi har idag, men att omsätta det i en produkt är något helt annat.

Jag killgissar att man söker riskkapitalister i och med detta, bara en dåre skulle investera i en simulerad modell som kanske inte alls går att tillverka i verkligheten.

Permalänk
Medlem

Utan att uttala sig om just detta företag så reagerar jag så fort jag ser "startup företag". Känns som att oftast fungerar enligt principen nedan, dvs TV-Shop (för den spm minns) fast med större summor och man är ball som f-n om man jobbar inom startup.

-Vi är ett Startup företag! Bara den meningen betyder ju att företagets aktie rusade upp 100000000%.

-Vår ide är att teleportera alla människor till Saturnus inom 12 dagar. Det kommer fungera, trust me brooo! Vi vet inte hur än men vi har ju typ 12 dagar på oss.

-Hype, hyyyype, hyyyyyyype!!!!!

-Slår ni till nu så har ni chansen att köpa detta superföretag med alla tillbehör för den ringa summan av 150 miljoner! Men vänta inte för länge för erbjudandet gäller bara under en begränsad tid!

Permalänk
Medlem

"Ja tack!"

Visa signatur

/925

Threadripper 7980x|128Gb Ram|72TB 10GbE Synology Nas|MSI 3090 Suprim|LG UltraWide 38" - Wacom Intuos 3 A3