Nu kan du köra AI-bot lokalt på Nvidias RTX-grafikkort

2024-02-14 12:01

Permalänk

Nyhet

Melding Plague

Registrerad: Dec 1999

●

Nu kan du köra AI-bot lokalt på Nvidias RTX-grafikkort

"Chat with RTX" är tillgänglig i betastadiet just nu och är helt textbaserad.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Rapportera Redigera

Citera flera Citera

2024-02-14 12:04

Permalänk

sniglom

Medlem ★

Plats: Göteborg
Registrerad: Jul 2001

●

Använder gpt4all.io för lokala körningar. Då slipper man låsa in sig till nvidias programvara.

Visa signatur

Rapportera Redigera

Citera flera Citera (9)

2024-02-14 12:05

Permalänk

xfade

Medlem ★

Registrerad: Jul 2002

●

Om en har Två RTX kort kan de prata med varandra då?
Så vi slipper...

Visa signatur

Rapportera Redigera

Citera flera Citera (37)

2024-02-14 12:08

Permalänk

Njure

Medlem

Plats: Stockholm
Registrerad: Feb 2009

●

Det här har man kunna göra länge rätt ghetto, men att paketera det så här är grymt för att privacy till en större skala. Ingen data läcker enheten. Du kan låta den veta mer om dig utan att den datan åker iväg till ett privat företag i USA. Kommer öppna upp för så mycket fler användningsområden.

Såsmåningom så har varenda enhet små och effektiva språkmodeller snarare än enbart enorma cloudvarianter. Intel, AMD, iPhone, Samsung osv ska alla komma med enheter som har egna NPUs (neural processing units, processorer för AI-uppgifter), så det blir spännande att följa utvecklingen.

Visa signatur

SLI Titan X - i7 5960x 8-kärnig - Asus Rampage V - 32 GB Corsair Dominator - Intel 750 2200 MB/s Pcie-disk.

Rapportera Redigera

Citera flera Citera (2)

2024-02-14 12:16

Permalänk

pv2b

Hedersmedlem ★

Plats: Stockholm
Registrerad: Jul 2017

●

Skrivet av Njure:

Det här har man kunna göra länge rätt ghetto, men att paketera det så här är grymt för att privacy till en större skala. Ingen data läcker enheten. Du kan låta den veta mer om dig utan att den datan åker iväg till ett privat företag i USA. Kommer öppna upp för så mycket fler användningsområden.

Såsmåningom så har varenda enhet små och effektiva språkmodeller snarare än enbart enorma cloudvarianter. Intel, AMD, iPhone, Samsung osv ska alla komma med enheter som har egna NPUs (neural processing units, processorer för AI-uppgifter), så det blir spännande att följa utvecklingen.

Gå till inlägget

Jo, det här är klart mycket bättre ur integritetssynpunkt än att används molntjänster på det, även att det går att träna på lokal data utan att skicka upp det till en molntjänst, men jag tror knappast att motivationen för Nvidia är att skydda användarnas integritet (även om det är effekten) utan att sälja fler RTX-kort.

Synd att jag inte kommer kunna testa detta dock eftersom det här verkar vara endast för Windows.

Visa signatur

Akta dig för XY-Problemet, sätt alltid dina frågor i ett sammanhang!

Rapportera Redigera

Citera flera Citera

2024-02-14 12:31

Permalänk

lillaankan_i_dammen

Medlem ★

Registrerad: Nov 2019

●

Tänk vad många som kommer bli dumpade idag på att deras partner istället väljer att umgås och prata med deras Nvidia RTX.

Rapportera Redigera

Citera flera Citera (4)

2024-02-14 12:33

Permalänk

jeppe109

Medlem ★

Registrerad: Jan 2005

●

Skrivet av lillaankan_i_dammen:

Tänk vad många som kommer bli dumpade idag på att deras partner istället väljer att umgås och prata med deras Nvidia RTX.

Gå till inlägget

En skräddarsydd ai-partner. Skulle inte förvåna mig om det blir väldigt vanligt i framtiden. Låter dystopiskt dock.

Visa signatur

Rapportera Redigera

Citera flera Citera (1)

2024-02-14 12:42

Permalänk

sweisdapro

Medlem ★

Plats: Lund
Registrerad: Mar 2017

●

Blir nog absolut att testa den, kan bli ens perfekta "jarvis" om en matar den rätt

Visa signatur

Rapportera Redigera

Citera flera Citera (1)

2024-02-14 12:45

Permalänk

Teddis

Medlem ★

Registrerad: Maj 2007

●

Skrivet av sniglom:

Använder gpt4all.io för lokala körningar. Då slipper man låsa in sig till nvidias programvara.

Gå till inlägget

Koolt! Men jämförelsevis säger de i princip att det är ca 8GB stora modeller som gäller och allt körs på CPU eller missförstår jag det?

BORDE inte en 35GB stor modell som körs på GPU vara bättre? På något eller några sätt.

Jag har bara kört OpenAIs molniga chatGPT så jag bara undrar

Visa signatur

Rapportera Redigera

Citera flera Citera (1)

2024-02-14 12:54

Permalänk

NodCommander

Medlem ★

Registrerad: Nov 2010

●

Snacka med grafikkortet? Låter smått befängt utan vidare kontext.

Visa signatur

Nybörjare på Linux? Se hit! #15665841

Rapportera Redigera

Citera flera Citera (5)

2024-02-14 13:09

Permalänk

norrby89

Medlem ★

Plats: Västerås
Registrerad: Mar 2006

●

Skrivet av jeppe109:

En skräddarsydd ai-partner. Skulle inte förvåna mig om det blir väldigt vanligt i framtiden. Låter dystopiskt dock.

Gå till inlägget

Plasera sedan denna ai-partner i en robotiserad realdoll =o

Visa signatur

here we go!

Rapportera Redigera

Citera flera Citera (4)

2024-02-14 13:21

Permalänk

anders190

Saknad Hedersmedlem ★

Registrerad: Feb 2023

●

Är det nu man gör ett försök att börja göra en AI-backup av sig själv med grafikkortet?

Visa signatur

Huvuddator: 7800X3D, 2x16GB G.Skill Flare X5 6000MHz CL30, Asus B650E-F, KFA2 RTX 4090 SG, 6TB NVMe/SATA SSD, 42" LG OLED C3 Evo

Never fade away...

Folda för Sweclockers! https://www.sweclockers.com/forum/trad/1348460-faq-kom-igang-...

Rapportera Redigera

Citera flera Citera (3)

2024-02-14 13:36

Permalänk

nidas

Medlem ★

Plats: Sthlm
Registrerad: Jul 2001

●

Skrivet av norrby89:

Plasera sedan denna ai-partner i en robotiserad realdoll =o

Gå till inlägget

Där har vi en dystopisk framtid halva internet kan leva med, storbystade mördarrobotar.

Visa signatur

as it was in the beginning so it shall be in the end

Rapportera Redigera

Citera flera Citera (3)

2024-02-14 13:42

Permalänk

sweisdapro

Medlem ★

Plats: Lund
Registrerad: Mar 2017

●

Skrivet av nidas:

Där har vi en dystopisk framtid halva internet kan leva med, storbystade mördarrobotar.

Gå till inlägget

robot-domi-mommy

Visa signatur

Rapportera Redigera

Citera flera Citera (5)

2024-02-14 13:45

Permalänk

Krakkan

Medlem ★

Registrerad: Maj 2004

●

Kommer den sno bilder å läsa ens sms på mobilen å skit också?

Rapportera Redigera

Citera flera Citera (3)

2024-02-14 13:49

Permalänk

Dunde

Medlem ★

Plats: I Villan
Registrerad: Jul 2001

●

Skrivet av norrby89:

Plasera sedan denna ai-partner i en robotiserad realdoll =o

Gå till inlägget

Då återstår utmaningen hur den ska lära sig att diska.

Rapportera Redigera

Citera flera Citera (6)

2024-02-14 13:51

Permalänk

sweisdapro

Medlem ★

Plats: Lund
Registrerad: Mar 2017

●

Skrivet av Dunde:

Då återstår utmaningen hur den ska lära sig att diska.

Gå till inlägget

mata rätt pdf bara

Visa signatur

Rapportera Redigera

Citera flera Citera (5)

2024-02-14 14:00

Permalänk

Venke

Medlem

Registrerad: Sep 2012

●

Malware

Rapportera Redigera

Citera flera Citera

2024-02-14 15:02

Permalänk

dblade

Medlem ★

Registrerad: Jul 2009

●

Blev verkligen förvånad över hur många som inte verkar ha koll på vad det handlar om. Är detta verkligen ett teknikforum?

Rapportera Redigera

Citera flera Citera (1)

2024-02-14 16:06

Permalänk

Gambit_2K

Medlem ★

Plats: Stockholm
Registrerad: Okt 2001

●

Snart har vi alla lokal A.I flickvän som kommer vilja ha en kropp... låter som en film

Visa signatur

Rapportera Redigera

Citera flera Citera (1)

2024-02-14 16:10

Permalänk

tonii

Medlem ★

Registrerad: Jun 2014

●

Skrivet av dblade:

Blev verkligen förvånad över hur många som inte verkar ha koll på vad det handlar om. Är detta verkligen ett teknikforum?

Gå till inlägget

Precis som i resten av samhället så räcker det att läsa rubriken och dra sina egna slutsatser!

Eller så vill folk ha lite skoj bara

Rapportera Redigera

Citera flera Citera (10)

2024-02-14 16:16

Permalänk

heatm

Medlem ★

Plats: PANNKAKA!
Registrerad: Aug 2010

●

Kört Stable Diffusion lokalt nu i några veckor. Alltså, det är ju svart magi i hur man får riktigt bra resultat än och kräver en hel del efterforskning, men fan så coolt det är! Tränade upp en snabb modell på mig själv och vips blev jag ninja-stålmannen med mycket bättre hårfäste än jag verkligen har.

En lokal text-AI som var lätt att hantera skulle jag vilja testa träna upp på diverse byggnadstekniska beskrivningar samt Boverkets Byggregler. Är rätt så säker på att AI kommer vara en grund för varenda ingenjör och projektör snart, som ersättning för alla idiotmallar man har idag.

Visa signatur

DATOR i bruk: ASUS ROG STRIX B550-F Gaming, Ryzen 7 5900X. 4x16 GB Ballistix MAX RGB @ 3800 MT/s 16-17-18-34-51 (1T)/~58 ns. MSI RTX 4090 Ventus x3. Samsung 980 Pro 1 TB. EK AIO Elite 360. Denon AVR-3313 med Wharfedale Linton 85th Heritage och en SVS PB-1000.
#ryssjävlar

Rapportera Redigera

Citera flera Citera (2)

2024-02-14 16:18

Permalänk

xfade

Medlem ★

Registrerad: Jul 2002

●

Skrivet av dblade:

Blev verkligen förvånad över hur många som inte verkar ha koll på vad det handlar om. Är detta verkligen ett teknikforum?

Gå till inlägget

Teknik kommer i många former, tänker jag.

Visa signatur

Rapportera Redigera

Citera flera Citera (4)

2024-02-14 17:37

Permalänk

Emomilol1213

Medlem

Plats: UK
Registrerad: Mar 2011

●

Inte testat än, men sitter på en 2080s som fungerar med mistral i ollama utan problem iom 8gb VRAM. Något unikt med detta eller speciellt att inte 20xx supportas?

Visa signatur

🎮 → 7800X3D • RTX 5090 FE • 64GB DDR5 • Asus B650 • Corsair HX1000i
🖥️ → Skärm: Iiyama G-Master GB3461 - 34" 21:9 144hz • 🥽 → VR: Oculus Quest 2
🎧 → Logitech G933 🖱️ → Corsair Sabre RGB | ⌨️ → Corsair K70 Lux

Rapportera Redigera

Citera flera Citera

2024-02-14 17:58

Permalänk

kelthar

Medlem ★

Plats: :: oVERdOZe bbS ::
Registrerad: Aug 2004

●

Skrivet av jeppe109:

En skräddarsydd ai-partner. Skulle inte förvåna mig om det blir väldigt vanligt i framtiden. Låter dystopiskt dock.

Gå till inlägget

Hellre det än att folk känner sig ensamma och övergivna.

Visa signatur

Hur många datorer är för många?

Rapportera Redigera

Citera flera Citera (4)

2024-02-14 19:49

Permalänk

alex_farnstrom

Medlem

Plats: Karlstad
Registrerad: Jan 2007

●

Har kört KoboldCPP och oobabooga med lokala modeller från huggingface ett tag nu, så kommer vara intressant att testa hur denna funka jämnfört med dem.

Visa signatur

Rapportera Redigera

Citera flera Citera

2024-02-14 20:01

Permalänk

friArsenik

Medlem ★

Registrerad: Feb 2020

●

Skrivet av heatm:

Kört Stable Diffusion lokalt nu i några veckor. Alltså, det är ju svart magi i hur man får riktigt bra resultat än och kräver en hel del efterforskning, men fan så coolt det är! Tränade upp en snabb modell på mig själv och vips blev jag ninja-stålmannen med mycket bättre hårfäste än jag verkligen har.

En lokal text-AI som var lätt att hantera skulle jag vilja testa träna upp på diverse byggnadstekniska beskrivningar samt Boverkets Byggregler. Är rätt så säker på att AI kommer vara en grund för varenda ingenjör och projektör snart, som ersättning för alla idiotmallar man har idag.

Gå till inlägget

Hellre AI kommer att vara en grund till varenda projekt, som ersättning för alla idiot-ingenjör och idiot-projektör man har idag.

Rapportera Redigera

Citera flera Citera (1)

2024-02-14 21:32

Permalänk

dblade

Medlem ★

Registrerad: Jul 2009

●

Skrivet av Emomilol1213:

Inte testat än, men sitter på en 2080s som fungerar med mistral i ollama utan problem iom 8gb VRAM. Något unikt med detta eller speciellt att inte 20xx supportas?

Gå till inlägget

Det ingår en Mistral 7B int4 och en Llama2 13B int4 modell i paketet. Det var väl hyfsad prestanda men jag tror jag sett liknande prestanda i ollama och de andra varianterna. Det märktes tyvärr att dom var för små för att vara praktiskt användbara till det jag använder dom till.

Rapportera Redigera

Citera flera Citera

2024-02-15 01:49

Permalänk

sniglom

Medlem ★

Plats: Göteborg
Registrerad: Jul 2001

●

Skrivet av Teddis:

Koolt! Men jämförelsevis säger de i princip att det är ca 8GB stora modeller som gäller och allt körs på CPU eller missförstår jag det?

BORDE inte en 35GB stor modell som körs på GPU vara bättre? På något eller några sätt.

Jag har bara kört OpenAIs molniga chatGPT så jag bara undrar

Gå till inlägget

Du kan köra antingen på GPU eller på CPU med gpt4all.io. För att en modell ska kunna köras på GPUn måste du ha tillräckligt med VRAM och modellen är på ett format som kan gpu-accelereras. Annars blir det fallback till CPUn.

Du är inte låst till modellerna som finns på hemsidan. Hittar du en modell i GGUF-format är det bara att lägga in i rätt mapp och köra. När du letar upp egna modeller gäller det att välja rätt kvantifiering om den ska fungera på GPUn.

Angående 35GB stor modell så provkörde jag en 47GB stor modell på CPUn nyligen. Jag var nyfiken på hur mycket bättre en större modellen blev jämfört mot de mer komprimerade varianterna, samt hur långsamt det skulle gå.

Jag blev positivt förvånad, trodde det skulle vara betydligt långsammare på CPU än vad det var. Man får vänta någon minut eller två på ett längre svar, men för att provköra några enstaka frågor duger det fint.

Senast redigerat 2024-02-15 02:04

Visa signatur

Rapportera Redigera

Citera flera Citera (1)

2024-02-15 08:23

Permalänk

SuperSverker

Medlem ★