Data om Deepseek-användare fanns ute på nätet

Permalänk
Melding Plague

Data om Deepseek-användare fanns ute på nätet

Det är oklart hur länge databasen hann vara öppen.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Skrivet av Nyhet:

"I databasen fanns över en miljon loggar, inklusive chatthistorik från användare, lösenord i klartext samt API-nycklar och metadata. Det gick även att ta kontroll över databasen via SQL-kommandon."

Läs hela artikeln här

Skämtet brukar vara att endast Juniorutvecklare™ lyckas med sådana fundamentala säkerhetsbrister!

Mvh,
WKF.

Visa signatur

"Den säkraste koden är den som aldrig skrivs"
"Visste du förresten att det är ett mångmiljardbolag?"
"Jag lever inte för att koda utan kodar för att sen kunna leva"

Permalänk
Medlem

Man är ju inte förvånad då det är Kina som styr o ställer i Deepseek

(Kina är ju inte alls kända för att spionera på västvärldens invånare)

Änrade från Chyna till Kina.
Visa signatur

Black smoke doesnt mean engines broke #diesel

Permalänk
Avstängd
Skrivet av WebbkodsFrilansaren:

Skämtet brukar vara att endast Juniorutvecklare™ lyckas med sådana fundamentala säkerhetsbrister!

Mvh,
WKF.

De skulle haft AI till hjälp där..

Visa signatur

42? Seven and a half million years and all you can come up with is 42?!
► FD Define R2 | Win11Pro | R7-5800X | PA 120SE | ROG STRIX B550-F GAMING | CMN32GX4M2Z4600C18 | 1080 Ti | AX750 | Asus VG27WQ | HP Z27n |► Realme GT Master |

Permalänk
Medlem

Molntjänster. De kommer alla läcka tids nog.

Därför man kör saker på egen hw lokalt.
Business is local!

Permalänk
Medlem
Skrivet av SotarnAnton:

Man är ju inte förvånad då det är Kina som styr o ställer i Deepseek

(Kina är ju inte alls kända för att spionera på västvärldens invånare)

Alla länder spionerar på sina invånare och andras. USA är bäst i klassen på detta.

Permalänk
Medlem

Varför skulle det ha något med Kinesiska staten att göra, när databasen kan queryas öppet från internet? Detta är slarv och/eller inkompetens inom it-säkerhe bara. De kan maskininlärning men inte att säkra webbtjänster.

Visa signatur

We are the music makers, and we are the dreamers of dreams.
Youtube | Spotify Playlists | Soft | Rapp | Rytm | Kött | Kalas |

Permalänk
Medlem

Men DeepSeek är ju "open source"

Visa signatur

MSI PRO Z790-P WIFI | Intel i9 13900K | 128 GB DDR5
GTX 4070 12 GB
Samsung 990 Pro 4 TB | WD Black SN850X 2 TB Gen 4 | 2 x 1 TB Samsung 970 EVO Plus
3 x ASUS 27" | 1 x Philips 49"

Permalänk

Jag ser detta som ett stort framtida problem. Just idag så blir många inklusive mig lite besviken av LLM.
Men kanske om 10år, så kan det bli att de arbetarna som använder LLM kommer ha stora fördelar med att utföra sitt arbete med mindre ansträngning och då har vi ett problem.

Att köra LLM lokalt så har jag testat på Mac mini m4 med 16GB ram och det gick men imponerade ej jämfört emot de stora tjänsterna på nätet. Frågan är hur dyr dator behöver man ha för att köra LLM lokalt och få samma resultat som gratistjänsterna. Pratar vi om en dator för 100 000kr eller mer? Jag vet ej, därför ställer jag denna fråga.

Permalänk
Medlem
Skrivet av lillaankan_i_dammen:

Jag ser detta som ett stort framtida problem. Just idag så blir många inklusive mig lite besviken av LLM.
Men kanske om 10år, så kan det bli att de arbetarna som använder LLM kommer ha stora fördelar med att utföra sitt arbete med mindre ansträngning och då har vi ett problem.

Att köra LLM lokalt så har jag testat på Mac mini m4 med 16GB ram och det gick men imponerade ej jämfört emot de stora tjänsterna på nätet. Frågan är hur dyr dator behöver man ha för att köra LLM lokalt och få samma resultat som gratistjänsterna. Pratar vi om en dator för 100 000kr eller mer? Jag vet ej, därför ställer jag denna fråga.

På Twitter har de pratat om $6 000 USD för en burk som kan köra den fullskaliga versionen av DeepSeek R1 med 6-8 tokens per sekund. 2x AMD EPYC 9004 eller 9005 CPU med 768GB DDR5.

Citat:

Complete hardware + software setup for running Deepseek-R1 locally. The actual model, no distillations, and Q8 quantization for full quality.

Motherboard: Gigabyte MZ73-LM0 or MZ73-LM1. We want 2 EPYC sockets to get a massive 24 channels of DDR5 RAM to max out that memory size and bandwidth.

CPU: 2x any AMD EPYC 9004 or 9005 CPU. LLM generation is bottlenecked by memory bandwidth, so you don't need a top-end one.
Get the 9115 or even the 9015 if you really want to cut costs

RAM: This is the big one. We are going to need 768GB (to fit the model) across 24 RAM channels (to get the bandwidth to run it fast enough). That means 24 x 32GB DDR5-RDIMM modules. Example kits:

Case: You can fit this in a standard tower case, but make sure it has screw mounts for a full server motherboard, which most consumer cases won't. The Enthoo Pro 2 Server will take this motherboard:

https://threadreaderapp.com/thread/1884244369907278106.html

Visa signatur

“The dollar is our currency, but it's your problem.” -John Connally, President Nixon's Treasury Secretary to a group of European finance minsters
"Keep the Russians out, the Americans in, and the Germans down" -NATO Secretary General, Lord Ismay

Permalänk
Skrivet av Goedendag:

På Twitter har de pratat om $6 000 USD för en burk som kan köra den fullskaliga versionen av DeepSeek R1 med 6-8 tokens per sekund. 2x AMD EPYC 9004 eller 9005 CPU med 768GB DDR5.

https://threadreaderapp.com/thread/1884244369907278106.html

Tackar för informationen. Det är ändå ett pris som är ”köpbart för konsumenter”. Bara det att det inte håller den nivå än så att så många vill lägga ut dessa pengar. Men de flesta har ju datorn även till annat.

Permalänk
Skrivet av Goedendag:

På Twitter har de pratat om $6 000 USD för en burk som kan köra den fullskaliga versionen av DeepSeek R1 med 6-8 tokens per sekund. 2x AMD EPYC 9004 eller 9005 CPU med 768GB DDR5.

https://threadreaderapp.com/thread/1884244369907278106.html

Så 80k för en dator som kan köra lokalt? Sen hur snabbt är 6 token? För en som inte förstår

Visa signatur

Intel i5 12600k OC 5.2GHz | Arctic Freezer II 240 | MSI Pro Z690 A | 2x 16Gb Corsair LPX 3200MHz | Asus Tuf 4070 Ti | Corsair Rm850x V3 | 2x 1Tb Samsung 980 m2 | 4x Noctua A14x25 2xT30, 1x Noctua A12x25, 3x ek loop

Permalänk
Medlem

Jag är för open source och tycker alla borde uppmuntra det, men inte så här open dock.

Visa signatur

|AMD Ryzen 7 9800X3D| |ASrock B850 Steel Legend| |Kingston Fury Beast 32GB CL30@6000MHz| |PNY RTX 4090 XLR8 Gaming| |Samsung 990 Pro 2TB| |Samsung 970 Evo Plus 1TB| |Samsung 860 Evo 1TB| |NZXT C1200 Gold ATX 3.1| |Fractal Design Define R5| |LG OLED 48" C2 Evo|

Permalänk
Medlem
Skrivet av Swedishchef_90:

Så 80k för en dator som kan köra lokalt? Sen hur snabbt är 6 token? För en som inte förstår

I ChatGPT-världen så är en token ungefär 1-5 tecken lång, beroende på lite vad som ska genereras/läsas. Jag gissar att Deepseek fungerar på liknande sätt. 6-8 tokens borde därför bli ungefär 15-20 tecken per sekund. Här kan du prova med olika texter och se hur den bryter ner den i tokens:
https://platform.openai.com/tokenizer

Permalänk
Medlem

Gäääsp... bara att inse att Nvidia pumpat upp AI bubblan en tid och tjänat enorma pengar på den.

Sälj aktier i bolagt nu om 2-3 år är det en jobbig anekdot att ni en gång i tiden hade miljoner men höll dem till de var värda några tusen.

Visa signatur

Modermodem: Asus ROG Strix X470-F
Grafikkort: XFX Speedster MERC 319 AMD Radeon™ RX 6800 BLACK
Processor: AMD 2600X
Minne: 48 GB

Permalänk
Medlem
Skrivet av Swedishchef_90:

Så 80k för en dator som kan köra lokalt? Sen hur snabbt är 6 token? För en som inte förstår

Exempel-videon från Twitter-tråden visade att det tog cirka 2 minuter för den att skriva ut ett svar.

Videon visar hur snabb den är på ett ungefär:

Skrivet av Matthew Carrigan på Twitter:

https://x.com/carrigmat/status/1884244400114630942
The clip above is near-realtime, sped up slightly to fit video length limits

Visa signatur

“The dollar is our currency, but it's your problem.” -John Connally, President Nixon's Treasury Secretary to a group of European finance minsters
"Keep the Russians out, the Americans in, and the Germans down" -NATO Secretary General, Lord Ismay

Permalänk
Skrivet av Don_Tomaso:

I ChatGPT-världen så är en token ungefär 1-5 tecken lång, beroende på lite vad som ska genereras/läsas. Jag gissar att Deepseek fungerar på liknande sätt. 6-8 tokens borde därför bli ungefär 15-20 tecken per sekund. Här kan du prova med olika texter och se hur den bryter ner den i tokens:
https://platform.openai.com/tokenizer

Ok så en token är alltså X antal ord

Skrivet av Goedendag:

Exempel-videon från Twitter-tråden visade att det tog cirka 2 minuter för den att skriva ut ett svar.

Videon visar hur snabb den är på ett ungefär:

Okej tack!

Visa signatur

Intel i5 12600k OC 5.2GHz | Arctic Freezer II 240 | MSI Pro Z690 A | 2x 16Gb Corsair LPX 3200MHz | Asus Tuf 4070 Ti | Corsair Rm850x V3 | 2x 1Tb Samsung 980 m2 | 4x Noctua A14x25 2xT30, 1x Noctua A12x25, 3x ek loop

Permalänk
Redaktion
Nyhetsredaktör

Tråd rensad av inlägg som gick in i andra diskussioner än artikelns huvudämne. Jag vill påminna om att SweClockers forumregler även gäller i kommentarsfält och att inlägg/trådar som går in i olika sidospår kommer att tas bort.

Permalänk
Skrivet av Don_Tomaso:

I ChatGPT-världen så är en token ungefär 1-5 tecken lång, beroende på lite vad som ska genereras/läsas. Jag gissar att Deepseek fungerar på liknande sätt. 6-8 tokens borde därför bli ungefär 15-20 tecken per sekund. Här kan du prova med olika texter och se hur den bryter ner den i tokens:
https://platform.openai.com/tokenizer

Så om man köper en 80 000kr dator, gammal grön CRT skärm, plus gamla datorhögtalare och ett chassi.
Även har ett text to speech program igång har man en dator som beter sig när det gäller LLM delen som en riktigt grym dator i vissa 80 tals filmer.

Ändå på sätt och vis coolt. Jag vill ha Star Trek transponder så jag kan teleportera saker, att det ska ta så lång tid.

Permalänk
Skrivet av lillaankan_i_dammen:

Så om man köper en 80 000kr dator, gammal grön CRT skärm, plus gamla datorhögtalare och ett chassi.
Även har ett text to speech program igång har man en dator som beter sig när det gäller LLM delen som en riktigt grym dator i vissa 80 tals filmer.

Japp för ungefär samma pris som på 80 talet 😉

Visa signatur

Intel i5 12600k OC 5.2GHz | Arctic Freezer II 240 | MSI Pro Z690 A | 2x 16Gb Corsair LPX 3200MHz | Asus Tuf 4070 Ti | Corsair Rm850x V3 | 2x 1Tb Samsung 980 m2 | 4x Noctua A14x25 2xT30, 1x Noctua A12x25, 3x ek loop

Permalänk
Medlem
Skrivet av Goedendag:

På Twitter har de pratat om $6 000 USD för en burk som kan köra den fullskaliga versionen av DeepSeek R1 med 6-8 tokens per sekund. 2x AMD EPYC 9004 eller 9005 CPU med 768GB DDR5.

https://threadreaderapp.com/thread/1884244369907278106.html

Dyrt men jämför man med dyraste konsumentabonnemanget för ChatGPT är ju det $200/m. Vilket på någon nivå typ är samma prisklass, betalar sig på 2,5 år. Men sen ger nog GPT högre t/s.

Permalänk
Medlem
Skrivet av lillaankan_i_dammen:

Jag ser detta som ett stort framtida problem. Just idag så blir många inklusive mig lite besviken av LLM.
Men kanske om 10år, så kan det bli att de arbetarna som använder LLM kommer ha stora fördelar med att utföra sitt arbete med mindre ansträngning och då har vi ett problem.

Att köra LLM lokalt så har jag testat på Mac mini m4 med 16GB ram och det gick men imponerade ej jämfört emot de stora tjänsterna på nätet. Frågan är hur dyr dator behöver man ha för att köra LLM lokalt och få samma resultat som gratistjänsterna. Pratar vi om en dator för 100 000kr eller mer? Jag vet ej, därför ställer jag denna fråga.

2st Mac Studio Ultra kan du köra fullstora deepseek r1 på. Öka med fler studios för ökad prestanda eller högre quant.

Permalänk
Medlem
Skrivet av bobbeyblade:

Gäääsp... bara att inse att Nvidia pumpat upp AI bubblan en tid och tjänat enorma pengar på den.

Sälj aktier i bolagt nu om 2-3 år är det en jobbig anekdot att ni en gång i tiden hade miljoner men höll dem till de var värda några tusen.

Börsexperten..

Visa signatur

Chassi: Fractal Meshify Skärm: LG C2 oled GPU: 6950XT CPU: 5800X3D SSD: 480GB, M2 3TB PSU: Dark Power Pro 1,5KW Mobo: TUF GAMING X570-PLUS RAM: 32GB Ripjaws @ 3600MT Mus: Logitech G502X Matta: Steelseries QcK Heavy Tbord: Logitech MX Mech Mini Lurar: DT1990 Pro OS: Win10Pro AI: Tascam 20x20 Monitorer: Yamaha HS7 Router: Wyse 5070 @ opnsense WIFI: Ubiquiti U7 Pro Switch: Zyxel 2.5Gbit. Citera när ni svarar! :)

Permalänk
Medlem
Skrivet av Superfrog:

Men DeepSeek är ju "open source"

Jag förstår att du lägger fram det som ett skämt, men det känns också som en helt relevant invändning i sammanhanget.

Dataläckan som artikeln handlar om drabbar ju precis de som bara hoppat på tåget i form av: titta, det finns en ny app där man säljer sin själ till någon annan aktör (kinesisk dito i detta fall) istället för till OpenAI, helt utan att bry sig om den relativa öppenheten som även ger andra alternativ.

Visa signatur

Desktop spel m.m.: Ryzen 9800X3D || MSI X870 Tomahawk Wifi || MSI Ventus 3x 5080 || Gskill FlareX 6000 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Arbetsstation: Ryzen 7945HX || Minisforum BD790i || Asus Proart 4070 Ti Super || Kingston Fury Impact 5600 65 GB || WD SN850 2TB || Samsung 990 Pro 2TB || Fractal Ridge
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem
Skrivet av SotarnAnton:

Man är ju inte förvånad då det är Kina som styr o ställer i Deepseek

(Kina är ju inte alls kända för att spionera på västvärldens invånare)

Är inget försvar av Kina att säga att alla spionerar på alla!

Men förstår verkligen inte hur det skulle gynna Kina och Deepseek att medvetet lämna en databas öppen, speciellt om nu Kina styr och ställer när det gäller Deepseek, vilket då borde betyda att dom har icke officiella kanaler direkt till den databasen, inkluderat övrigt av intresse ändå, varvid inget behov bör existera att ha databasen öppen och göra det väldigt enkelt för alla övriga spionorganisationer.
För att inte tala om att verkligen underlätta för hela världens alla hackers.

En fråga är då, vad skulle gynna Kina att andra då har full access till en databas?

Nästa blir, på vilket sätt skulle det gynna Kina om Deepseek får rykte om sig att läcka information till allt och alla med fritt åtkomliga databaser?
Det borde bli en totalt motsatt effekt då folk kan börja undvika Deepseek, varvid Kina mister möjligheten till datainsamling.

Så du får ursäkta om jag inte kan förstå resonemanget!

Det är helt enkelt (som det verkar) en felkonfigurerad server, där någon totalt missat säkerhetstänk...

Visa signatur

Engineer who prefer thinking out of the box and isn't fishing likes, fishing likes is like fishing proudness for those without ;-)
If U don't like it, bite the dust :D
--
I can Explain it to you, but I can't Understand it for you!

Permalänk
Medlem
Skrivet av Berduf:

Alla länder spionerar på sina invånare och andras. USA är bäst i klassen på detta.

Oj, här har vi en riktig expert på underrättelseverksamhet förstår jag. Tack för att du i all vänlighet ville dela dina digra kunskaper med oss som har mindre utvecklad kognitiv förmåga.

OnT: Tur man inte körde sitt vanliga lösenord (qwerty123) när man registrerade sig på Djupsöket.

Permalänk
Medlem
Skrivet av Dunde:

Oj, här har vi en riktig expert på underrättelseverksamhet förstår jag. Tack för att du i all vänlighet ville dela dina digra kunskaper med oss som har mindre utvecklad kognitiv förmåga.

OnT: Tur man inte körde sitt vanliga lösenord (qwerty123) när man registrerade sig på Djupsöket.

Klev jag på en öm tå?

Permalänk
Medlem

Kontroverserna kring Deepseek utraderade värden närmare 13 biljoner kronor på aktiemarknaden, kurserna har väl återhämtat sig lite men många större företag har investerat stora summor på mjukvara för AI utveckling men om nu denna finns tillgänglig som öppen källkod lär väl dom inte betala av sig speciellt bra. Men det beror väl på hur användbar den är, effektiv på befintlig hårdvara tycks vara en av fördelarna men hört lite blandat om slutresultat. Något som säkert blir bättre med fortsatt utveckling.

Visa signatur

CPU: Intel i9-12900K Cooler: Asus TUF Gaming LC 240 ARGB MB: Asus TUF Gaming Z690 Plus Wifi D4 GPU: Asus TUF GeForce RTX 3080 Ti 12GB Case: InWin D-Frame HD: Intel Optane 900P 280GB, WD Black SN850 1TB Mem: Kingston Fury Beast RGB 3600MHz CL17 32GB PSU: Corsair AX760 OS: Win11 Pro