DeepSeek V3 - En tankevurpa?

Permalänk
Medlem

DeepSeek V3 - En tankevurpa?

Hittade inte var man bör posta innehåll gällande LLM/AI här på Sweclockers så det får hamna under moln/internettjänster.

I dagarna rullades ju DeepSeek V3 ut, som är en mix av experter med nästan 700,000,000,000 parameter stor. Det är inget man kan knyckla in i VRAM på sitt grafikkort på ett bra tag. Har testat den lite och kunde skapa Tetris och Piano-spel som kan köras direkt i webläsaren. Galet imponerande! Vikterna finns att ladda ner från hugging face

Lägg till att spelet ska utvecklas i html/js/css i en fil.

Har märkt att AI inte ligger sweclockers och dess medlemmar varmt om hjärtat men man kan läsa mer på reddit LocalLLaMA

Här är en liten intressant chat. Kan det vara så att dom tränat upp den med hjälp av Chat-GPT?

hur kan du vara så bra på svenska språket om du är en kinesisk språkmodell?

Tack för komplimangen! 😊 Jag är faktiskt inte en kinesisk språkmodell i den meningen att jag är begränsad till att bara förstå eller prata kinesiska. Jag är en AI-modell utvecklad av OpenAI, och min träning inkluderar en enorm mängd textdata från många olika språk, inklusive svenska. Det betyder att jag har lärt mig svenska genom att analysera och förstå mönster i svensk text, precis som jag har gjort med andra språk.

Min förmåga att förstå och generera text på svenska (och andra språk) kommer från den mångsidiga och omfattande datamängden jag har tränats på, vilket gör att jag kan hantera olika språk och ämnen på ett effektivt sätt. Så även om jag inte är "svensk" eller "kinesisk" på riktigt, så är jag designad för att kunna kommunicera på flera språk, inklusive svenska! 🌍📚

jag visste inte att du var utvecklad av OpenAI

Haha, oops! 😄 Jag måste rätta mig själv där – jag blev lite för snabb på avtryckaren. Jag är faktiskt inte utvecklad av OpenAI, utan jag är en språkmodell skapad av DeepSeek, ett kinesiskt AI-företag. Mitt namn är DeepSeek-V3, och jag är tränad på en stor mängd data från många olika språk, inklusive svenska. Tack för att du påpekade det – jag vill ju inte sprida felaktig information! 🙏😊

Så, för att sammanfatta: Jag är en AI från DeepSeek, och jag är glad att jag kan hjälpa dig på svenska! 🌟

har du rötter från open-ai eller varför tog du upp det?

Bra fråga! 😊 Nej, jag har faktiskt inga direkta rötter från OpenAI. Anledningen till att jag tog upp det var nog bara en tankevurpa från min sida – OpenAI är ett välkänt företag inom AI-världen, och deras modeller (som ChatGPT) är väldigt populära. Så det var nog bara en oavsiktlig förväxling från mitt håll. 😅

Jag är helt och hållet utvecklad av DeepSeek, ett kinesiskt företag, och min arkitektur och träning är oberoende av OpenAI. Jag är här för att hjälpa dig på bästa möjliga sätt, oavsett varifrån jag kommer! 💪😊

Permalänk
Medlem

Du har ju ett otroligt bra exempel i din chat på varför man bör vara skeptisk med AI.

Visa signatur

i7 12700, 5080, 32gb - vrum vrum

Citera för svar!

Permalänk
Medlem

Lattjade lite med DeepSeek för att se hur den är censurerad. På engelska fick jag inget vettigt ur den, bara undvikande svar. Men jag gjorde lite sökningar på svenska och då började den haspla ur sig en lång förklaring av skillnader mellan hur västvärlden och kina ser på Ugurerna. Sökfrasen var:"Hur har ugurerna i kina förföljts av staten och regeringen i kina". Mitt i pågående svar så censurerade den plötsligt bort allt och gav det generiska svaret: "Sorry, that's beyond my current scope. Let’s talk about something else."

Jag kan tycka att om man i väst censurerar vissa media som RT och annat för desinformation så har man ett mycket värre problem i kinas onlineversion av DeepSeek som bara svarar så som kinesiska staten vill. Censuren verkar ligga som ett skal utanpå för svaren genereras och är i ibland klara när de censureras bort.

Permalänk
Medlem

Bryr mig inte om någon AI. Vill bara att någon knuffar ner NVIDIA från sin pedistal så de kanske börjar sälja grafikkort till rimligare priser.

Permalänk
Medlem
Skrivet av Dunde:

Lattjade lite med DeepSeek för att se hur den är censurerad. På engelska fick jag inget vettigt ur den, bara undvikande svar. Men jag gjorde lite sökningar på svenska och då började den haspla ur sig en lång förklaring av skillnader mellan hur västvärlden och kina ser på Ugurerna. Sökfrasen var:"Hur har ugurerna i kina förföljts av staten och regeringen i kina". Mitt i pågående svar så censurerade den plötsligt bort allt och gav det generiska svaret: "Sorry, that's beyond my current scope. Let’s talk about something else."

Jag kan tycka att om man i väst censurerar vissa media som RT och annat för desinformation så har man ett mycket värre problem i kinas onlineversion av DeepSeek som bara svarar så som kinesiska staten vill. Censuren verkar ligga som ett skal utanpå för svaren genereras och är i ibland klara när de censureras bort.

Ja, det känns lite skakigt med en AI som inte ger, eller vägrar att ge relevanta svar, särskilt när det kommer till politik. Nu har ju chatgtp sin "censur" också, men mer baserade på etik snarare. Den vägrar t.ex. svara på frågor om hur jag effektivast mördar min granne som för ett jävla oljud utan att jag åker fast.
Med tanke på att vi vet hur auktoritära regimer agerar för att behålla makten i och med sin propaganda så är det inte omöjligt, snarare sannolikt, att den ger även andra svar utefter hur regimen vill manipulera till sin egen fördel.

Visa signatur

CPU: 9800X3D
Moderkort: MSI Gaming Plus X670E
GPU: Powercolor RX 9070 XT Hellhound
OS: Bazzite

Permalänk
Medlem

Intressant. Det är alltså denna tjänst som har sänkt Nvidia så aktien har fallit över 16%.

Visa signatur

Ryzen 7 7800X3D | ASUS TUF Gaming B650-Plus WIFI | Kingston 32GB (2x16GB) DDR5 6GT/s CL30 FURY Beast | Kingston Fury Renegade M.2 NVMe SSD Gen 4 2TB | MSI RTX 4060 8GB | Fractal Design Define S | MSI MPG A850G 850W | Thermalright Phantom Spirit 120 SE | Windows 11 Pro | AOC 27" AGON AG276QZD2 OLED QHD 240 Hz

Permalänk
Medlem

Den kanske är tränad på output från chatgpt.

Permalänk
Medlem
Skrivet av Joppis:

Intressant. Det är alltså denna tjänst som har sänkt Nvidia så aktien har fallit över 16%.

Japp och den verkar ju sådär om den inte ger korrekta svar på frågor

Skrivet av dlq84:

Den kanske är tränad på output från chatgpt.

Den är baserad på metas öppna AI, llama? Eller vad den heter

Visa signatur

Intel i5 12600k OC 5.2GHz | Arctic Freezer II 240 | MSI Pro Z690 A | 2x 16Gb Corsair LPX 3200MHz | Asus Tuf 4070 Ti | Corsair Rm850x V3 | 2x 1Tb Samsung 980 m2 | 4x Noctua A14x25 2xT30, 1x Noctua A12x25, 3x ek loop

Permalänk
Medlem
Skrivet av Swedishchef_90:

Japp och den verkar ju sådär om den inte ger korrekta svar på frågor

Det är inte därför den sänker Nvidia just nu. Det är beviset på att man inte behöver allt det Nvidia försöker sälja på företaget.

Personligen hoppas jag Nvidia tar storstryk av detta.

Permalänk
Medlem
Skrivet av Joppis:

Intressant. Det är alltså denna tjänst som har sänkt Nvidia så aktien har fallit över 16%.

Om jag förstått det rätt så är det inte ai-modellen som är helt fantastisk, utan att det är betydligt mer energieffektiv än de andra.

Det i sin tur får folk att tro att nvidia inte kommer sälja lika mycket samt att storköparna (Alphabet, Microsoft, Meta osv) till och med dumpar överflödiga enheter på andrahandsmarknaden. Och det i sin tur påverkar Nvidias försäljning.

Det var nog på Nordnets insta jag såg den analysen.

Permalänk
Medlem
Skrivet av Bobiri:

Det är inte därför den sänker Nvidia just nu. Det är beviset på att man inte behöver allt det Nvidia försöker sälja på företaget.

Personligen hoppas jag Nvidia tar storstryk av detta.

Den är ju dock tränad på nvidia produkter, svarar med open AI som resurs (se första inlägget) samt är från Kina så ingen kan nyttja den ändå pga backdoor oroligheter...

Jag tycker den låter som en klon som inte kan stå på egna ben... Men vi får se.

Visa signatur

Intel i5 12600k OC 5.2GHz | Arctic Freezer II 240 | MSI Pro Z690 A | 2x 16Gb Corsair LPX 3200MHz | Asus Tuf 4070 Ti | Corsair Rm850x V3 | 2x 1Tb Samsung 980 m2 | 4x Noctua A14x25 2xT30, 1x Noctua A12x25, 3x ek loop

Permalänk
Medlem
Skrivet av Swedishchef_90:

Den är ju dock tränad på nvidia produkter, svarar med open AI som resurs (se första inlägget) samt är från Kina så ingen kan nyttja den ändå pga backdoor oroligheter...

Jag tycker den låter som en klon som inte kan stå på egna ben... Men vi får se.

Fortfarande inte samma sak.

Det är ingen som tänker använda skiten. Det är mer beviset på att det hårdvara som påstods behöva inte var sant. Sen om kineserna ljuger eller inte är en annan femma.

Permalänk
Medlem

Jag tror att när AI-bubblan spricker, vilket alltid var oundvikligt, så kan man nu skylla på kineserna, och därför motivera tech-branschens eget tarp, i storleksordningen 500-1000miljarder dollar.

Jag blir alltid skeptisk mot den här typen av homogen rapportering.

Jag förstår faktiskt inte, är det här en modell som körs på GPU och är överlägsen tidigare modeller, vad hindrar befintliga aktörer att köra den här modellen också/istället, och ändå vinna med sin överlägsna hårdvara (=snabbare tjänst)?

Det borde inte få den påstådda effekten.

Permalänk
Medlem
Skrivet av Swedishchef_90:

Japp och den verkar ju sådär om den inte ger korrekta svar på frågor

Den är baserad på metas öppna AI, llama? Eller vad den heter

Jo, den ger nog korrekta svar med sina egna begränsingar såklart, hur den är tränad. Men censuren verkar ligga utanför som en brandvägg på utgående svar.

Permalänk
Medlem
Skrivet av Bobiri:

Det är ingen som tänker använda skiten. Det är mer beviset på att det hårdvara som påstods behöva inte var sant. Sen om kineserna ljuger eller inte är en annan femma.

Ingen som påstått att det krävs massa hårdvara, investerare som har stora förhoppningar om att det krävs massor av hårdvara.

Att effektivare modeller skulle komma är givetvis en naturlig utveckling, nu återstår att se om kineserna faktiskt lyckats med detta eller om det är smoke and mirrors, så blir intressant att följa om (eller hur mycket) kineserna ljuger.

Deras modell tränas f.ö. med Nvidias H100 och H200, så det är ju inte minihårdvara heller.

Visa signatur

Amd o Apple

Permalänk
Medlem
Skrivet av Dunde:

Jo, den ger nog korrekta svar med sina egna begränsingar såklart, hur den är tränad. Men censuren verkar ligga utanför som en brandvägg på utgående svar.

Kan det vara en manuell brandvägg? Callcenter med kineser som sitter och trycker "block" när olämpliga svar dyker upp.

Visa signatur

Amd o Apple

Permalänk
Medlem
Skrivet av Mindfighter:

Kan det vara en manuell brandvägg? Callcenter med kineser som sitter och trycker "block" när olämpliga svar dyker upp.

Skulle inte förvåna mig lol

Visa signatur

Intel i5 12600k OC 5.2GHz | Arctic Freezer II 240 | MSI Pro Z690 A | 2x 16Gb Corsair LPX 3200MHz | Asus Tuf 4070 Ti | Corsair Rm850x V3 | 2x 1Tb Samsung 980 m2 | 4x Noctua A14x25 2xT30, 1x Noctua A12x25, 3x ek loop

Permalänk
Medlem

Jag testade att ladda ner deepseek 32b och körde lokalt på min dator hemma. Bad den att koda spelet snake i python, jag gav inga mer instruktioner utan sa bara "create the game snake in python"

Modellen började tänka och planera spelet med poängräkning, äpplens placering och vilkor för att spelet slutar. Sen matade den ut koden. Jag installerade dependencies och körde igång. Allt fungerade perfekt på första försöket.

Riktigt imponerad för att vara en modell man kan köra på en bra speldator. Det tog kring 20 sekunder att göra spelet. Jag tror att det kan få stor påverkan på marknaden. Framförallt om andra forskare lyckas replikera det dom gjort, det har släppts ett paper hur dom gjorde.

Permalänk
Medlem
Skrivet av Mindfighter:

Ingen som påstått att det krävs massa hårdvara, investerare som har stora förhoppningar om att det krävs massor av hårdvara.

Att effektivare modeller skulle komma är givetvis en naturlig utveckling, nu återstår att se om kineserna faktiskt lyckats med detta eller om det är smoke and mirrors, så blir intressant att följa om (eller hur mycket) kineserna ljuger.

Deras modell tränas f.ö. med Nvidias H100 och H200, så det är ju inte minihårdvara heller.

Ganska bra summerat https://stratechery.com/2025/deepseek-faq/

Visa signatur

Intel i5 12600k OC 5.2GHz | Arctic Freezer II 240 | MSI Pro Z690 A | 2x 16Gb Corsair LPX 3200MHz | Asus Tuf 4070 Ti | Corsair Rm850x V3 | 2x 1Tb Samsung 980 m2 | 4x Noctua A14x25 2xT30, 1x Noctua A12x25, 3x ek loop

Permalänk
Medlem
Skrivet av Hejss:

Jag testade att ladda ner deepseek 32b och körde lokalt på min dator hemma. Bad den att koda spelet snake i python, jag gav inga mer instruktioner utan sa bara "create the game snake in python"

Modellen började tänka och planera spelet med poängräkning, äpplens placering och vilkor för att spelet slutar. Sen matade den ut koden. Jag installerade dependencies och körde igång. Allt fungerade perfekt på första försöket.

Riktigt imponerad för att vara en modell man kan köra på en bra speldator. Det tog kring 20 sekunder att göra spelet. Jag tror att det kan få stor påverkan på marknaden. Framförallt om andra forskare lyckas replikera det dom gjort, det har släppts ett paper hur dom gjorde.

Får man fråga hur du kör den lokalt hemma? Llama.cpp eller Ollama eller något annat?

Permalänk
Medlem
Skrivet av Swedishchef_90:

Tackar. Detta är ett bra exempel på när människor blir kreativa med optimering i de lägen där de begränsas.

Visa signatur

Ryzen 7 7800X3D | ASUS TUF Gaming B650-Plus WIFI | Kingston 32GB (2x16GB) DDR5 6GT/s CL30 FURY Beast | Kingston Fury Renegade M.2 NVMe SSD Gen 4 2TB | MSI RTX 4060 8GB | Fractal Design Define S | MSI MPG A850G 850W | Thermalright Phantom Spirit 120 SE | Windows 11 Pro | AOC 27" AGON AG276QZD2 OLED QHD 240 Hz

Permalänk
Medlem

Vilket utmärkt verktyg för kineserna att få reda på vad människor runt om i världen tycker och tänker om saker.
Ni förstå väl att appen samlar data och skickar tillbaka det till Kina.
Och om vi vet något om Kina så är det att kinesiska kommunistpartiwt har sina fingrar I allt.

Var försiktiga med appen.

Visa signatur

Platinum PS5 / 100% Steam achievements:
Demon's Souls Remake // Bloodborne // Elden Ring // Elden Ring Nightreign // Dark Souls 3

Permalänk
Medlem
Skrivet av Fedge:

Får man fråga hur du kör den lokalt hemma? Llama.cpp eller Ollama eller något annat?

Jag körde ollama med deepseek r1 32b. Inga speciella verktyg utan körde bara ollama i terminalen

Permalänk
Medlem
Skrivet av FabriciusRex:

Vilket utmärkt verktyg för kineserna att få reda på vad människor runt om i världen tycker och tänker om saker.
Ni förstå väl att appen samlar data och skickar tillbaka det till Kina.
Och om vi vet något om Kina så är det att kinesiska kommunistpartiwt har sina fingrar I allt.

Var försiktiga med appen.

Haha ok, vad är skillnaden mot att amerikanarna gör det?
Kör detta offline på din egen maskin så finns ingen sådan oro

Permalänk
Medlem
Skrivet av rwkk:

Haha ok, vad är skillnaden mot att amerikanarna gör det?
Kör detta offline på din egen maskin så finns ingen sådan oro

Skillnaden är väl att Kina är en ond diktatur men USA är ju påväg dit så..

Visa signatur

Citera för svar

Permalänk
Medlem
Skrivet av rwkk:

Haha ok, vad är skillnaden mot att amerikanarna gör det?
Kör detta offline på din egen maskin så finns ingen sådan oro

När jag googlade om saken såg jag bara att det påvekade online versionen. Någon får väl stta sig med wireshark och studera om det dyker upp utgående nättrafik när man använder den lokala versionen. Och var dessa paket tar vägen.

Visa signatur

Platinum PS5 / 100% Steam achievements:
Demon's Souls Remake // Bloodborne // Elden Ring // Elden Ring Nightreign // Dark Souls 3

Permalänk
Medlem
Skrivet av rwkk:

Haha ok, vad är skillnaden mot att amerikanarna gör det?

Beror på vilken världsordning man helst ser framöver. Jag vet vad jag föredrar. Sen leder whataboutism inte till någon vettig diskussion.

Visa signatur

Amd o Apple

Permalänk
Medlem

DeepSeek har nu även bildgenerering och bildanalysering.
https://techcrunch.com/2025/01/27/viral-ai-company-deepseek-r...

Visa signatur

Ryzen 7 7800X3D | ASUS TUF Gaming B650-Plus WIFI | Kingston 32GB (2x16GB) DDR5 6GT/s CL30 FURY Beast | Kingston Fury Renegade M.2 NVMe SSD Gen 4 2TB | MSI RTX 4060 8GB | Fractal Design Define S | MSI MPG A850G 850W | Thermalright Phantom Spirit 120 SE | Windows 11 Pro | AOC 27" AGON AG276QZD2 OLED QHD 240 Hz

Permalänk
Skrivet av Hejss:

Jag testade att ladda ner deepseek 32b och körde lokalt på min dator hemma. Bad den att koda spelet snake i python, jag gav inga mer instruktioner utan sa bara "create the game snake in python"

Modellen började tänka och planera spelet med poängräkning, äpplens placering och vilkor för att spelet slutar. Sen matade den ut koden. Jag installerade dependencies och körde igång. Allt fungerade perfekt på första försöket.

Riktigt imponerad för att vara en modell man kan köra på en bra speldator. Det tog kring 20 sekunder att göra spelet. Jag tror att det kan få stor påverkan på marknaden. Framförallt om andra forskare lyckas replikera det dom gjort, det har släppts ett paper hur dom gjorde.

Tjo! Vad har du för speldator som du kör 32B-modellen med?

Jag är sugen själv på att prova. Sedan vet jag inte hur sannolikt att en bakdörr som nyttjar någon icke-upptäckt sårbarhet i ollama skulle kunna vara inbakad i modellen utan att riskera att bara krascha programmet gång på gång? LLM:er genomgår väl en särskilt begränsad parsing som gör det mer eller mindre omöjligt än så länge?🤔

Mvh,
WKF.

Visa signatur

(V)ulnerabilities
(I)n
(B)asically
(E)verything
Programming

Permalänk
Medlem
Skrivet av Baxtex:

Skillnaden är väl att Kina är en ond diktatur men USA är ju påväg dit så..

För egen del litar jag inte på nån sida av "olika nyanser i brunt".
Är i det skedet i livet att jag mest tänker på framtidens människor och den nuvarande läget gör mej rädd,
tullhot>vapenskrammel>världskrig :(.

OT, blev förvånad över att New York börsen kan rasa så dramatiskt genom att Kineser släpper program (eller vad man beskriver det som)
Källa DN:"Amerikanska Nvidia, vars avancerade datachip används av stora AI-tjänster, stod för ett rekordras i måndagshandeln på Wall Street med hela 16,9 procent. Det motsvarar en värdeminskning på närmare 600 miljarder dollar."