Aktivister stämmer Open AI för brott mot GDPR

Permalänk
Melding Plague

Aktivister stämmer Open AI för brott mot GDPR

De målsägande menar att Open AI inte gör tillräckligt för att att rätta felaktig information i Chat GPT.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk

Om man inte förstår att LLM:s såsom ChatGPT genererar statistiskt beräknade svar och inte hämtar länkar till webbplatser med sannolika svar likt sökmotorer så tycker jag att man inte ska använda de slags "AI"-tjänsterna.

Mvh,
WKL.

Visa signatur

"Den säkraste koden är den som aldrig skrivs"

Permalänk
Hedersmedlem
Skrivet av WebbkodsLärlingen:

Om man inte förstår att LLM:s såsom ChatGPT genererar statistiskt beräknade svar och inte hämtar länkar till webbplatser med sannolika svar likt sökmotorer så tycker jag att man inte ska använda de slags "AI"-tjänsterna.

<Uppladdad bildlänk>

Mvh,
WKL.

Om tekniken inte medger att man kan leverera rätt information enligt GDPR och korrigera felaktig information, så får väl OpenAI och liknande bolag helt enkelt strypa möjligheten för deras språkmodell att svara på den sortens frågor, precis som de idag inte svarar på frågor om hur man tillverkar bomber, knark, och liknande.

Lagar och regler finns av en anledning, och om de inte går att efterleva med en viss teknik, så är det ofta tekniken det är fel på. Det räcker inte med att lägga in en liten text som säger att språkmodellen hittar på ibland.

Permalänk
Medlem

Snart kommer de inte våga svara på något alls. Hoppas de kan släppa en nästan helt öppen model någon gång som inte är så hårt styrd.

Men borde de inte bara kunna göra en varningsstämple som säger. "Lite int epå resultaten" så kommer de undan.

Permalänk
Medlem

OpenAI har mer problem än så. Vi i EU har även rätten att åberopa rätten att bli glömd vilket de inte heller kan vifta bort med "vi vet inte varifrån uppgifterna kommer".

En annan sak är att vissa personuppgifter publiceras på webben genom att företaget som driver sidan har publiceringstillstånd. Det ger inte automatiskt andra företag rätten att lagra dessa datapunkter.

Visa signatur

Windows 11 Pro | Intel i7 8700 | ASUS Prime Z370-P | Corsair 16GB 3000MHz | ASUS GTX 1080 | Fractal Design Define S | Corsair RM750x | Hyper 212 EVO

Permalänk
Hedersmedlem
Skrivet av LessHack:

Snart kommer de inte våga svara på något alls. Hoppas de kan släppa en nästan helt öppen model någon gång som inte är så hårt styrd.

Men borde de inte bara kunna göra en varningsstämple som säger. "Lite int epå resultaten" så kommer de undan.

Sådan varningsstämpel finns redan, se första svaret i tråden för en skärmdump.

Oavsett håller det inte, du kan inte bara skita i lagstiftning genom att deklarera att lagstiftningen inte gäller för dig. Som en liknelse: du får inte igenom din bil på bilbesiktningen med trasiga bromsar med hänvisning till att det sitter en klisterlapp på instrumentbrädan om att man ska anpassa hastigheten, att körningen sker på egen risk, och att det är förbjudet att krocka. Det funkar liksom inte så.

Möjligen skulle OpenAI kunna försöka hävda att all utdata från deras språkmodeller är 100% påhittat och fiktion (vilket faktiskt är sanningen), men det gör nog inga investerare glada. På samma sätt som du får ha en bil med trasiga bromsar stående på gården, så länge du inte kör med den.

Permalänk
Hedersmedlem
Skrivet av LessHack:

Snart kommer de inte våga svara på något alls. Hoppas de kan släppa en nästan helt öppen model någon gång som inte är så hårt styrd.

Men borde de inte bara kunna göra en varningsstämple som säger. "Lite int epå resultaten" så kommer de undan.

Det finns redan ett flertal öppna LLM-modeller av relativt hög kvalitet om du vill att din dator ska hitta på saker åt dig, som inte innehåller de inneboende restriktioner som tjänster som ChatGPT lägger på.

Ska man tvunget försöka använda LLM-teknik till något vettigt (som jag är väldigt skeptisk inför, på grund av de inneboende begränsningarna med den sortens teknik) så är det förmodligen smart att åtminstone inte göra sig beroende av stängda språkmodeller.

Permalänk
Medlem
Skrivet av Joppis:

OpenAI har mer problem än så. Vi i EU har även rätten att åberopa rätten att bli glömd vilket de inte heller kan vifta bort med "vi vet inte varifrån uppgifterna kommer".

En annan sak är att vissa personuppgifter publiceras på webben genom att företaget som driver sidan har publiceringstillstånd. Det ger inte automatiskt andra företag rätten att lagra dessa datapunkter.

Mycket bra poäng. Bara för att information finns tillgänglig betyder inte att du har rätt att bearbeta den. Speciellt inte i kommersiella syften.

Permalänk

I själva verket handlar det om chat Ai tar deras fruar/män men de hittar på andra saker för att motverka det.

Det stora problemet jag har emot dagen Ai är att de är så dåliga på programmering så man ofta bara ödslar tid på deras svar. Detta lär förändras vilken dag som helst, att folk hela tiden motarbetar Ai utvecklingen förskjuter dagen framåt.

Permalänk
Skrivet av pv2b:

Möjligen skulle OpenAI kunna försöka hävda att all utdata från deras språkmodeller är 100% påhittat och fiktion (vilket faktiskt är sanningen), men det gör nog inga investerare glada. På samma sätt som du får ha en bil med trasiga bromsar stående på gården, så länge du inte kör med den.

Då hoppas jag på att LLM:s inom EU tvingas att hävda att det är statistiskt beräknat utdata som genererats och kan aldrig likställas som exempelvis att kolla upp en välskriven undersida på Wikipedia eller en granskad vetenskaplig artikel. Jag skulle då bli besviken om LLM-tjänster förbjuds inom EU för att de påstås tillhandahålla "information" på exakt samma sätt som information på statiska webbplatser skötta av organiska människor.

LLM:s är världens mest avancerade automatiska ordkompletteringsverktyg - huruvida något är (in)korrekt är helt och hållet upp till slutanvändaren att bedöma, precis som all "information" erhållen både online och offline. Jag får en känsla att du ogillar chatGPT medan jag gillar det!

Jag är oxå 100 % medveten om att det finns ingen faktagranskning, ingen (emergent) förståelse, ingen intelligens bakom all statistiskt genererade utmatning från LLM:s. Jag använder aldrig "information" som jag inte begriper mig på från chatGPT.

Mvh,
WKL.

Visa signatur

"Den säkraste koden är den som aldrig skrivs"

Permalänk
Hedersmedlem
Skrivet av WebbkodsLärlingen:

Då hoppas jag på att LLM:s inom EU tvingas att hävda att det är statistiskt beräknat utdata som genererats och kan aldrig likställas som exempelvis att kolla upp en välskriven undersida på Wikipedia eller en granskad vetenskaplig artikel. Jag skulle då bli besviken om LLM-tjänster förbjuds inom EU för att de påstås tillhandahålla "information" på exakt samma sätt som information på statiska webbplatser skötta av organiska människor.

LLM:s är världens mest avancerade automatiska ordkompletteringsverktyg - huruvida något är (in)korrekt är helt och hållet upp till slutanvändaren att bedöma, precis som all "information" erhållen både online och offline. Jag får en känsla att du ogillar chatGPT medan jag gillar det!

Jag är oxå 100 % medveten om att det finns ingen faktagranskning, ingen (emergent) förståelse, ingen intelligens bakom all statistiskt genererade utmatning från LLM:s. Jag använder aldrig "information" som jag inte begriper mig på från chatGPT.

Mvh,
WKL.

Problemet är att tjänster som t.ex. ChatGPT lurar sina användare att tro att de har ett samtal med en assistent som faktiskt svarar på deras frågor utifrån fakta, när LLM:er, precis som du skriver, är ett verktyg för att generera sannolik text. I bästa fall är ChatGPT ett datorprogram som hittar på något som låter som vad en riktig assistent hade sagt.

Det vilseledande ligger, om något, i den "prompt" som ligger bakom kulisserna för något som ChatGPT och all framställning av dess egenskaper runtikring. Det är ju där instruktionen ligger i att bete sig på det sättet. Och den instruktionen får användarna aldrig se.

Jag hade inte haft något emot att vi i EU faktiskt förbjöd den typen av "chattbottar" specifikt som en applikation av AI, så länge de genererar vad som kan se ut som fakta. Möjligen kan vi tillåta dem om de hallucinerar mer än de gör idag, så att det är totalt uppenbart att språkmodeller bara hittar på. (Kvarstår då är väl de som vill använda AI som en virtuell kompis, eller liknande. Men den marknaden är ju inte lika stor så klart.)

Däremot har ju LLM:er någolunda vettiga användningsområden som bollplank, stödverktyg för att formulera texter och programmering. Det gemensamma för allt detta är att LLM:en fungerar som ett stödverktyg för människor att skapa text, och inte framställer att den levererar fakta. Att fakta ändå kommer med i förslagen är ofrånkomligt, det är liksom så språk fungerar, men idealet är att resultatet ska vara faktafritt, eller inte innehålla någon fakta som man inte explicit matat in i maskinen. Så funkar ju dock tyvärr dagens språkmodeller inte.

Permalänk
Medlem
Skrivet av lillaankan_i_dammen:

I själva verket handlar det om chat Ai tar deras fruar/män men de hittar på andra saker för att motverka det.

Det stora problemet jag har emot dagen Ai är att de är så dåliga på programmering så man ofta bara ödslar tid på deras svar. Detta lär förändras vilken dag som helst, att folk hela tiden motarbetar Ai utvecklingen förskjuter dagen framåt.

Skyll inte på verktygen. Kan du inte hantera en hammare är det inte hammaren det är fel på.

Visa signatur

There are two kinds of people: 1. Those that can extrapolate from incomplete data.
Min tråkiga hemsida om mitt bygge och lite annat smått o gott: www.2x3m4u.net

Permalänk
Medlem
Skrivet av WebbkodsLärlingen:

Då hoppas jag på att LLM:s inom EU tvingas att hävda att det är statistiskt beräknat utdata som genererats och kan aldrig likställas som exempelvis att kolla upp en välskriven undersida på Wikipedia eller en granskad vetenskaplig artikel. Jag skulle då bli besviken om LLM-tjänster förbjuds inom EU för att de påstås tillhandahålla "information" på exakt samma sätt som information på statiska webbplatser skötta av organiska människor.

LLM:s är världens mest avancerade automatiska ordkompletteringsverktyg - huruvida något är (in)korrekt är helt och hållet upp till slutanvändaren att bedöma, precis som all "information" erhållen både online och offline. Jag får en känsla att du ogillar chatGPT medan jag gillar det!

Jag är oxå 100 % medveten om att det finns ingen faktagranskning, ingen (emergent) förståelse, ingen intelligens bakom all statistiskt genererade utmatning från LLM:s. Jag använder aldrig "information" som jag inte begriper mig på från chatGPT.

Mvh,
WKL.

Nja, det görs en hel del supervised training och validering på modellerna. Och de dataset som den tränas på genomgår väldigt mycket manuell modifiering.

Sen finns all data om oss i deras dataset. Och när modellen är tränad är det i praktiken en länk till den datan som används (vektordatabasen som byggts upp).

Jag har tränat en del modeller och skapat några LoRAs och använt embedding med RAG. Alla svar är inte "statistiskt påhittade" som du vill få det till. Statistik är grundpelaren, ja, men den är lång ifrån allt idag.

Visa signatur

Processor: Motorola 68000 | Klockfrekvens: 7,09 Mhz (PAL) | Minne: 256 kB ROM / 512 kB RAM | Bussbredd: 24 bit | Joystick: Tac2 | Operativsystem: Amiga OS 1.3

Permalänk
Skrivet av Dr.Mabuse:

Skyll inte på verktygen. Kan du inte hantera en hammare är det inte hammaren det är fel på.

Självklart påverkar ens input vilket resultat man får ut
Problemet är dock att man använder Ai för att spara tid, någon gång i framtiden inom programmering för att göra mer komplexa saker än vad man själv kan.

I vilket fall så ligger Ai för ofta för mig på en nivå inom programmering där lösningen både blir bättre och snabbare att göra det själv och Googla. Detta är endast en tidsfråga innan Ai alternativet går om, jag ogillar då all motarbetningar som skjuter denna tidpunkt framåt.
Speciellt som att LLM måste ha helt korrekta svar, någon av politisk anledning gillar ej ett visst svar.

Ser man på annan teknik så traktorn utritade ej arbetshästen på en dag, sakta blev traktorn mer flexibel och ekonomisk besparande.

Permalänk
Medlem

Stäng ner då!

påstår Open AI att det är för svårt att rätta felen då AI-modellerna är för komplexa för att hantera rättelser.

Ja men då får ni helt enkelt stänga ner skiten.
”Det är för jobbigt att rätta så vi tänker inte följa lagstiftningen”.
Vad är det för idiotursäkt?!?
GTFO

Visa signatur

Att förespråka Mac på Swec är som att förespråka hybridbilar på en raggarträff i Mora.

Permalänk
Medlem

Förutom det här med personuppgifter så anser jag att AI-företagen måste uttrycklig tillåtelse att få använda data för att träna sin AI med. Att de inte bara kan skanna av internet efter data och använda det. Tänk om någon skannade igenom hela Spotify för att göra en musik skapar AI, inte ok. Och samma bör gälla i princip alla annan information som uttryckligen ger tillåtelse att träna AI.

Visa signatur

Min Dator: AMD 3600 | GTX 680 | 16 GB RAM | Asus X570 Prime | Fractal Design Arc R2 | Thermalright Silver Arrow | Dell U2412M | Ibm Model M

Permalänk
Medlem
Skrivet av WebbkodsLärlingen:

huruvida något är (in)korrekt är helt och hållet upp till slutanvändaren att bedöma, precis som all "information" erhållen både online och offline.

Mvh,
WKL.

Vilket jävla dravel.

Om något idiot till slutanvändare får för sig att Svart RGB är 57,182,90 för att någon språkmodell gett dom inkorrekt information så ändrar det på något sätt inte fakta om vad RGB koden för svart faktiskt är.

Du får ha din åsikt om fakta och information men du ska inte tror att resten av oss kommer acceptera struntprat.

Permalänk
Hedersmedlem
Skrivet av hölmiz:

Förutom det här med personuppgifter så anser jag att AI-företagen måste uttrycklig tillåtelse att få använda data för att träna sin AI med. Att de inte bara kan skanna av internet efter data och använda det. Tänk om någon skannade igenom hela Spotify för att göra en musik skapar AI, inte ok. Och samma bör gälla i princip alla annan information som uttryckligen ger tillåtelse att träna AI.

Det här låter som en alldeles fantastisk affärsmodell ja haha!
Man kan lära AIn hur all känd musik låter. Sen kan den återskapa dessa album lokalt hos varje användare på beställning.

Allt innehåll är AIgenererat. Det blir som en nyinspelning av samma innehåll bara. Det är kunden som skapat det lokalt så företaget säljer inte någon annans verk heller utan det som säljs är en "duktig AIkompositör" som är tränad på musik som redan finns. Så inga royalties från företaget då? 😅

Vilket trassel!

Visa signatur

🎮 → Node 304 • Ryzen 5 2600 + Nh-D14 • Gainward RTX 2070 • 32GB DDR4 • MSI B450I Gaming Plus AC
🖥️ → Acer Nitro XV273K Pbmiipphzx • 🥽 → VR: Samsung HMD Odyssey+
🎧 → Steelseries arctic 7 2019
🖱️ → Logitech g603 | ⌨️ → Logitech MX Keys
💻 → Lenovo Yoga slim 7 pro 14" Oled

Permalänk
Medlem
Skrivet av WebbkodsLärlingen:

Om man inte förstår att LLM:s såsom ChatGPT genererar statistiskt beräknade svar och inte hämtar länkar till webbplatser med sannolika svar likt sökmotorer så tycker jag att man inte ska använda de slags "AI"-tjänsterna.

Now now, hold your horses.

Men ja, man kan pedagogiskt försöka förklara att AI-chat inte lagrad information. "Resten av Internet finns lagrat någonstans, AI skapar beroende på vad du skriver." Man får liksom hålla det på en låg nivå.

Kund: Datorn fungerar inte! Jag försöker fucking jobba här!
Kundtjänst: Har du satt i strömsladden?

Permalänk
Medlem
Skrivet av Söderbäck:

Det här låter som en alldeles fantastisk affärsmodell ja haha!
Man kan lära AIn hur all känd musik låter. Sen kan den återskapa dessa album lokalt hos varje användare på beställning.

Allt innehåll är AIgenererat. Det blir som en nyinspelning av samma innehåll bara. Det är kunden som skapat det lokalt så företaget säljer inte någon annans verk heller utan det som säljs är en "duktig AIkompositör" som är tränad på musik som redan finns. Så inga royalties från företaget då? 😅

Vilket trassel!

Särskilt som covers är lagligt idag. Bara att vi kan härma rösten perfekt i vårt cover band nu

Visa signatur

Processor: Motorola 68000 | Klockfrekvens: 7,09 Mhz (PAL) | Minne: 256 kB ROM / 512 kB RAM | Bussbredd: 24 bit | Joystick: Tac2 | Operativsystem: Amiga OS 1.3

Permalänk
Medlem
Skrivet av talonmas:

Nja, det görs en hel del supervised training och validering på modellerna. Och de dataset som den tränas på genomgår väldigt mycket manuell modifiering.

Sen finns all data om oss i deras dataset. Och när modellen är tränad är det i praktiken en länk till den datan som används (vektordatabasen som byggts upp).

Jag har tränat en del modeller och skapat några LoRAs och använt embedding med RAG. Alla svar är inte "statistiskt påhittade" som du vill få det till. Statistik är grundpelaren, ja, men den är lång ifrån allt idag.

Var kan man få reda på vad Open Ai har för dataset och hur träningen utförs, låter riktigt intressant.

Permalänk
Medlem
Skrivet av hölmiz:

Förutom det här med personuppgifter så anser jag att AI-företagen måste uttrycklig tillåtelse att få använda data för att träna sin AI med. Att de inte bara kan skanna av internet efter data och använda det. Tänk om någon skannade igenom hela Spotify för att göra en musik skapar AI, inte ok. Och samma bör gälla i princip alla annan information som uttryckligen ger tillåtelse att träna AI.

När Sveriges gyllene unicorn Spotify börja, så bestod nästan 100% av deras musik av nedladdad piratmusik.
Har för mig det tog flera år innan dom överhuvudtaget säkrade några musikkontakt.

Är det inte värre att stjäla rakt av än att ha en AI generalisera information?

Hur mkt du än bråkar och vill får du aldrig ut originalet exakt från en AI, då AI är en "lossy compressed" version av information den tränats på.

Permalänk
Hedersmedlem
Skrivet av Dyluck:

När Sveriges gyllene unicorn Spotify börja, så bestod nästan 100% av deras musik av nedladdad piratmusik.
Har för mig det tog flera år innan dom överhuvudtaget säkrade några musikkontakt.

Är det inte värre att stjäla rakt av än att ha en AI generalisera information?

Hur mkt du än bråkar och vill får du aldrig ut originalet exakt från en AI, då AI är en "lossy compressed" version av information den tränats på.

Du behöver inte ha en exakt kopia för att det ska vara en kopia. Kopierar du musik utan upphovsmannens tillstånd och utanför ramarna för laglig privatkopiering etc, så är det fortfarande ett upphovsrättsbrott även om du använder MP3-komprimering.

Permalänk
Medlem
Visa signatur

JJ2 Multiplayer
JJ2 ZStats

[1] Ryzen 5800X | 5500XT | Kingston A2000 | Lenovo G24-10 144Hz [2] Ryzen 5700G | RX 560 | WD Blue SN550 [3] Ryzen 5600G | Kingston A2000 [4] Ryzen 3600 | GT 740 | 850 EVO [5] Ryzen 3600 | Geforce 405 | 850 EVO (alla är i bruk)

Permalänk
Medlem
Skrivet av Dyluck:

När Sveriges gyllene unicorn Spotify börja, så bestod nästan 100% av deras musik av nedladdad piratmusik.
Har för mig det tog flera år innan dom överhuvudtaget säkrade några musikkontakt.

Är det inte värre att stjäla rakt av än att ha en AI generalisera information?

Hur mkt du än bråkar och vill får du aldrig ut originalet exakt från en AI, då AI är en "lossy compressed" version av information den tränats på.

Jasså det var intressant, har du någon källa på det för den som vill läsa mera?

Permalänk
Medlem
Skrivet av Nr42:

Jasså det var intressant, har du någon källa på det för den som vill läsa mera?

Några länkar kommer här:

https://www.di.se/digital/han-skriver-en-bok-om-spotify-det-v...

https://torrentfreak.com/spotifys-beta-used-pirate-mp3-files-...

Permalänk
Medlem
Skrivet av Nr42:

Var kan man få reda på vad Open Ai har för dataset och hur träningen utförs, låter riktigt intressant.

Open AI gör samma sak som forskare har gjort länge. De har bara mycket mer data. Men träningen går till på samma sätt.

Om du vill veta mer om machine learning så är här ett bra community att börja med https://www.kaggle.com/
Finns allt.

Openai.com har själva bra tutorials om allt AI relaterat. Och huggingface såklart (typ GIT för AI).

Visa signatur

Processor: Motorola 68000 | Klockfrekvens: 7,09 Mhz (PAL) | Minne: 256 kB ROM / 512 kB RAM | Bussbredd: 24 bit | Joystick: Tac2 | Operativsystem: Amiga OS 1.3

Permalänk
Medlem

Tackar så mycket, nu har jag lite toa-läsning

Permalänk
Medlem

Om det nu blir kraftiga begränsningar inom EU pga någon lagstiftning, finns det väl en risk för att vi hamnar på efterkälken av länder som inte har dom begränsningarna?
Knepigt det här!

Permalänk
Medlem

Relaterat :

"Lärare i USA anklagas för iscensatt rasismskandal – använde sig av AI"

https://www.svt.se/nyheter/utrikes/larare-i-usa-anklagas-for-...