AI-bottar är usla på källhänvisning

Permalänk
Medlem
Skrivet av johanandersson:

Ja, det är riktigt tråkigt att se hur både redaktion och medlemmar på Sweclockers är så negativt inställda till tekniken. Knappast så att den är perfekt, men det är en nästan chockerande vinklad bild av generativ AI som målas upp här.

Det sker riktigt stora framsteg nästan varje månad i många olika aspekter och som någon som jobbar med generativ AI så finns det gott om tillämpningsområden för både hobby och industri.

Det värsta är nästan den helt absurda omtolkningen av upphovsrätt. Från att redan vara extremt grov i vad den skyddade när det kom till rena återskapelser till att den ska kunna användas för att stoppa all form av värdeskapande användning av skyddat material, bara för att folk tänker att det hade kunnat stoppa utvecklingen. De tolkningar av upphovsrätt som blivit populära senaste åren hade omöjliggjort allt från modern kompression till sökmotorer, utöver att de är absurda i sig själva.

Forma inte er bild av den moderna utvecklingen av AI från det som skrivs på Sweclockers.

Sweclockers publik består av en stor skara tekniska boomers. Nästan sllt nytt är dåligt, man har glömt varför man började läsa denna sida en gång i tiden. Det är nöstan så man vill gå bakåt i tiden.
Dessa är att likställa med en tiktok braindamage ungdom.
Det är ett fenomen som inte är Sweclockers unikt.

Visa signatur

🇸🇪 VR Sverige Discord server - Svensk VR Community
https://discord.com/invite/avnhs6mgjc

Permalänk
Medlem

"Premiumtjänster genererar mer självsäkra felaktiga svar än gratistjänster."

Permalänk
Medlem

AI är ett verktyg och verktyg måste hanteras rätt för att vara effektiva.
Folk verkar tro att bara för att de kan skriva i input fönstret så vet de hur man använder AI.
Det är exakt samma sak som om Nisse skulle plocka upp pinnsvetsen för att laga länkarmarna på sin bil utan någon som helst svetsträning.
Skriver en skitdåliga promter så får man skitdåliga svar. Förstår man inte AIs styrkor och svagheter så får man skitdåliga svar.

Skrivet av Molotov:

Sweclockers publik består av en stor skara tekniska boomers. Nästan sllt nytt är dåligt, man har glömt varför man började läsa denna sida en gång i tiden. Det är nöstan så man vill gå bakåt i tiden.
Dessa är att likställa med en tiktok braindamage ungdom.
Det är ett fenomen som inte är Sweclockers unikt.

Det är snarare de nyare medlemmarna som har dålig koll på teknik. Sweclockers forum blir sämre och sämre för var dag för kunskapsnivån sjunker konstant. Många äldre försvinner med tiden och de yngre plockar inte upp facklan.

Visa signatur

R&D Elektronik & Radioingenjör

Permalänk
Skrivet av Nr42:

Jaså kommer den? Har du något belägg för detta påstående? Såg en intressant video om detta för ett tag sen som målade en annan bild av det hela: https://youtu.be/rFGcqWbwvyc?si=MoBjp8D5LoCMW1Wn

Och hur länge kommer den vara gratis? Just nu drivs alla "AI" satsningar av investeringar, investerarna kommer vilja ha tillbaka sin investeringar plus vinst. När det händer kommer användarna behöva betala och vad kommer det då kosta?

https://techcrunch.com/2025/03/05/openai-reportedly-plans-to-...

Skulle se om någon insåg ironin
Vi människor snackar ofta utan källhänvisningar

Permalänk
Medlem
Skrivet av dblade:

Jag tror motståndet ibland bottnar i en djupare oro – kanske handlar det om rädsla att förlora kontrollen, eller oviljan att släppa taget om invanda mönster. Historiskt sett är ju stora förändringar alltid lite skrämmande först, innan vi inser hur självklara de egentligen var. Visst, vi kanske tappar en del av detaljkontrollen, men samtidigt får vi en tydligare blick för helheten.

Jag håller inte med alls. Hur, när AI gör jobbet åt dig, får du en tydligare blick för helheten? Av 20 steg kanske du förstår steg 1, 7, och 18 medan AI sköter resten. Hur ska du kunna förstå helheten då?

I dagsläget används AI i stor utsträckning av människor som i avsaknad av egen kunskap eller erfarenhet tar genvägar genom att låta AI göra saker åt dem (i stället för att lära sig hur man gör X, Y, Z och sedan pusslar ihop sin egna lösning utifrån dessa kunskaper). Jag tror personligen att detta kommer leda till att allmänheten lär sig nya saker i mycket mindre utsträckning och att kunskap till slut går förlorad, och att när det kommer till vissa områden kan det ge allvarliga konsekvenser.

Inga unga som kan någonting om IT-infrastruktur? Aj fan, gamla Bengt som kunde allt om allt gick i pension förra veckan och nu är det en omfattande driftstörning. Trist, "nu är Internet nere" för Wilgot och ChatGPT kan heller inte ge honom rådet att slå av och på sin router.

Jag är erkänt fördomsfull mot de som välkomnar AI med öppna armar utan någon som helst oro. Känns som ni lever i en sagovärld. Kan bli lite avis på det ibland, låter rätt skönt att slippa ha konsekvenstänk.

Permalänk
Medlem
Skrivet av Rebben:

Det är snarare de nyare medlemmarna som har dålig koll på teknik. Sweclockers forum blir sämre och sämre för var dag för kunskapsnivån sjunker konstant. Många äldre försvinner med tiden och de yngre plockar inte upp facklan.

Nya medlemmar kan ju fortfarande vara "gamla" Teknik boomer tänker jag inte nödvändigtvis betyder äldre. Finns många "yngre" som tycker att allt nytt är dåligt också.

Visa signatur

🇸🇪 VR Sverige Discord server - Svensk VR Community
https://discord.com/invite/avnhs6mgjc

Permalänk
Medlem
Skrivet av Workout51:

Skulle se om någon insåg ironin
Vi människor snackar ofta utan källhänvisningar

Så du skulle "se om någon insåg ironin" av att klaga på "AIs" dåliga referenser när människor inte använder referenser i dagligt tal genom att hänvisa till en "AI" som är gjord för att används i forskning där referenser är extremt viktigt?

Verkar mest som om du varken vet hur dagens "AI", referenser eller forskning fungerar.

Jag har egentligen inget problem med "AI" i sig, det jag har problem med är marknadsföringen runt det hela som får folk att tro att LLMer har någon form av medvetenhet i vad dom gör, eller ens svarar som dom gör.

Permalänk
Skrivet av Nr42:

Så du skulle "se om någon insåg ironin" av att klaga på "AIs" dåliga referenser när människor inte använder referenser i dagligt tal genom att hänvisa till en "AI" som är gjord för att används i forskning där referenser är extremt viktigt?

Verkar mest som om du varken vet hur dagens "AI", referenser eller forskning fungerar.

Jag har egentligen inget problem med "AI" i sig, det jag har problem med är marknadsföringen runt det hela som får folk att tro att LLMer har någon form av medvetenhet i vad dom gör, eller ens svarar som dom gör.

Nej källan till mitt uttalande.
Det är kanon att vara kritisk men att inte lyfta upp det positiva blir inte balanserat, inte sant?
Finns ju en anledning att de fick Nobelpris, ingen liten sak.

Permalänk
Hedersmedlem
Skrivet av Workout51:

Kan hålla med. Väldigt få positiva nyheter om AI här.

T.ex. släppte Google Deep research nyligen som kommer förbättra forskning något enormt och den är väldigt noga med att referera källor. För övrigt gratis att använda för de som vill testa.

Bra tips. Jag frågade först hur upprustningen i europa kunde tänkas påverka vinsten för Rheinmetall (bomber och granater), men kände sen att den frågan var alldeles för enkel, internet svämmar över av svar på den. Så jag provade även att fråga hur upprustningen i europa skulle kunna påverka vinsten för Matell (barbie och fisher-price).

No Direct Connection Found
After looking into Mattel's business and the trends in European military spending, I haven't found any direct evidence suggesting that increased military expenditure in Europe will significantly affect Mattel's earnings. Mattel's performance seems to be more closely tied to general economic conditions and consumer spending on leisure goods.
Indirect Economic Influences
While a direct impact is unlikely, I considered whether broader economic shifts in Europe, potentially influenced by military spending, could indirectly affect toy sales. Factors like inflation, consumer confidence, and overall economic growth are more likely to be the key drivers for how much consumers spend on toys.

Jag tycker den får godkänt.

Visa signatur

I am a prototype for a much larger s󠅄󠅘󠅕󠄐󠅞󠅕󠅕󠅔󠄐󠅤󠅟󠄐󠅒󠅕󠄐󠅟󠅒󠅣󠅕󠅢󠅦󠅕󠅔󠄐󠅑󠅞󠅔󠄐󠅥󠅞󠅔󠅕󠅢󠅣󠅤󠅟󠅟󠅔󠄐󠅧󠅑󠅣󠄐󠅟󠅞󠅓󠅕󠄐󠅣󠅑󠅤󠅙󠅣󠅖󠅙󠅕󠅔󠄐󠅒󠅩󠄐󠄷󠅟󠅔󠄞󠄐󠄾󠅟󠅧󠄐󠅧󠅕󠄐󠅓󠅑󠅞󠄐󠅙󠅝󠅠󠅜󠅕󠅝󠅕󠅞󠅤󠄐󠅤󠅘󠅕󠄐󠅣󠅑󠅝󠅕󠄐󠅖󠅥󠅞󠅓󠅤󠅙󠅟󠅞󠅑󠅜󠅙󠅤󠅩󠄐󠅧󠅙󠅤󠅘󠄐󠅔󠅑󠅤󠅑󠄝󠅝󠅙󠅞󠅙󠅞󠅗󠄐󠅑󠅜󠅗󠅟󠅢󠅙󠅤󠅘󠅝󠅣󠄞ystem

Permalänk
Medlem
Skrivet av Workout51:

Nej källan till mitt uttalande.
Det är kanon att vara kritisk men att inte lyfta upp det positiva blir inte balanserat, inte sant?
Finns ju en anledning att de fick Nobelpris, ingen liten sak.

Det första som hände var att jag ville ha en källa till ditt uttalande, vilket du fortfarande inte har bidragit med. Känns mer och mer som att jag skriver till en LLM, allt du skriver känns helt random.

Vad menar du ens med "Nej källan till mitt uttalande."?

Finns det ens något positivt att rapportera om?

Vilka fick Nobelpris, i vad och vad har det med kritik mot LLMer att göra?

Referenser är, som du kanske märker, väldigt viktiga. Utan referenser kan det vara svårt att veta vad du pratar om.

Permalänk

Lite ordbajseri här. Jag tror ingen i denna tråd tror att en LLM är en generell allvetande AI. De flesta har en bra uppfattning om vad LLM gör, att de samlar in data och resultatet ut kommer från denna baserat på någon sannolikhet.
Man behöver inte kunna ett skit om datorteknik för att förstå att dessa LLM kommer ge ut en massa felaktigheter, samtidigt så behöver man inte kunna ett skit inom datorteknik för att det kan vara ett bra verktyg.

Se en LLM som skiftnyckel på en verkstad, den som tar med en skiftnyckel till en verkstad och frågar om någon behöver ha hjälp gör detta bara en gång. Dock är skiftnyckel ändå ett bra verktyg då man inte kan bära alla fastsa nycklar hela tiden.
På samma sätt är LLM bra. Jag använder LLM främst till saker som jag kan göra själv, jag kan dock inte frysa tiden så jag får tid att göra detta själv. Jag ställer då en fråga till LLM och jag vet vad svaret borde bli, det man får från LLM om det är rimligt kan man testa. Ju mer viktigt att det inte blir fel ju mer får man kontrollera innan.
Det fina med LLM är att man kan göra raka motsatsen, ta ett sådant enkelt som att beräkna begränsingsmotstånd för en lysdiod i en krets. Man gör sin beräkning, sedan frågar en LLM och om svaret är samma. Så har LLM gjort att man har testat av sitt svar mer.

Permalänk
Medlem
Skrivet av Aphex:

Bra tips. Jag frågade först hur upprustningen i europa kunde tänkas påverka vinsten för Rheinmetall (bomber och granater), men kände sen att den frågan var alldeles för enkel, internet svämmar över av svar på den. Så jag provade även att fråga hur upprustningen i europa skulle kunna påverka vinsten för Matell (barbie och fisher-price).

No Direct Connection Found
After looking into Mattel's business and the trends in European military spending, I haven't found any direct evidence suggesting that increased military expenditure in Europe will significantly affect Mattel's earnings. Mattel's performance seems to be more closely tied to general economic conditions and consumer spending on leisure goods.
Indirect Economic Influences
While a direct impact is unlikely, I considered whether broader economic shifts in Europe, potentially influenced by military spending, could indirectly affect toy sales. Factors like inflation, consumer confidence, and overall economic growth are more likely to be the key drivers for how much consumers spend on toys.

Jag tycker den får godkänt.

Så för att få godkänt så behöver man ha en ytlig kännedom om hur ekonomi fungerar, vad Mattel gör och vad Rheinmetall är? Hade du frågat random person på gatan hade du fått ett likvärdigt svar, och, precis som här, utan referenser. Hade du frågat två personer och köpt varsin öl till dom hade du antagligen fått bättre svar, och kanske referenser.

Permalänk
Medlem

Faktasökande i all ära. Jag kan inte ens få min prenumerations-tjänst chatgpt att skriva en limerick som inte har påhittade ord eller är helt fel. Den kan inte identifiera en limerick heller när jag ger den en. Då är det ändå språk som den ska va bra på.

Visa signatur

Gigabyte RTX 3070 | Samsung 980 | AMD 5950x
32GB 3600MHz CL14 | Corsair RM850X | ASUS ROG CROSSHAIR VIII DARK HERO
Skärm: Acer 27" ConceptD CP3271KP IPS 4K HDR 144 hz

Skriv gärna ett svar om ditt problem löste sig.

Permalänk
Medlem
Skrivet av lillaankan_i_dammen:

Lite ordbajseri här. Jag tror ingen i denna tråd tror att en LLM är en generell allvetande AI. De flesta har en bra uppfattning om vad LLM gör, att de samlar in data och resultatet ut kommer från denna baserat på någon sannolikhet.
Man behöver inte kunna ett skit om datorteknik för att förstå att dessa LLM kommer ge ut en massa felaktigheter, samtidigt så behöver man inte kunna ett skit inom datorteknik för att det kan vara ett bra verktyg.

Se en LLM som skiftnyckel på en verkstad, den som tar med en skiftnyckel till en verkstad och frågar om någon behöver ha hjälp gör detta bara en gång. Dock är skiftnyckel ändå ett bra verktyg då man inte kan bära alla fastsa nycklar hela tiden.
På samma sätt är LLM bra. Jag använder LLM främst till saker som jag kan göra själv, jag kan dock inte frysa tiden så jag får tid att göra detta själv. Jag ställer då en fråga till LLM och jag vet vad svaret borde bli, det man får från LLM om det är rimligt kan man testa. Ju mer viktigt att det inte blir fel ju mer får man kontrollera innan.
Det fina med LLM är att man kan göra raka motsatsen, ta ett sådant enkelt som att beräkna begränsingsmotstånd för en lysdiod i en krets. Man gör sin beräkning, sedan frågar en LLM och om svaret är samma. Så har LLM gjort att man har testat av sitt svar mer.

Jag tror att du kanske ger folk lite mycket cred, verkar vara alldeles för mycket folk som tror att LLMer är, kanske inte allvetande (men kanske ännu värre), medvetande.

Permalänk
Hedersmedlem
Skrivet av Nr42:

Så för att få godkänt så behöver man ha en ytlig kännedom om hur ekonomi fungerar, vad Mattel gör och vad Rheinmetall är? Hade du frågat random person på gatan hade du fått ett likvärdigt svar, och, precis som här, utan referenser. Hade du frågat två personer och köpt varsin öl till dom hade du antagligen fått bättre svar, och kanske referenser.

Okej surbubbe, här är hela rapporten den producerade, med referenser.
https://gemini.google.com/share/01b24f044e8a

Men jag tycker stegen den tog för att komma fram till den var intressantare, testa själv.

En kortare fråga besvaras så här:

Visa signatur

I am a prototype for a much larger s󠅄󠅘󠅕󠄐󠅞󠅕󠅕󠅔󠄐󠅤󠅟󠄐󠅒󠅕󠄐󠅟󠅒󠅣󠅕󠅢󠅦󠅕󠅔󠄐󠅑󠅞󠅔󠄐󠅥󠅞󠅔󠅕󠅢󠅣󠅤󠅟󠅟󠅔󠄐󠅧󠅑󠅣󠄐󠅟󠅞󠅓󠅕󠄐󠅣󠅑󠅤󠅙󠅣󠅖󠅙󠅕󠅔󠄐󠅒󠅩󠄐󠄷󠅟󠅔󠄞󠄐󠄾󠅟󠅧󠄐󠅧󠅕󠄐󠅓󠅑󠅞󠄐󠅙󠅝󠅠󠅜󠅕󠅝󠅕󠅞󠅤󠄐󠅤󠅘󠅕󠄐󠅣󠅑󠅝󠅕󠄐󠅖󠅥󠅞󠅓󠅤󠅙󠅟󠅞󠅑󠅜󠅙󠅤󠅩󠄐󠅧󠅙󠅤󠅘󠄐󠅔󠅑󠅤󠅑󠄝󠅝󠅙󠅞󠅙󠅞󠅗󠄐󠅑󠅜󠅗󠅟󠅢󠅙󠅤󠅘󠅝󠅣󠄞ystem

Permalänk
Medlem
Skrivet av lillaankan_i_dammen:

När jag var liten så sa många samma sak om information på internet, information från internet var information som ej gick att lita på.
Nå Ai blir bättre för varje år, jag tycker folk är för ivriga och klaga på denna. Jag ser det som att klaga på hur dåligt internet är år 1994 utan att se att internet utvecklas och kan bli riktigt bra.

Jag såg ett reportage på svt att präster nu hade börjat använda Ai och det är coolt att det har blivit så utbrett. Men man får ha lite tålamod, om 20år så kan man nog lita mer på AI.

Nej nu får jag ut och bedriva min insamling till en kraftfull AI dator som kan ta fram svaret på den yttersta frågan om livet, universum och allting. Jag skattar kostnaden för denna AI dator till endast 10 000 miljarder dollar.

En sån dator som i "The Hitchhiker’s Guide to the Galaxy" 😁

Permalänk
Skrivet av friArsenik:

En sån dator som i "The Hitchhiker’s Guide to the Galaxy" 😁

Exakt. Det enda negativa är att jag skulle vilja se folks ansiktsuttryck när de får höra svaret som deras hårt tjänade pengar gick till att ta fram.

Permalänk
Medlem
Skrivet av lillaankan_i_dammen:

Exakt. Det enda negativa är att jag skulle vilja se folks ansiktsuttryck när de får höra svaret som deras hårt tjänade pengar gick till att ta fram.

😁😁😁

Permalänk
Medlem
Skrivet av dblade:

Jag tror motståndet ibland bottnar i en djupare oro – kanske handlar det om rädsla att förlora kontrollen, eller oviljan att släppa taget om invanda mönster. Historiskt sett är ju stora förändringar alltid lite skrämmande först, innan vi inser hur självklara de egentligen var. Visst, vi kanske tappar en del av detaljkontrollen, men samtidigt får vi en tydligare blick för helheten.

För mig är det att kvalitén på så många områden sjunkit som en sten och fortsätter att sjunka allt för att öka profit margins. Det handlar inte om att förbättra kvalitén på något utan det är bara att spara tid (vilket i företags syften ska läsas som pengar) och vi som konsumerar tjänster/produkter är de som får lida för det.

När AI används bra så märks det inte, det finns garanterat många områden i olika industrier där det är fallet och man har ingen aning om att AI används där och det är inga problem.

Det finns MASSOR av områden däremot som nu blir sämre och sämre för det kan automatiseras för extremt låga summor, titta på alla "artiklar" som finns på nätet nu som bara är helt automatiserade AI genererade artiklar utan någon som helst värde som fyller upp sök resultat exempelvis. Om det redan är så illa så tvivlar jag på att det kommer bli bättre när pengar finns att spara. Andra exempel är ljudböcker där istället för att betala en person att läsa upp det så genererar man AI voice billigt och självklart blir inte produkten nå billigare för det ändå. Desto mer "förväntat" detta blir desto mindre kommer "riktiga" alternativen existera tills det i slutet inte är viable för företag att göra de alls och då försvinner hela den produkten.

Visa signatur

AMD Ryzen 7 7800X3D | Noctua NH-U12A | Gigabyte B650 Aorus Elite AX | Corsair 2x16GB DDR5 6000MHz CL30 Vengeance RGB | Sapphire RX 9070 XT Pure | Fractal Design Torrent Compact | Seasonic Prime GX 1300W | MSI Optix MAG274QRF-QD + HP ZR24w | WD Black SN850X 2TB | Windows 11 Home 64-Bit |

Permalänk
Testpilot
Skrivet av Roger W:

En människa hade förhoppningsvis inte självsäkert blåljugit och hittat på referenser och källhänvisningar...

Kollade du hänvisningarna? Stämde dem?

[...]

Det finns gott om folk som står fast vid sina åsikter, oavsett hur mycket bevis som talar emot dem. Även om de inte nödvändigtvis hittar på källor, är det inte heller ovanligt att de hänvisar till material av tveksam kvalitet eller låg trovärdighet – man behöver inte leta längre än valfri Reddit- eller Facebookgrupp för att hitta praktiska exempel på detta. 😄

Jag hittade inga konstigheter när det kom till tangentbordssökningar och kravspecifikationer, men det betyder självklart inte att problem inte kan uppstå vid andra ämnessökningar. Alla länkar jag klickade på ledde antingen till Reddit-poster eller faktiska artiklar på ämnet. De gånger jag jämförde den genererade tabellen med informationen på den hänvisade länken stämde allt överens (typ av brytare, mått o.s.v.).

Som Yoshman redan nämnt handlar mycket med AI-tjänster som ChatGPT om att förstå vad de kan och inte kan göra, var deras begränsningar ligger och i förlängningen hur bra man själv är på att formulera sina frågor. Ju bättre förståelse man har för ämnet, desto bättre blir resultaten – särskilt genom att ställa följdfrågor och kunna bedöma rimligheten i svaren. Oavsett detta bör man alltid vara kritisk och korsreferera svaren, istället för att blint lita på det första som genereras

Den här inställningen är relevant även när det gäller saker som LLM är riktigt bra på. Om jag exempelvis ber ChatGPT eller en liknande tjänst att sammanfatta en artikel, korrekturläsa en text eller utföra liknande uppgifter, skulle jag ändå alltid gå igenom resultatet minst en gång. Dels för att faktagranska, men också för att säkerställa att inget har ändrats på ett sätt som påverkar tonen åt endera håll – särskilt om det är en egenskriven text jag använder verktyget för.

Kort sagt: AI är aldrig bättre än användaren. Däremot kan LLM vara ett otroligt kraftfullt verktyg i vardagen, studier och arbetslivet – så länge det används ansvarsfullt. Jag litar varken mer eller mindre på AI än på artiklar som dyker upp vid en Google-sökning – grundläggande källkritik och korsreferering är alltid ett måste.

Visa signatur

< R9 5900X | 32GB 3200 MT/s | RTX 3090 Ti >

< R5 7600X | 32GB 6400 MT/s | RX 9070 XT >

Permalänk
Skrivet av Yatagarasu:

Jag har själv experimenterat en hel del med det och har än så länge inte haft mycket att klaga på. Exempelvis tog det mig cirka 16 minuter att få ett samlat svar när jag sökte efter mekaniska tangentbord med XYZ-specifikationer. Då fick jag dessutom med ett trettiotal källhänvisningar samt en sammanfattning av resonemangen bakom urvalen.

Möjligen antropomorfiserar du LLM:er för mycket nu. Med "resonemang" hos LLM:er är snarare vilken ordföljd statistiskt talat utifrån givna träningsdata bör användas för att på så vis emulera hur en människa skulle kunna resonera.

På tal om dina trettiotal källhänvisningar: kontrollerade du först att alla dessa länkar fanns/var giltiga och lusläste du sedan att LLM:en ifråga endast nyttjade faktiska ord eller giltiga omskrivningar av ord från respektive källa så det inte blev en slags hallucination från någon källa? (t.ex. använda icke-existerande fakta från en källa bara för att det statistiskt talat vore sannolikt att det skulle finnas utifrån givna träningsdata)

Glöm aldrig att LLM:er är tränade främst på människodata (=ord skrivna av människor) och därmed ser ordföljden statistiskt talat ut som om en människa har "skrivit" det, varav den enorma självrisken för att antropomorfisera bokstavligen talat statistisk ordföljd.

Mvh,
WKF.

Visa signatur

"Den säkraste koden är den som aldrig skrivs"
"Visste du förresten att det är ett mångmiljardbolag?"
"Jag lever inte för att koda utan kodar för att sen kunna leva"

Permalänk
Testpilot
Skrivet av WebbkodsFrilansaren:

Möjligen antropomorfiserar du LLM:er för mycket nu. Med "resonemang" hos LLM:er är snarare vilken ordföljd statistiskt talat utifrån givna träningsdata bör användas för att på så vis emulera hur en människa skulle kunna resonera.

Jag använder samma terminologi som programmen själva gör och lägger ingen större vikt vid det. Jag hade lika gärna kunnat formulera meningen som 'AI:n nådde resultatet genom denna process', men det är helt enkelt mer fördelaktigt att använda ordet 'resonera' och dess böjningar om det ska återupprepas – de flesta förstår vad som menas, samt att det gör textstycken mer lättöverskådliga

Skrivet av WebbkodsFrilansaren:

På tal om dina trettiotal källhänvisningar: kontrollerade du först att alla dessa länkar fanns/var giltiga och lusläste du sedan att LLM:en ifråga endast nyttjade faktiska ord eller giltiga omskrivningar av ord från respektive källa så det inte blev en slags hallucination från någon källa? (t.ex. använda icke-existerande fakta från en källa bara för att det statistiskt talat vore sannolikt att det skulle finnas utifrån givna träningsdata)

Glöm aldrig att LLM:er är tränade främst på människodata (=ord skrivna av människor) och därmed ser ordföljden statistiskt talat ut som om en människa har "skrivit" det, varav den enorma självrisken för att antropomorfisera bokstavligen talat statistisk ordföljd.

Mvh,
WKF.

Svaret till detta kan läsas ovan.

Visa signatur

< R9 5900X | 32GB 3200 MT/s | RTX 3090 Ti >

< R5 7600X | 32GB 6400 MT/s | RX 9070 XT >

Permalänk
Medlem

Jag är mer oroad över människor som tror på allt som det skattefinansierad media förmedlar!

Permalänk
Medlem
Skrivet av Yatagarasu:

Jag är genuint nyfiken på frågeställningarna kring detta – om man lyckas få en AI-bot att svara fel i 197 av 200 fall. Eller ja, när man faktiskt öppnar själva publikationen ser man snabbt att det inte handlar så mycket om att ställa en fråga, utan snarare om att be en riktig assistent utföra ett arbete som förväntas göras åt en forskare. Alltså inte några enkla frågor med rimliga snabbsvar.

Det blir därför missvisande att hävda en så hög grad av felaktiga källhänvisningar. En människa hade knappast gjort ett bättre jobb om informationen inte redan fanns högt upp i en Google-sökning. För mig känns detta som en "nothing-burger" och en vinklad användning av statistik. Även om slutsatsen inte nödvändigtvis är felaktig, är det ett dåligt sätt att använda verktygen i fråga.

Dessutom verkar denna publikation inte ha använt de senaste modellerna och funktionerna, såsom OpenAI DeepSearch. Just DeepSearch är ett stort steg framåt när det gäller att öppet visa hur resonemang förs, hur information inhämtas och vart ifrån. Jag har själv experimenterat en hel del med det och har än så länge inte haft mycket att klaga på. Exempelvis tog det mig cirka 16 minuter att få ett samlat svar när jag sökte efter mekaniska tangentbord med XYZ-specifikationer. Då fick jag dessutom med ett trettiotal källhänvisningar samt en sammanfattning av resonemangen bakom urvalen.

Poängen är väl mest med denna studie att se hur AI:en beter sig när den rimligtvis kommer ha fel eller inte ha korrekt data, kommer den svara "smart/bra" (för människor som använder den) och säga att den inte vet eller komma med bullshit? Det är trots allt viktigt att undersöka sådant. Tänk om folk börjar ställa frågor som om de kan blanda t.ex. blekmedel med ammoniak, eller andra saker där svaren faktiskt spelar roll. Där är det ju bättre att få ett "jag vet inte, kemi kan vara farligt" än, "ja, det blir jättebra, lägg det på en pizza och njut".

Men största problemet är ju att jag som man vill ju inte att någon robot ska killgissa mer än vad jag gör, för då försvinner mitt existensberättigande.

Visa signatur

There can be only ONE...

Permalänk
Medlem
Skrivet av Yatagarasu:

Jag är genuint nyfiken på frågeställningarna kring detta – om man lyckas få en AI-bot att svara fel i 197 av 200 fall. Eller ja, när man faktiskt öppnar själva publikationen ser man snabbt att det inte handlar så mycket om att ställa en fråga, utan snarare om att be en riktig assistent utföra ett arbete som förväntas göras åt en forskare. Alltså inte några enkla frågor med rimliga snabbsvar.

Det blir därför missvisande att hävda en så hög grad av felaktiga källhänvisningar. En människa hade knappast gjort ett bättre jobb om informationen inte redan fanns högt upp i en Google-sökning. För mig känns detta som en "nothing-burger" och en vinklad användning av statistik. Även om slutsatsen inte nödvändigtvis är felaktig, är det ett dåligt sätt att använda verktygen i fråga.

Dessutom verkar denna publikation inte ha använt de senaste modellerna och funktionerna, såsom OpenAI DeepSearch. Just DeepSearch är ett stort steg framåt när det gäller att öppet visa hur resonemang förs, hur information inhämtas och vart ifrån. Jag har själv experimenterat en hel del med det och har än så länge inte haft mycket att klaga på. Exempelvis tog det mig cirka 16 minuter att få ett samlat svar när jag sökte efter mekaniska tangentbord med XYZ-specifikationer. Då fick jag dessutom med ett trettiotal källhänvisningar samt en sammanfattning av resonemangen bakom urvalen.

Besvikelsen de lägger fram är väl inte att de inte får rätt svar på alla frågor, utan att de får självsäkra hittepåsvar när det inte blir rätt.

Men som andra poängterat handlar ju hela problemställningen mycket om att förstå verktyget. Och detta är väl ett bra och viktigt sätt att belysa hur verktygen faktiskt fungerar idag. (Vilket inte är självklart utifrån hur de marknadsförs, osv)

Visa signatur

Desktop spel m.m.: Ryzen 9800X3D || MSI X870 Tomahawk Wifi || MSI Ventus 3x 5080 || Gskill FlareX 6000 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Arbetsstation: Ryzen 7945HX || Minisforum BD790i || Asus Proart 4070 Ti Super || Kingston Fury Impact 5600 65 GB || WD SN850 2TB || Samsung 990 Pro 2TB || Fractal Ridge
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem
Skrivet av Nr42:

Var inte ett av de stora problemen som artikeln tar upp att det inte gick att kolla referenser för att det inte gavs några eller gavs felaktiga?

Dom jag använder har referenser. Oftast är dom vettiga. Men det beror ju också på vad man frågar.
T.ex. jag jobbar som konsult för MS produkter och använder copilot

Men avsaknad av referens är ju också något att gå på

Som i tal av oranga personer

Visa signatur

"Arguing on internet is like running in the special olympics. Even if you win you're still retarded."

Permalänk
Medlem
Skrivet av orig_rejser:

Dom jag använder har referenser. Oftast är dom vettiga. Men det beror ju också på vad man frågar.
T.ex. jag jobbar som konsult för MS produkter och använder copilot

Men avsaknad av referens är ju också något att gå på

Som i tal av oranga personer

Ska jag ta det svaret som att du inte läste artikeln, och bara skrev något som inte hade med saken att göra?

Permalänk
Medlem
Skrivet av S1im:

Jag är mer oroad över människor som tror på allt som det skattefinansierad media förmedlar!

[sarkasm] Precis, det är skattefinansierad media som är problemet, inte de stora miljardär-ägda mediabolagen som har väldigt tydliga agendor eller kreti och pleti news som sprider antivax propaganda.[/sarkasm]

Permalänk
Medlem
Skrivet av Aphex:

Okej surbubbe, här är hela rapporten den producerade, med referenser.
https://gemini.google.com/share/01b24f044e8a

Men jag tycker stegen den tog för att komma fram till den var intressantare, testa själv.

En kortare fråga besvaras så här:

<Uppladdad bildlänk>

Efter att jag läst igenom "rapporten" så måste jag säga att jag gärna är en "surbubbe" om det är det man är när man er kritisk till AI

Den referens jag följde (hade tyvärr inte tid att läsa allt) var ett blogginlägg som tog upp hur det var med leksaker under andra världskriget i USA, vilket var ganska intressant. I blogginlägget nämndes i förbifarten detta:

"Toys, board games, and hobby sets with military and war motifs also became standard playthings."

vilket gemeni har fått till:

"Conversely, the increased public awareness of military matters might lead to a potential rise in demand for military-themed toys or action figures 1 ."

Dessa två saker är inte lika. Det första är ett uttalande om hur det var utan några som helst anledningar till varför det blev så. Det andra är ett påstående om att vissa saker kanske blir mer populära för att folk blir mer medvetna om militära saker.

För övrigt känns det som om LLMen bara är tränad på text som är skriven av amerikaner, dom kan fan inte skriva något som är koncist. OK när man får betalt per ord men det hoppas jag att en LLM inte får.

Har du provat att bara söka på 'Keyboard cat meme"? Det gjorde jag första träffen var wikipedia som hade en artikel om det, utan att spendera massa vatten och el i onödan.

Permalänk
Medlem
Skrivet av Nr42:

[sarkasm] Precis, det är skattefinansierad media som är problemet, inte de stora miljardär-ägda mediabolagen som har väldigt tydliga agendor eller kreti och pleti news som sprider antivax propaganda. [/sarkasm]

Vad är det för skillnad på "miljardär-media" och skattefinansierad media? De har finansieringen säkrad oavsett vad de skriver!