Jag vet inte hur Claude är men har kört en del med GPT (både Copilot och ChatGPT).
Stöter på stora problem när kodbasen och komplexiteten börjar växa lite. Nu har jag t.ex. ett projekt med ~5500 rader kod. Utöver det behövs kanske 2-3000 rader kod som kontext (SDK's med mera). Även om det går att jobba med delar av den åt gången behövs det en hel del kontext för att inte ha sönder saker.
Nu har jag spenderat hela helgen med att försöka fixa ett fel. Något i strukturen och/eller matten gör att resultatet inte blir vad jag vill att det ska vara. Annars hade det ju varit enkelt att köra en debugger och se vart det kraschar. Här är GPT tyvärr helt vilse och ändrar bara saker fram och tillbaka, den ena självsäkra "lösningen" värre än den andra.
Och självklart försöker man göra något som ligger över ens förmåga att programmera och räkna matte, så att klura ut vad som går fel kan ta hur lång tid som helst.
När det blir för mycket för GPT har den också en härlig förmåga att bara hitta på vilken skit som helst, trots extremt tydliga instruktioner om att inte göra det. Den vägrar också regelbundet läsa uppdaterad kod.
Alltså, det kan vara helt sjukt frustrerande.
Å andra sidan är det jäkligt coolt vad man kan göra på kort tid när det verkligen funkar.