Effektiv inscanning av stor mängd dokument.

Permalänk
Medlem

Effektiv inscanning av stor mängd dokument.

Jag har i uppdrag att digitalisera fysiska personalakter. Dokumenten som består av anställningsavtal, arbetsgivarintyg, utbildningsbetyg m.m ska scannas in och sedan döps filen till vad det är för dokument. T.ex. "Anställningsavtal 2025-01-01." därefter ska dokumentet laddas upp Visma Agda. Det rör sig om ca 300 personalakter. Min fråga är om det går att göra detta på ett effektivt sätt där ett "program" läser av dokumentet och döper den därefter. Programmet ska alltså söka i dokumentet efter rubrik och anställningens start och döpa filen på det sätt jag förklarade här ovan. Och döpa tjänstgöringsbetyg och datum för utfärdande. Osv.

Permalänk
Medlem

Känner inte till något sådant program men låter som att du skulle behöva en AI för att göra detta. Och då skulle man ändå behöva gå igenom varje dokument för att kontrollera att det blev rätt i slutändan. Att hitta och sätta upp ett sånt här program tror jag kommer ta några timmar.

Tror det enklaste och snabbaste sättet är att faktiskt gå igenom dem manuellt och döpa dem efter dina kriterier. Spenderar du 10 sek på varje dokument så är det runt en timmas arbete (exkl. scanning). Hade det varit 3000+ dokument kanske det varit värt att investera tiden på att hitta ett sånt program.

Permalänk
Medlem
Skrivet av martengooz:

Känner inte till något sådant program men låter som att du skulle behöva en AI för att göra detta. Och då skulle man ändå behöva gå igenom varje dokument för att kontrollera att det blev rätt i slutändan. Att hitta och sätta upp ett sånt här program tror jag kommer ta några timmar.

Tror det enklaste och snabbaste sättet är att faktiskt gå igenom dem manuellt och döpa dem efter dina kriterier. Spenderar du 10 sek på varje dokument så är det runt en timmas arbete (exkl. scanning). Hade det varit 3000+ dokument kanske det varit värt att investera tiden på att hitta ett sånt program.

Tack för utförligt svar! Det blir nog manuell inscanning som du rekommenderade.

Permalänk
Medlem
Skrivet av Velum:

Tack för utförligt svar! Det blir nog manuell inscanning som du rekommenderade.

Du kan ju skanna in manuellt, men sen köra OCR-program som "plockar ut" all text. Beroende på hur enhetligt utformade dokumenten är blir det olika svårt att regelbaserat hitta rätt text per dokument. Men det borde gå snabbare att ha all text omvandlad och i ett stort textdokument som du kan ha på ena sidan av skärmen, sen filerna du ska byta namn på på andra sidan av skärmen. Då slipper du öppna varje dokument för varje namnbyte, och kan bara snegla över på textfilen. Borde snabba upp det enormt, även om det ju ändå blir en ganska manuell process.

300 dokument, med skanning, textavläsning och namngivning, så skulle jag räkna med 2-3 arbetsdagar för det. Då räknar jag med ca 3-4 minuter per dokument. Effektiv tid kanske är lite mindre, men man ska ha nån toapaus, hämta kaffe, vila hjärnan lite då och då, kanske snacka med en kollega. 15-20 timmar är min gissning.

Visa signatur

Moderkort: Gigabyte X570 Aorus Master | CPU: AMD Ryzen R9 5900X | CPU-kylare: Noctua NH-D15 chromax.black | RAM: Corsair Vengeance LPX 64 GB (4x16) DDR4-3600 CL18 | GPU: Gigabyte RTX 4080 Eagle OC | SSD: 2 x Samsung 970 EVO Plus 1 TB NVMe + Kingston A400 480 GB + Samsung QVO860 1 TB | PSU: EVGA SuperNOVA G2 1000 W Gold | Chassi: Lian Li O11 Dynamic XL | Skärm: BenQ PD3200U @ 3840x2160 + ASUS ROG Strix XG32VQ @ 2560x1440 | Tangentbord: Corsair K68 RGB Cherry MX Red | Mus: Logitech MX Master 2S

Permalänk
Medlem

Börja med att scanna ett dokument och kör en OCR på det. Titta sedan på resultatet och se vilka fält du bör plocka ut. Räcker det med att söka efter datum bara, annars blir det snabbt flera varianter där man i nästa steg kanske kan söka efter en titel i versaler. Därefter är det någon typ av programmering som får ta vid, t.ex Python eller Bash beroende på plattform. Det bästa är att välja program som kan köras i batch, d.v.s. att de kan hantera en hel katalog i ett svep eller köras på kommandoraden då det kan inlemmas i Python/Bash.