Radera kapitel ur PDF-fil - hur?

Permalänk
Medlem

Radera kapitel ur PDF-fil - hur?

Screenshot på problemet
Jag har en verkstadsmanual i PDF-format. Problemet är att den är på tre olika språk; engelska, franska och tyska.

Den franska och tyska biten vill jag radera helt, för när jag scrollar i PDF:en från exempelvis sida 28 till nästa sida så är den på franska. Detta blir en rätt så dryg procedur med 650 sidor, och ännu mindre roligt om jag ska skriva ut hela manualen.

Går det på något vis att ta bort hela franska och tyska kapitlena (se bilden) utan att behöva radera sida för sida manuellt? Finns det någon programvara till Windows eller Ubuntu som är lämpad för denna uppgift?

Visa signatur

Är du också lite less?

Permalänk
Rekordmedlem

Det beror på om det är en redigerbar pdffil eller inte, är den låst måste du scanna den med ett ocr program, annars är den inte möjligt att ändra i.

Visa signatur

Ryzen 5 2400G, Asus ROG STRIX B350-F Gaming, 500GB Samsung 970EVO NVMe M.2 och en väldig massa masslagring. Seasonic Focus+ Gold 650W, Antec P 180 med Schyte o Sharkoon fläktar via en t-balancer, Tittar på en Acer ET430Kbmiippx 43" 4K
Främre ljudkanalerna återges via Behringer DCX2496, högtalare Truth B3031A, Truth B2092A Har också Oscilloskop, mätmikrofon och en Colorimeter.

Permalänk
Medlem
Skrivet av mrqaffe:

Det beror på om det är en redigerbar pdffil eller inte, är den låst måste du scanna den med ett ocr program, annars är den inte möjligt att ändra i.

Hur tar jag reda på om den är låst eller ej?

Visa signatur

Är du också lite less?

Permalänk
Rekordmedlem

Det märker du när du försöker editera filen, frågas det efter lösenord så är det en skrivskyddad fil.
Har du inte Acrobat så kan du använda libreoffice och öppna filen med writer.
Det syns förresten i Adobe reader också om du kollar egenskaper på filen så står det om den är skyddad eller inte.

Visa signatur

Ryzen 5 2400G, Asus ROG STRIX B350-F Gaming, 500GB Samsung 970EVO NVMe M.2 och en väldig massa masslagring. Seasonic Focus+ Gold 650W, Antec P 180 med Schyte o Sharkoon fläktar via en t-balancer, Tittar på en Acer ET430Kbmiippx 43" 4K
Främre ljudkanalerna återges via Behringer DCX2496, högtalare Truth B3031A, Truth B2092A Har också Oscilloskop, mätmikrofon och en Colorimeter.

Permalänk
Medlem

Hur är det upplagt? Om de olika språken kommer efter varandra så kan du väl bara skriva ut de omfång som är i rätt språk till en PDF-printer t.ex PDFCreator.

Permalänk
Medlem
Skrivet av mrqaffe:

Det märker du när du försöker editera filen, frågas det efter lösenord så är det en skrivskyddad fil.
Har du inte Acrobat så kan du använda libreoffice och öppna filen med writer.
Det syns förresten i Adobe reader också om du kollar egenskaper på filen så står det om den är skyddad eller inte.

Den frågade efter lösenord när jag öppnade den med libreoffice. Hur går jag då tillväga?

Visa signatur

Är du också lite less?

Permalänk
Medlem

I Ubuntu kan du använda konsollverktyget pdfjam som kan manipulera pdf:er på många olika sätt. T.ex. "pdfjam infil.pdf '1,3-7,9-' --outfile utfil.pdf" för att skapa en ny pdf från sida 1, sida 3 till 7, och sida 9 och framåt. Se "pdfjam --help" för mer information om hur du använder verktyget. Det borde inte vara något problem att använda pdfjam om du kan läsa pdf:en med t.ex. evince, eftersom du med pdfjam skapar en ny pdf istället för att redigera den existerande.

Permalänk
Rekordmedlem

Då går det inte att ändra i originalfilen utan nyckeln, endera så gör du som Rådström skrev, eller så får du köra den via ett ocr prog och sedan redigera dokumentet.

Visa signatur

Ryzen 5 2400G, Asus ROG STRIX B350-F Gaming, 500GB Samsung 970EVO NVMe M.2 och en väldig massa masslagring. Seasonic Focus+ Gold 650W, Antec P 180 med Schyte o Sharkoon fläktar via en t-balancer, Tittar på en Acer ET430Kbmiippx 43" 4K
Främre ljudkanalerna återges via Behringer DCX2496, högtalare Truth B3031A, Truth B2092A Har också Oscilloskop, mätmikrofon och en Colorimeter.

Permalänk
Medlem

Usch lycka till o hitta bra ocr program. Samtliga jag använt hittills är skräp Kanske bättre o skriva om manualen manuellt

Permalänk
Medlem

Som folk har tipsat tidigare så är nog den mest simpla lösningen att "skriva ut" med en pdf-creator. Om jag inte minns helt fel så borde det finnas en direkt out of the box i ubuntu som du verkar köra.

Permalänk
Medlem

Här är en bättre screenshot som visar problemet:
https://dl.dropbox.com/u/4375930/PDF2.png
Titta på sidnumreringen.

Detta beror på att alla sprängskisser + text endast visas på de engelska sidorna, och under på nästa sida delar franska och tyska plats på samma sida utan sprängskiss. Så sprängskisserna slipper visas flera gånger alltså.

Skulle det inte kunna gå att automatisera på något vis (att ta bort franskan/tyskan)?

Visa signatur

Är du också lite less?

Permalänk
Medlem

Skriv ut de sidor du vill ha kvar till en pdf writer, då får du en ny pdf-fil med de sidor du valde.

Visa signatur

Assembly är ett högnivåspråk.

Permalänk
Medlem
Skrivet av Gramner:

Skriv ut de sidor du vill ha kvar till en pdf writer, då får du en ny pdf-fil med de sidor du valde.

Fast... Det är 650 sidor...

Visa signatur

Är du också lite less?

Permalänk
Medlem

Nu vet jag inte om detta är tillåtet då man helt klart kringgår ett skrivskydd. Isf får mod ta och radera min post.

Lättaste för dig att göra är att använda en PDF printer (cutepdf, bullet, etcetc), och printa de sidorna du vill ha till en ny pdf fil. Och nej, detta kan inte -automatiseras mer än så.

Visa signatur

”Det är en myt att det inte finns arbete att söka i svåra tider. Det finns alltid lediga platser. […] En viktig orsak till att ungdomar inte får jobb är att de inte söker jobb.” ~ Fredrik Reinfeldt , 2010

Permalänk
Medlem
Skrivet av Hzup:

Nu vet jag inte om detta är tillåtet då man helt klart kringgår ett skrivskydd. Isf får mod ta och radera min post.

Lättaste för dig att göra är att använda en PDF printer (cutepdf, bullet, etcetc), och printa de sidorna du vill ha till en ny pdf fil. Och nej, detta kan inte -automatiseras mer än så.

Filen är faktiskt inte skrivskyddad på något sätt (filnamnet syns förresten på Ericus bilder och är trivial att hitta på nätet), mer än att PDF:er i allmänhet inte är gjorda för att redigeras. Jag testade att öppna den i LibreOffice och klickade bara på OK när lösenord efterfrågades. Men LibreOffice och liknande är ju inte PDF-program, så PDF:en konverterades till ett vanligt dokument istället så att man kunde redigera den. Så det är ju en möjlighet om man faktiskt vill redigera något i PDF:en, även om man förmodligen inte får en PDF som ser identisk ut när man sparar den igen.

Men i det här fallet så behövs ju inte något sånt. Tyvärr så har du rätt i att det är svårt att automatisera eftersom PDF:en inte följer något riktigt mönster, mer än att det oftast är varannan sida man vill ha. Men ibland så kommer det flera engelska sidor på raken, vilket bryter det mönstret. Så det mest praktiska är nog tyvärr att gå igenom PDF:en och skriva upp alla sidor som är på engelska, och sedan mata in listan i t.ex. Evinces utskriftsfönster eller som argument till pdfjam.

Eventuellt så skulle man kunna göra något smart eftersom varje sida är märkt med ett nummer i foten, och det nummret är samma i alla språk. Dvs. sidan 1-7 finns tre gånger i dokumentet, en gång på varje språk. Eftersom de engelska sidorna alltid är först så skulle man kunna gå igenom dokumentet och plocka ut den första av varje sida. Jag vet tyvärr inget uppenbart sätt att göra det dock, och det skulle förmodligen ta längre tid att snickra ihop en sån lösning än att göra det manuellt