Kaip išskleisti ir išsaugoti vaizdus iš PDF failo „Linux“
Naudodami „pdftotext“ komandinės eilutės įrankį, galite lengvai konvertuoti PDF failus į redaguojamą tekstą „Linux“. Tačiau, jei originaliame PDF faile yra vaizdų, jie nėra ištraukiami. Norėdami išgauti vaizdus iš PDF failo, galite naudoti kitą komandų eilutės įrankį „pdfimages“.
PASTABA: Kai sakome, kad kažką įrašyti į šį straipsnį ir yra teksto kabučių, NEĮrašykite kabučių, nebent nurodome kitaip.
„Pdfimages“ įrankis yra „poppler-utils“ paketo dalis. Galite patikrinti, ar jis įdiegtas jūsų sistemoje, ir, jei reikia, įdiekite jį naudodami šiame straipsnyje aprašytus veiksmus.
Norėdami išgauti vaizdus iš PDF failo naudodami pdfimages, paspauskite „Ctrl + Alt + T“, kad atidarytumėte terminalo langą. Spustelėkite eilutę.
pdfimages / home / lori/Documents/SampleWithImages.pdf / home / lori / Dokumentai / ExtractedImages / image
PASTABA: Visoms šiame straipsnyje nurodytoms komandoms pakeiskite pirmąjį komandą ir PDF failo pavadinimą į pradinio PDF failo kelią ir failo pavadinimą. Antrasis kelias turėtų būti kelias į šakninį aplanką, į kurį norite išsaugoti išgauti vaizdus. Žodis „vaizdas“ antrojo kelio pabaigoje reiškia, ką norite įvesti savo failo pavadinimu. Vaizdų pavadinimai numeruojami automatiškai (000, 001, 002, 003 ir tt). Jei norite pridėti tekstą prie kiekvieno vaizdo pradžios, įveskite tą tekstą antrojo kelio pabaigoje. Mūsų pavyzdyje kiekvienas vaizdo failo pavadinimas prasidės „vaizdu“, pvz., Image-001.ppm, image-002.ppm ir tt Tarp nurodyto teksto ir skaičiaus pridedamas brūkšnys.
Numatytasis vaizdo formatas yra ne monochrominių vaizdų PPM (nešiojamų pikselių žemėlapis) arba nespalvotiems vaizdams skirtas PBM (nešiojamas bitmap). Šie formatai yra lengvai keičiami tarp platformų.
PASTABA: Kiekvienam PDF failo vaizdui galite gauti du vaizdo failus. Antras kiekvienos nuotraukos vaizdas yra tuščias, todėl galėsite pasakyti, kurie vaizdai turi failo failus iš failo tvarkyklės failo miniatiūros.
Norėdami sukurti .jpg vaizdo failus, į komandą pridėkite „-j“ parinktį, kaip parodyta žemiau.
pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumentai / ExtractedImages / image
PASTABA: Taip pat galite pakeisti numatytąjį išvestį į PNG naudodami „-png“ parinktį arba TIFF, naudodami „-tiff“ parinktį.
Pagrindinis vaizdo failas kiekvienam vaizdui išsaugomas kaip .jpg failas. Antrasis tuščias vaizdas vis dar yra .ppm arba .pbm failas.
Jei norite konvertuoti vaizdus tik tam tikrame puslapyje ir po jo, naudokite parinktį „-f“ su numeriu, nurodydami pirmąjį konvertuojamąjį puslapį, kaip parodyta žemiau pateiktoje pavyzdinėje komandoje.
pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumentai / ExtractedImages / image
PASTABA: „-j“ parinktį sujungėme su „-f“ parinktimi, kad galėtume gauti .jpg vaizdus ir taip pat atlikome „l“ parinktį, paminėtą toliau..
Jei norite konvertuoti visus vaizdus prieš ir į tam tikrą puslapį, naudokite „-l“ (mažoji „L“, o ne „1“) parinktį su numeriu, nurodantį paskutinį konvertuojamąjį puslapį, kaip parodyta žemiau.
pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumentai / ExtractedImages / image
PASTABA: „-f“ ir „-l“ parinktis galite naudoti norėdami konvertuoti vaizdus į tam tikrą puslapio diapazoną dokumento viduryje.
Jei PDF faile yra savininko slaptažodis, naudokite „-opw“ parinktį ir slaptažodį vienose kabutėse, kaip parodyta žemiau. Jei PDF failo slaptažodis yra vartotojo slaptažodis, vietoj slaptažodžio naudokite parinktį „-ww“.
PASTABA: Įsitikinkite, kad komandoje yra slaptažodžių.
pdfimages -opw 'password' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumentai / ExtractedImages / image
Norėdami gauti daugiau informacijos apie komandą „pdfimages“, įveskite terminą „pdfimages“ į terminalo langą ir paspauskite „Enter“. Komandos naudojimas rodomas su parinkčių, kurias galima naudoti komandoje, sąrašu.