Domovská » jak » Jak extrahovat a ukládat obrázky ze souboru PDF v systému Linux

    Jak extrahovat a ukládat obrázky ze souboru PDF v systému Linux

    Snadno můžete převést soubory PDF do editovatelného textu v systému Linux pomocí nástroje příkazového řádku "pdftotext". Pokud však v původním souboru PDF existují nějaké obrazy, nejsou vyčerpány. Chcete-li extrahovat obrázky ze souboru PDF, můžete použít jiný nástroj příkazového řádku s názvem "pdfimages".

    POZNÁMKA: Když řekneme něco napsat v tomto článku a v textu jsou uvozovky, NEVIDÍTE citace, pokud nestanovíme jinak.

    Nástroj "pdfimages" je součástí balíčku poppler-utils. Můžete zkontrolovat, zda je nainstalován v systému a nainstalovat jej v případě potřeby pomocí kroků popsaných v tomto článku.

    Chcete-li extrahovat obrázky ze souboru PDF pomocí pdfimages, stiskněte "Ctrl + Alt + T" a otevřete okno Terminál. Na výzvu zadejte následující příkaz.

    pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumenty / ExtractedImages / image

    Poznámka: U všech příkazů uvedených v tomto článku nahradit první cestu v příkazu a název souboru PDF cestu a název souboru původního souboru PDF. Druhá cesta by měla být cesta k kořenové složce, do které chcete uložit extrahované obrázky. Slovo "obrázek" na konci druhé cesty představuje to, co chcete předat s vaším názvem souboru. Názvy souborů snímků jsou automaticky číslovány (000, 001, 002, 003 atd.). Chcete-li přidat text na začátek každého obrázku, zadejte tento text na konci druhé cesty. V našem příkladu bude každý název souboru obrázku začínat "obrazem", jako je image-001.ppm, image-002.ppm atd. Přidá se pomlčka mezi zadaným textem a číslem.

    Výchozí formát obrázku je PPM (přenosný pixmap) pro non-monochromatické obrázky nebo PBM (přenosné bitmapy) pro monochromatické obrázky. Tyto formáty jsou navrženy pro snadnou výměnu mezi platformami.

    Poznámka: V souboru PDF můžete získat dva soubory obrázků pro každý obrázek. Druhý snímek pro každý obrázek je prázdný, takže budete moci zjistit, které obrázky obsahují obrázky ze souboru pomocí miniatury v souboru ve Správci souborů.

    Chcete-li vytvořit soubory obrázků .jpg, přidejte k příkazu příkaz "-j", jak je uvedeno níže.

    pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumenty / ExtractedImages / obrázek

    POZNÁMKA: Můžete také změnit výchozí výstup na PNG pomocí volby "-png" nebo TIFF pomocí volby "-tiff".

    Hlavní obrazový soubor pro každý snímek je uložen jako soubor .jpg. Druhý prázdný snímek je stále soubor .ppm nebo .pbm.

    Pokud chcete pouze převést obrázky na určitou stránku a po ní, použijte volbu "-f" číslem pro označení první stránky, kterou chcete převést, jak je ukázáno v příkladu příkazu níže.

    pdfimages -f 2 -j /home/lori/Dokumenty/SampleWithImages.pdf / home / lori / Dokumenty / ExtractedImages / obrázek

    POZNÁMKA: Kombinovali jsme volbu "-j" s volbou "-f", abychom získali obrázky .jpg a udělali totéž s volbou "-l" uvedenou níže.

    Chcete-li převést všechny snímky před a na určité stránce, použijte volbu "-l" (malá písmena "L", nikoliv číslo "1") s číslem označující poslední stránku, kterou chcete převést, jak je uvedeno níže.

    pdfimages -l 1 -j /home/lori/Dokumenty/SampleWithImages.pdf / home / lori / Dokumenty / ExtractedImages / image

    POZNÁMKA: Možnosti "-f" a "-l" můžete použít k převodu snímků v určitém rozsahu stránek uprostřed dokumentu.

    Pokud v souboru PDF existuje heslo majitele, použijte volbu "-opw" a heslo v jednoduchých uvozovkách, jak je uvedeno níže. Pokud je heslo v souboru PDF heslem uživatele, místo toho použijte volbu "-upw" s heslem.

    POZNÁMKA: Ujistěte se, že v příkazu máte kolem své heslo pouze jedno uvozovky.

    pdfimages -pw 'heslo' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumenty / ExtractedImages / obrázek

    Další informace o použití příkazu pdfimages zadejte příkaz "pdfimages" na výzvu v okně Terminál a stiskněte "Enter". Zobrazí se použití příkazu se seznamem možností dostupných pro použití v příkazu.