Domovská » plocha počítače » Jak extrahovat text a obrázky snadno ze souborů MS Office

    Jak extrahovat text a obrázky snadno ze souborů MS Office

    Můžeme narazit na potřebu extrahovat obrázky nebo text ze souboru MS Word nebo MS Powerpoint. Obvykle to může zahrnovat ruční kopírování a vkládání, jednu stránku najednou a mega-velké soubory..

    Máme jednoduchý trik, který vám pomůže extrahovat obrázky a text ze souborů nového formátu tj. DOCX, PPTX, XLSX, zatímco se soubory staršího formátu, tj. DOC, PPT, XLS, vše, co potřebujete, je svobodný software vám pomůže rychle a snadno extrahovat obrázky.

    Poznámka: Pro demonstraci tohoto příspěvku budeme používat pouze soubor MS Word. Proces je stejný pro soubory MS Powerpoint a MS Excel.

    Tento článek popisuje:

    1. Jak extrahovat obrázky a text z DOCX, PPTX, XLXS souborů
    2. Jak extrahovat obrázky z jednoho souboru DOC, PPT nebo XLS
    3. Jak extrahovat obrázky z více souborů DOC, PPT nebo XLS
    4. Jak extrahovat obrázky pomocí “Uložit jako webovou stránku” metoda
    5. Jak extrahovat prostý text místo XML

    Jak extrahovat obrázky a text z DOCX, PPTX, XLXS souborů

    Před provedením kroků otevřete složku obsahující soubory. klikněte Organizovat> Složka a Možnosti hledání> Zobrazit a zrušte zaškrtnutí Skrýt přípony známých typů souborů. Nyní můžete vidět příponu souboru s každým názvem souboru.

    1. Vyhledejte a vyberte soubor, ze kterého chcete extrahovat obrázky a text (poznámka: je lepší vytvořit kopii uvedeného souboru). V tomto příkladu je pojmenován cílový soubor Sample File.docx.

    2. lis F2 přejmenovat soubor a nahradit název přípony .zip.

    3. Zobrazí se varování, které potvrdí změnu přípony souboru. Klikněte na Ano.

    4. Klikněte pravým tlačítkem myši na soubor ZIP a klikněte na Extrahovat soubory.

    5. Vyhledejte a otevřete složku obsahující extrahovaná data a otevřete slovo.

    6. V něm uvidíte několik složek a XML souborů. V médií sloľku najdete extrahované obrázky. Chcete-li zobrazit text, který chcete zrušit, otevřete soubor document.xml soubor s Poznámkový blok nebo Poznámkový blok XML.

    Zde je to, co najdete v médií složky.

    Jak extrahovat obrázky z jednoho souboru DOC, PPT nebo XLS

    Pokud chcete extrahovat obrázky ze souborů MS Office s starších formátů, výše uvedená metoda nebude s obrázky pracovat. K tomuto účelu potřebujete bezplatný nástroj nazvaný Průvodce extrakcí Office Image Extraction. Nástroj pracuje se soubory MS Office až do roku 2012 a pracuje s jedním nebo více soubory MS Office najednou.

    1. Stáhnout a Nainstalujte Průvodce extrakcí Office Image Extraction.

    2. Vyberte dokument, ze kterého chcete extrahovat obrázky (pro tento příklad to děláme do složky, kterou jsem pojmenoval) Ch1.doc) a vyberte výstupní složku. Můžete se rozhodnout, že složka bude vytvořena pro umístění všech vašich výstupních obrázků zaškrtnutím této možnosti Vytvořte zde složku. Až budete hotovi, klikněte další.

    3. Klikněte na Start zahájit proces.

    4. Po dokončení procesu extrakce klikněte na Kliknutím sem otevřete cílovou složku a otevře se výstupní složka.

    5. Jak můžete vidět níže, program vytvořil a Ch1 složky.

    6. Uvnitř složky jsou extrahované obrázky.

    Jak extrahovat obrázky z více souborů DOC, PPT nebo XLS

    1. Pro extrahování obrázků z více souborů formátu DOC, PPT nebo XLS zaškrtněte políčko Dávkový režim možnost vlevo dole.

    2. Klikněte na Přidat soubory a pak vybrat soubory, ze kterých chcete extrahovat obrázky. Podrž Ctrl pro výběr více souborů najednou. Po výběru souborů klepněte na tlačítko další.

    3. Klikněte na Start.

    4. Po dokončení procesu vyhledejte a otevřete výstupní složka. Zde uvidíte dvou složek s původními názvy souborů. otevřeno Tyto složky zobrazují extrahované obrázky z původních souborů MS Office.

    Jak extrahovat obrázky metodou "Uložit jako webovou stránku"

    Tam je další metoda, která bude pracovat s oběma novější a starší Soubory MS Office.

    1. Otevřete soubor DOCX nebo XLSX a klikněte na Soubor> Uložit jako> Počítač> Prohlížeč a uložit soubor jako Webová stránka.

    2. Lokalizovat složku s názvem souboru jste uložili webovou stránku dovnitř Zde se zobrazí všechny obrázky extrahované ze souboru.

    Jak extrahovat Plaintext místo XML

    1. Otevřete soubor DOCX a klikněte na Soubor> Uložit jako> Počítač> Prohlížeč. Zvolte pro uložení souboru jako Prostý text (u souborů XLSX jej uložte jako Text (oddělený tabulátorem)).

    2. Lokalizovat a otevřeno soubor s názvem, který jste pouľili pro jeho uloľení. Tento textový soubor bude obsahovat pouze text z původního souboru bez formátování.

    Pokud znáte jakoukoliv jinou metodu nebo nástroj pro extrahování obrázků ze souborů MS Office, uveďte prosím připomínky sekce.