Pdfgrep-opdrachten voor het zoeken naar PDF-bestanden Linux Terminal

De besturingssystemen zijn gebaseerd op opdrachtregels die ons meerdere opties bieden om de distributiemogelijkheden te vergroten door zoekopdrachten, beheeracties, ondersteuning en nog veel meer uit te kunnen voeren.

Precies een van deze opties is gekoppeld aan de mogelijkheid om naar bepaalde soorten bestanden in Linux te zoeken en zo gemakkelijk toegang te krijgen tot hun inhoud en daarom zullen we het vandaag hebben over pdfgrep dat gericht is op het zoeken naar PDF-bestanden.

Wat is pdfgrepPdfgrep is een opdrachtregelprogramma om tekst in PDF-bestanden op een eenvoudige en functionele manier te doorzoeken, waardoor we tijd besparen bij het openen van elk bestand en het zoeken naar de tekst met PDF-tools.
Enkele van zijn kenmerken zijn:

  • Compatibel met Grep, we kunnen veel grep-parameters uitvoeren, zoals -r, -i, -n of -c.
  • Mogelijkheid om naar tekst in meerdere PDF-bestanden te zoeken
  • Uitgelichte kleuren, deze GNU Grep-kleuroptie wordt standaard ondersteund en ingeschakeld.
  • Ondersteunt het gebruik van reguliere expressies.
  • Gratis software

1. Installeer Pdfgrep op Linux

Stap 1
In dit geval zullen we Ubuntu gebruiken waarvoor het voldoende is om de volgende regel uit te voeren. Daar voeren we de letter S in om het downloaden en installeren van de pakketten te accepteren.

 sudo apt install pdfgrep

Stap 2
Andere installatiemogelijkheden zijn:

  • Download het .TAR.GZ-bestand via de volgende link.

Stap 3

  • Of voer de volgende opdracht uit:
 git clone https://gitlab.com/pdfgrep/pdfgrep.git
Stap 4
Voer vervolgens elk van de volgende regels in hun volgorde in:
 ./configure make sudo make install

2. Gebruik Pdfgrep op Linux

Stap 1
Zodra pdfgrep is geïnstalleerd, is dit de syntaxis die moet worden gebruikt:

 pdfgrep [OPTIE…] PATROON [BESTAND]
Stap 2
Elk van de elementen is:
  • Optie: Geeft de kenmerken aan die we kunnen toevoegen aan de zoekopdracht, bijvoorbeeld -I of --negeer zaak, die het onderscheid negeren tussen hoofdletters en kleine letters tussen het patroon dat we hebben aangegeven en het patroon dat moet overeenkomen met het bestand.
  • Patroon: Geeft een uitgebreide reguliere expressie aan.
  • Bestand: Dit is het PDF-bestand waarin de zoekopdracht moet worden uitgevoerd.

Stap 3
We beginnen met een eenvoudige zoekopdracht, we zoeken bijvoorbeeld naar het woord Solvetic in het bestand Solvetic.pdf, hiervoor voeren we het volgende uit:

 pdfgrep Solvetic Solvetic.pdf

VERGROTEN

Stap 4
In dit geval komt deze term maar één keer voor in dat bestand, maar nu gaan we op zoek naar de term Windows in een officieel Microsoft PDF-bestand en dit is het resultaat dat we zullen zien:

VERGROTEN

Stap 5
We kunnen zien dat het gezochte woord wordt gemarkeerd, wat de locatie ervan vergemakkelijkt. Als we nu de parameter toevoegen -in, Het is mogelijk om de resultaten te zien met het paginanummer waar deze term is gedetecteerd:

VERGROTEN

Stap 6
Een andere optie die we kunnen gebruiken met pdfgrep is om de PDF-bestand(en) op te sommen die een bepaalde term bevatten, hiervoor voeren we het volgende uit:

 pdfgrep Solvetic * pdf
Stap 7
Op deze manier wordt het PDF-bestand met de term Solvetic weergegeven:

VERGROTEN

Stap 8
Als we het PDF-bestand willen openen, kunnen we de volgende opdracht uitvoeren:

 xdg-open (File.PDF)

VERGROTEN

Stap 9
De algemene mogelijkheden die pdfgrep ons biedt zijn:

-i, --negeer-caseNegeer onderscheid tussen hoofdletters in zowel bron- als invoerbestanden.

-F, --vaste-stringsInterpreteert PATTERN als een lijst met vaste tekenreeksen, gescheiden door nieuwe regels.

--cacheGebruik een cache voor gerenderde tekst om de bewerking van grote bestanden te versnellen.

-P, --perl-regexpInterpreteert PATTERN als een Perl-compatibele reguliere expressie (PCRE).

-H, --met-bestandsnaamDruk de bestandsnaam af voor elke match.

-h, --geen-bestandsnaamOnderdrukt het voorvoegsel van de bestandsnaam in de uitvoer.

-n, --paginanummerVoeg voor elke overeenkomst het nummer van de pagina toe waar de zoekterm is gevonden.

-c, --countOnderdrukt normale uitvoer en drukt in plaats daarvan het aantal overeenkomsten voor elk invoerbestand af.

-p, --aantal pagina'sDruk het aantal overeenkomsten per pagina af. Het impliceert -n.

--KleurHiermee kunnen bestandsnamen, paginanummers en overeenkomende tekst met verschillende reeksen worden gemarkeerd om ze in kleur in de terminal weer te geven, sommige van de opties zijn Altijd, nek of automatisch.

-o, --alleen-overeenkomstigPrint alleen het overeenkomende deel van een regel zonder enige omringende context.

-r, --recursiefHet stelt ons in staat recursief te zoeken in alle bestanden (beperkt door --include en --exclude) onder elke map, waarbij we de symbolische links alleen volgen als ze op de commandoregel staan.

-R, --recursieve-referentieHetzelfde als -r, maar volgt alle symbolische links.

-stil of -qHiermee kunnen we de applicatie afsluiten.

Hiermee wordt pdfgrep een ideale oplossing bij het werken met PDF-bestanden in Linux-omgevingen.

U zal helpen de ontwikkeling van de site, het delen van de pagina met je vrienden

wave wave wave wave wave