Tekst uit een PDF extraheren in macOS Sierra

Inhoudsopgave

Een van de meest gebruikte huidige formaten voor de overdracht van informatie is PDF (Portable Document Format - Portable Document Format) dat is ontwikkeld door Adobe en ons tal van voordelen biedt, zoals:

  • Grotere documentbeveiliging
  • Verkleining van de originele grootte
  • Compatibiliteit met meerdere apparaten
  • Behoudt onder andere de integriteit van opgeslagen gegevens.

Het punt is dat we op bepaalde momenten en om meerdere redenen uitsluitend de inhoud van de tekst uit het PDF-bestand moeten extraheren zonder andere elementen zoals afbeeldingen of handtekeningen op te nemen.

Solvetic zal analyseren hoe dit proces gemakkelijk kan worden uitgevoerd in macOS Sierra zonder toevlucht te nemen tot extra tools.

Stap 1
Het document openen: De eerste stap die u moet nemen, is het PDF-document openen dat lokaal is opgeslagen in macOS Sierra, wat automatisch wordt gedaan met het hulpprogramma Preview:

Het is belangrijk om te verduidelijken dat als we verschillende tools gebruiken, zoals Adobe Reader, het PDF-bestand met die tool wordt geopend.

Stap 2
Tekstselectie: Nu gaan we verder met het kopiëren van de informatie uit het PDF-bestand, wat we normaal doen met de muis, maar als we meerdere PDF-bestanden hebben, zal dit een tijdrovende taak zijn.

We kunnen een van de volgende methoden gebruiken om dit proces veel efficiënter te maken:

  • Ga naar het menu Bewerken en selecteer daar de optie Alles selecteren
  • Gebruik de toetsencombinatie ⌘ + A
.

Zodra we deze optie selecteren, zien we de geselecteerde tekst:

Stap 3
Kopieer en plak de inhoud: Nadat de tekst in het PDF-bestand is geselecteerd, gaan we verder met het kopiëren met een van de volgende opties.

PDF-tekst kopiëren

  • Ga naar het menu Bewerken en selecteer daar Kopiëren
  • Gebruik de toetsencombinatie ⌘ + C

Zodra we deze informatie op het klembord hebben, zullen we de toepassing Teksteditor openen met een van de volgende opties:

  • Voer de woordtekst in Spotlight in en selecteer daar TextEdit
  • Ga naar het pad go / Applications en selecteer daar TextEdit

Het volgende venster wordt weergegeven. Daar selecteren we de knop Nieuw document.

Stap 4
In het nieuwe venster gaan we naar het menu Opmaak en daar selecteren we de optie Converteren naar platte tekst of we kunnen de toetsencombinatie ⇧ + ⌘ + T gebruiken. Het resultaat is het volgende:

Met deze eenvoudige methode kunnen we eenvoudig de tekst extraheren uit de benodigde PDF-bestanden.

wave wave wave wave wave