Aufschnur Logo

URL Extractor

English version below.

DeutschDieses interaktive PowerShell-Skript erkennt und extrahiert URLs aus beliebigen, textbasierten Dateien und speichert die gefundenen URLs in der gewünschten Formatierung als Liste in eine neue Datei. Es handelt sich hierbei nicht um einen Parser, der HTML- oder XML-Tags analysiert, sondern um einen Mustererkenner, der korrekte URLs mit http://, https://, ftp:// usw. erwartet. Das Skript ist mehrsprachig (deutsch/englisch) und erfordert PowerShell 3 oder neuer.
Tipps zur Installation und Vorbereitung der PowerShell.

Anwendung des Skripts

  1. Das Skript bzw. die ZIP-Datei herunter laden und entpacken.
  2. Im Skriptverzeichnis muss die Quelldatei „input.txt“ vorhanden sein bzw. angelegt werden. Der Inhalt dieser Textdatei kann beliebig sein, also z.B. auch HTML-Quelltext oder ein XML-Export.
  3. Das Skript mit PowerShell ausführen und den Anweisungen folgen.

Version: 2017-03-13
Betriebssystem: Windows 7/8/10
Dateigröße: 3,12 kB
Prüfsumme (SHA1) der ZIP-Datei: 452d44c411e20b3357395b98b60b9da94dd763f0

Download “URL Extractor” url_extractor.zip – 3757-mal heruntergeladen – 3,12 kB

 



DeutschThis interactive PowerShell script recognizes and extracts URLs from any text-based files and saves them in the desired formatting as a list into a new file. This is not a parser that analyzes HTML or XML tags, but a pattern recognizer that expects correct URLs with http://, https://, ftp://, and so on. The script is multilingual (English/German) and requires PowerShell 3 or later.

Handling of the script

  1. Download the ZIP file and unpack the script from it.
  2. Create a file „input.txt“ in the script directory. The content of this text based file can be anything, e.g. HTML source code or a XML export.
  3. Run the script and follow the instructions.

Version: 2017-03-13
OS: Windows 7/8/10
File size: 3,12 kB
Checksum (SHA1) of the ZIP file: 452d44c411e20b3357395b98b60b9da94dd763f0

Download “URL Extractor” url_extractor.zip – 3757-mal heruntergeladen – 3,12 kB