Bereits Kunde? Jetzt einloggen.
Lesezeit ca. 7 Min.

Dateien lokalisieren mit Docfetcher : Spürnase


Ubuntu Spezial - epaper ⋅ Ausgabe 2/2019 vom 29.05.2019

Docfetcher reduziert den Zeitaufwand bei der Suche nach Dateien auf ein Minimum.


Artikelbild für den Artikel "Dateien lokalisieren mit Docfetcher : Spürnase" aus der Ausgabe 2/2019 von Ubuntu Spezial. Dieses epaper sofort kaufen oder online lesen mit der Zeitschriften-Flatrate United Kiosk NEWS.

Bildquelle: Ubuntu Spezial, Ausgabe 2/2019

© photopw, 123RF

README

Im täglichen Einsatz sammeln sich im Lauf der Zeit viele persönliche Daten auf der Festplatte an. Mit Docfetcher artet auch bei umfangreichen Datenbeständen die Suche nicht zur Geduldsprobe aus.

Moderne Betriebssysteme belegen mit den verschiedenen Anwendungsprogrammen nicht nur meist mehrere Gigabyte Platz auf dem Massenspeicher, sondern umfassen in aller Regel inzwischen auch mehrere Hunderttausend einzelne Dateien. Wenn dann noch Ihre umfangreiche Musik- oder Fotosammlung hinzukommt, geht mitunter ...

Weiterlesen
epaper-Einzelheft 12,80€
NEWS 14 Tage gratis testen
Bereits gekauft?Anmelden & Lesen
Leseprobe: Abdruck mit freundlicher Genehmigung von Ubuntu Spezial. Alle Rechte vorbehalten.

Mehr aus dieser Ausgabe

Titelbild der Ausgabe 2/2019 von Neues in Ubuntu 19.04 : Aufgehübscht. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
Neues in Ubuntu 19.04 : Aufgehübscht
Titelbild der Ausgabe 2/2019 von Linux und Windows – ähnlich und doch verschieden : Aller Anfang ist nicht immer schwer. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
Linux und Windows – ähnlich und doch verschieden : Aller Anfang ist nicht immer schwer
Titelbild der Ausgabe 2/2019 von Installation von Ubuntu und seinen Derivaten : Gewusst wie. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
Installation von Ubuntu und seinen Derivaten : Gewusst wie
Titelbild der Ausgabe 2/2019 von Virtuelle Maschinen mit Gnome Boxes betreiben : Verschachtelt. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
Virtuelle Maschinen mit Gnome Boxes betreiben : Verschachtelt
Titelbild der Ausgabe 2/2019 von Dokumentenformate mit Pandoc umwandeln : Bäumchen wechsle dich. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
Dokumentenformate mit Pandoc umwandeln : Bäumchen wechsle dich
Titelbild der Ausgabe 2/2019 von Snapper unter Ubuntu verwenden : Zeitmaschine. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
Snapper unter Ubuntu verwenden : Zeitmaschine
Vorheriger Artikel
Snapper unter Ubuntu verwenden : Zeitmaschine
aus dieser Ausgabe
Nächster Artikel Mit Go for it! tägliche Aufgaben planen und erledigen : Auge…
aus dieser Ausgabe

... schnell der Überblick verloren.

Moderne Desktop-Umgebungen bieten zwar Indexierungs- und Suchapplikationen für die vorhandenen Datenbestände, und es gibt eine nahezu unüberschaubare Zahl von speziellen Suchprogrammen. Häufig kranken die Programme jedoch an einer wenig intuitiven Bedienung oder erfordern als Backend eine zusätzlich installierte Datenbank, sodass daraus eine Client/ Server-Applikation wird. Außerdem gestatten die Tools oft keine Volltextsuche. Suchen Sie nur ein schlankes, aber leistungsfähiges und praxisorientiertes Suchprogramm für Ihren Arbeitsplatzrechner, bietet Docfetcher eine sehr interessante Alternative. Sie laden die Java-Applikation von der Projektseite herunter, wo Sie auch Installationshinweise finden [1]. Als Voraussetzung genügt eine halbwegs aktuelle Java- Laufzeitumgebung, wobei Docfetcher bestens mit den aktuellen Open- JDK-Umgebungen harmoniert, die Sie in aller Regel direkt aus den Software-Repositories von Ubuntu und seinen Flavors installieren.

Das heruntergeladene ZIP-Archiv mit den Docfetcher-Dateien entpacken Sie über ein Tool wie Ark, File Roller oder Xarchiver. Das dabei angelegte Unterverzeichnis dürfen Sie anschließend in ein Verzeichnis Ihrer Wahl verschieben. Um das Programm über die Menüs der Desktop-Umgebung zu starten, müssen Sie allerdings noch von Hand einen entsprechenden Eintrag erstellen (siehe Kasten „Installation”).

Start frei!

Docfetcher startet nach dem ersten Aufruf auf manchen Systemen zunächst in einen Dialog zum Ändern der Tastenkombination [Strg]+[F8], welche die Software als Shortcut verwendet. Ist dieser bereits anderweitig belegt, so erscheint ein entsprechender Hinweis darauf, den Sie mitOK quittieren. Anschließend öffnet sich das in fünf Bereiche unterteilte Programmfenster. Hier sehen Sie links ganz oben ein Eingabefeld für die minimale und maximale Dateigröße, die Docfetcher bei der Suche berücksichtigen soll.

Darunter wählen Sie in einem Auswahlfeld die Dateitypen aus, die Docfetcher durchsuchen soll, wobei das Programm in der Voreinstellung sämtliche unterstützten Formate aktiviert. Unterhalb dieses Segments finden Sie den Suchbereich, rechts oben eine Eingabezeile für die Suchbegriffe. Darunter listet die Software die Ergebnisse mit Angabe der Trefferrelevanz und der Dateigröße auf, während es unten rechts einen Bereich für die Anzeige der jeweiligen Datei gibt. Hier blendet das Programm anfangs eine Anleitung ein 1.

Damit sich auch große Datenbestände zuverlässig und zügig durchsuchen lassen, muss Docfetcher die Inhalte auf den eingebundenen Datenträgern indexieren. Das stoßen Sie über den DialogIndex erstellen aus an, den Sie über einen Rechtsklick in den Suchbereich unten links im Programmfenster erreichen. Anschließend wählen Sie entweder einen Ordner oder eine Archivdatei aus. In Microsoft- Umgebungen unterstützt Docfetcher auch die Indexierung von PSTDateien, die Nachrichten, Kontakte, Aufgaben oder Termine enthalten.

Zusätzlich erlaubt Docfetcher, die Größe der Dateien einzuschränken, die das Programm berücksichtigen soll. Dazu tragen Sie die Minimal- und Maximalwerte oben links über den Dokument- Typen in die entsprechenden Felder ein. Die auf Apache Lucene [2] basierende Indexierung der Datenbestände nimmt beim ersten Lauf etwas Zeit in Anspruch, beschleunigt jedoch die spätere Suche in diesen Ordnern enorm, da das Programm nicht mehr jede Datei umständlich einzeln überprüfen muss 2.

Nach abgeschlossener Indexierung finden Sie im FenstersegmentSuchbereich die indizierten Verzeichnisse und Archive. Die gewünschten Suchbegriffe tragen Sie in das Suchfeld oben rechts ein. Nach einem Klick auf den SchalterSuchen durchforstet Docfetcher die indexierten Daten und listet dabei Fundstellen auf. Dabei erscheinen im oberen rechten Segment des Programmfensters Dateien, die den Suchbegriff enthalten, zusammen mit einigen Angaben wie der Dateigröße. Darunter im Textsegment finden Sie die Textstellen, an denen der Suchbegriff erscheint. Docfetcher hinterlegt ihn gleich in gelber Farbe, sodass Sie nicht erst umständlich die teils unübersichtlich formatierten Fundstellen durchblättern müssen 3.

Installation

Docfetcher fehlt bislang in den Paketquellen von Ubuntu selbst selbst als Entwicklerversion. Von daher spielen Sie Docfetcher am besten von Hand ins System ein. Als Java-Programm benötigt es als Abhängigkeit lediglich die entsprechende Laufzeitumgebung.

Listing 1 beschreibt das Entpacken des von der Projektseite heruntergeladenen ZIP-Archivs in das für manuell installierte Programme vorgesehene Verzeichnis /usr/local/bin/. Passend dazu finden Sie in Listing 2 den Inhalt für die /usr/share/applications/ docfetcher.desktop, um einen passenden Eintrag im Startmenü Ihrer Desktop-Umgebung zu erzeugen.

Passen Sie bitte in den Kommandos gegebenenfalls die Versionsnummer an. Bevorzugen Sie einen anderen Speicherort als /usr/ local/bin/docfetcher/, müssen Sie zudem die entsprechenden Pfade abändern. Falls Sie noch ein System ohne GTK3-Bibliotheken verwenden, müssen Sie außerdem in der Exec-Zeile DocFetcher‑GTK3. sh gegen DocFetcher‑GTK2.sh tauschen.

1 Die Bedienoberfläche von Docfetcher zeigt alle wichtigen Infos.


2 Während der Indexierung hält Sie Docfetcher auf dem Laufenden.


Mehrere Begriffe

Die Software beherrscht neben der einfachen Suche nach einem Begriff auch die simultane Suche nach mehreren Stichwörtern. Auch Wortfolgen lassen sich mit Docfetcher ausfindig machen. Zusätzlich gibt es die Möglichkeit, Begriffe von der Suche auszuschließen. Möchten Sie nach zwei Begriffen suchen lassen, so geben Sie die beiden Termini mit dem Operanden AND an. Docfetcher sucht dann nach jenen Dateien, in denen beide Begriffe zusammen vorkommen, wobei diese an einer beliebigen Stelle im Text stehen dürfen. Soll die Anwendung hingegen eine exakte Wortfolge finden, dann schließen Sie die fraglichen Worte in Anführungszeichen ein.

Weitere Optionen zum Einschränken des Suchbegriffs bieten das Ausschließen von Begriffen sowie Platzhalter. Während Sie durch ein vorangestelltes Minuszeichen einen Begriff von der Suche ausschließen, definieren Sie mit Fragezeichen und Stern Platzhalter. Das Fragezeichen ersetzt dabei in einem Terminus genau ein Zeichen an der Stelle, an der es steht, der Stern dagegen ersetzt mehrere Zeichen. Insbesondere bei der Suche nach zusammengesetzten Substantiven und Fachbegriffen lässt sich das Ergebnis mithilfe des Sterns optimieren.

Vor allem bei sehr großen Datenbeständen in unterschiedlichsten Formaten fördert die Suche zahlreiche Ergebnisse zutage, die man gar nicht benötigt. Mit der Option, nicht benötigte Formate aus der Anzeige auszuklammern, lässt sich die Liste der Treffer schnell ausdünnen. Entfernen Sie dazu die entsprechenden Häkchen vor den einzelnen Dateiformaten im FenstersegmentDokument- Typen . Alternativ begrenzen Sie die Suche im FenstersegmentSuchbereich auf relevante Verzeichnishierarchien.

In der Ergebnisanzeige springen Sie zwischen den gefundenen Begriffen seitenweise durch Klicken auf die Pfeile nach links oder rechts oberhalb der Suchanzeige im rechten unteren Bereich des Programmfensters. Die Fundstellen erscheinen gelb hinterlegt. Die Pfeilauf-/ Pfeil-ab-Buttons dienen der Navigation von Fundstelle zu Fundstelle, wobei Docfetcher den gesuchten Begriff in grüner Farbe hinterlegt.

Aktualisierungen

Sobald Sie in den von Docfetcher bereits integrierten Verzeichnishierarchien neue Daten ablegen, müssen Sie den Index aktualisieren, um bei späteren Suchen alle Dateien zu berücksichtigen. Dazu klicken Sie mit der rechten Maustaste im Suchbereich auf den entsprechenden Index und wählen im sich öffnenden Kontextmenü die OptionAktualisieren… . Docfetcher integriert nun die neuen Dateien und Verzeichnisse in den Index, was wesentlich schneller geht als das erstmalige Einlesen der Daten.

Über dasselbe Kontextmenü lassen Sie sich auch die in einem Ordner befindlichen Dokumente auflisten, ohne sie zu durchsuchen. Dazu klicken Sie die OptionDokumente auflisten an. Die Software zeigt danach die einzelnen Dateien in der Ergebnisanzeige oben rechts im Programmfenster an. Diese Funktion können Sie stets nur auf ein einzelnes Verzeichnis anwenden, nicht aber auf übergeordnete Verzeichnisse, die selbst nur Unterverzeichnisse beinhalten. Möchten Sie danach einzelne Dateien aus dem Ordner entfernen, so klicken Sie rechts auf die Datei und wählen im Kontextmenü die OptionÜbergeordneten Ordner öffnen aus. Sie öffnet den Dateimanager und listet die darin vorhandenen Dateien zum weiteren Bearbeiten auf. Alternativ zeigen Sie die Ordnerinhalte an, indem Sie links unten im Suchbereich das jeweilige Verzeichnis mit einem Rechtsklick aktivieren und danach im Kontextmenü den EintragOrdner öffnen wählen.

3 Zu den gefundenen Begriffen zeigt die Software alle wichtigen Informationen an.


Problemkinder

Docfetcher unterstützt zwar von Haus aus das PDF-Format, zeigt aber optisch anspruchsvoll aufbereitete Dokumente mit vielen Abbildungen und Tabellen in der Textwiedergabe nur sehr reduziert an: Es erscheint in aller Regel nur der einfache Text ohne spezielle Formatierungen, Bilder oder Grafiken. Da Docfetcher PDF-Dokumente im ASCII-Zeichensatz anzeigt, gibt das Programm auch besondere Layout-Formen nicht korrekt wieder, wie beispielsweise im Spaltensatz formatierte Texte. Programmintern lässt sich das zwar nicht ändern, aber um dieses Manko zu beseitigen, starten Sie durch einen Doppelklick auf die fragliche Fundstelle im oberen Bereich des Fensters den im Betriebssystem installierten PDF-Viewer, der gleich das betreffende Dokument lädt. Im jeweiligen Dokumentenbetrachter müssen Sie dann allerdings erneut nach dem gewünschten Begriff suchen.

Eine Besonderheit stellt auch die Behandlung von HTML-Inhalten in Docfetcher dar. Da die Software mithilfe eines integrierten kleinen Webbrowsers HTML- Inhalte darstellt, bekommen Sie beim Klick auf eine HTML-Datei in den Suchergebnissen im Vorschaufenster deren Inhalte als Webseite angezeigt 4.

Allerdings sollten Sie beim Browsen auf diesen Seiten aufpassen: Aufgrund fehlender Werbeblocker und auch eines fehlenden Popup-Blockers im integrierten Webbrowser kann es passieren, dass sich Popup-Fenster mit penetranter Reklame öffnen, die im Test das gesamte Programm zum Absturz brachte. Es besteht auch die Möglichkeit, dass der integrierte Browser Sicherheitslücken aufweist und schädliche Inhalte somit die Software kompromittieren. Daher sollten Sie Docfetcher bei unbekannten Links nicht zum Surfen verwenden.

Portabel

Docfetcher erlaubt es auch, portable Repositories zu führen. Sie lassen sich auf externen Datenträgern wie DVDs oderusB-Sticks ablegen und stets mit sich führen. Dabei handelt es sich um ein komplettes Repository Ihrer Dokumente, inklusive der kompletten Index-Dateien. Dazu müssen Sie zudem auch das Programmverzeichnis sichern. Die so archivierten Repositories erlauben wie gewohnt eine Volltextsuche im kompletten Datenbestand.

Um die Portabilität sicherzustellen, müssen Sie beim Anlegen neuer Indizes im EinstellungsdialogIndizierungs-Prozesse im BereichDiverse Einstellungen die OptionRelative Pfade speichern, wenn möglich durch Setzen eines Häkchens aktivieren. Nur dann können Sie komplette Repositories anlegen, ohne dass falsche Pfadangaben – die Mountpunkte ändern sich ja eventuell von System zu System – den Index für andere Systeme unbrauchbar machen.

Fazit

Docfetcher empfiehlt sich als Such- und Indexierungsprogramm für den Desktop. Die Software arbeitet schnell und stabil, wobei sich das Programm sehr einfach und intuitiv bedienen lässt; umständliche Installationsorgien mit Datenbank- Backends entfallen. Vor allem für Anwender mit sehr großen Datenbeständen eignet sich die Software aufgrund ihrer Portabilität auch ideal als Archivierungsprogramm. Zu den wenigen Mankos von Docfetcher zählt die mangelnde Unterstützung einiger freier Formate, vor allem in Sachen Multimedia. Wer jedoch primär mit ODF-Dokumenten oder mit PDF-Dateien arbeitet, dürfte mit Docfetcher als Suchprogramm gut zurechtkommen. (cla)

4 Die Inhalte von Webseiten stellt Docfetcher im integrierten Browser gut dar.


Infos

[1] Docfetcher: http://docfetcher.sourceforge.net/ de/ index. html
[2] Apache Lucene: https://lucene.apache.org/ core