Einsatzleiterwiki

Das elektronische Einsatzleiterhandbuch

Benutzer-Werkzeuge

Webseiten-Werkzeuge


wiki:hilfe:plugins:optional:docsearch

Sie befinden sich in der bearbeitbaren Version des Einsatzleiterwiki-Projekts. Klicken Sie hier für allgemeine Informationen zum Projekt.

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen RevisionVorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
wiki:hilfe:plugins:optional:docsearch [04.10.2021 21:04] christoph_ziehrwiki:hilfe:plugins:optional:docsearch [08.10.2021 11:24] (aktuell) christoph_ziehr
Zeile 1: Zeile 1:
-<WRAP center round important 100%> 
-Diese Anleitung ist ein Entwurf und noch nicht fertig! 
-</WRAP> 
- 
 ====== docsearch-Plugin: Dokumente durchsuchbar machen ====== ====== docsearch-Plugin: Dokumente durchsuchbar machen ======
  
Zeile 53: Zeile 49:
 INPUTFILE="$1" INPUTFILE="$1"
 OUTPUTFILE="$2" OUTPUTFILE="$2"
 +
 +# Dateiname ohne Pfad ermitteln
 +INPUTFILENAME=`basename "$INPUTFILE"`
  
 #Pfad (ohne Dateiname) für die Ausgabedatei ermitteln #Pfad (ohne Dateiname) für die Ausgabedatei ermitteln
Zeile 59: Zeile 58:
 # Dateiendung der Eingabedatei ermitteln # Dateiendung der Eingabedatei ermitteln
 INPUTFILEEXT=${INPUTFILE##*.} INPUTFILEEXT=${INPUTFILE##*.}
 +
 +# Dateiname ohne Dateiendung ermitteln
 +FILENAME=${INPUTFILENAME%.*}
  
 # je nach Dateityp den entsprechenden Befehl ausführen # je nach Dateityp den entsprechenden Befehl ausführen
Zeile 68: Zeile 70:
         doc|dot|docx|docm|dotx|dotm|xls|xlm|xlt|xlsx|xlsm|xltx|xltm|ppt|pot|pps|pptx|pptm|potx|potm|ppsx|ppsm|odt|ott|ods|ots|csv|odp|otp|odg)         doc|dot|docx|docm|dotx|dotm|xls|xlm|xlt|xlsx|xlsm|xltx|xltm|ppt|pot|pps|pptx|pptm|potx|potm|ppsx|ppsm|odt|ott|ods|ots|csv|odp|otp|odg)
             libreoffice --headless --convert-to "txt:Text (encoded):UTF8" --outdir "$OUTPUTPATH" "$INPUTFILE"             libreoffice --headless --convert-to "txt:Text (encoded):UTF8" --outdir "$OUTPUTPATH" "$INPUTFILE"
 +            mv $OUTPUTPATH/$FILENAME.txt $OUTPUTPATH/$INPUTFILENAME.txt
             ;;             ;;
 esac esac
Zeile 118: Zeile 121:
  
 Möchten Sie bestimmte Dateitypen von der Aufnahme in den Suchindex ausschließen, so löschen Sie die entsprechende Zeile, welche mit der Dateiendung beginnt, aus der Datei ''converter.php'' heraus. Möchten Sie bestimmte Dateitypen von der Aufnahme in den Suchindex ausschließen, so löschen Sie die entsprechende Zeile, welche mit der Dateiendung beginnt, aus der Datei ''converter.php'' heraus.
 +
 +==== Funktion testen ====
 +
 +Nun kann die Konfiguration getestet werden. Auch hier werden alle Befehle wieder als root ausgeführt. Der Befehl kann standardmäßig nicht durch den Benutzer des Webservers www-data (unter Ubuntu/Debian) ausgeführt werden, da dieser keine Berechtigung besitzt die Befehle direkt auszuführen. Statt der Verwendung des root-Accounts kann auch ein eigener Benutzer für diese Aufgabe angelegt werden, der dann allerdings auch Schreibrechte im ''data''-Ordner des Wikis besitzen muss.
 +
 +Zum Test wird nun das Kommando ausgeführt (auch hier müssen Sie natürlich wieder Ihren Installationspfad anpassen):
 +
 +<code>
 +sudo php /var/www/html/einsatzleiterwiki/lib/plugins/docsearch/cron.php
 +</code>
 +
 +Nun werden Sie einigen Text auf Ihrem Bildschirm durchlaufen sehen. Die Meldung ''Syntax Warning: Invalid Font Weight'' können Sie ignorieren. PDF-Dateien werden ohne Meldung bearbeitet. Bei Office-Dokumenten wird für jede Datei eine Zeile ausgegeben. Lediglich wenn eine Zeile mit ''Command failed'' beginnt, konnte die Datei nicht konvertiert bzw. eingelesen werden. Bei Excel-Dateien scheint es hier noch teilweise zu Problemen zu kommen.
 +
 +Nachdem das Programm durchgelaufen ist, können Sie Ihr Wiki öffnen und eine Suche nach einem Begriff durchführen, der sich in einem Dokument befindet. Auch der Suchergebnis-Seite sehen Sie nun einen neuen Abschnitt **Ergebnisse in Dokumenten**, in dem die Treffer in Medien-Dateien aufgelistet werden.
 +
 +==== Suchindex für Media-Dateien regelmäßig automatisiert erzeugen ====
 +
 +Damit Sie das Kommando nicht jedes Mal per Hand ausführen müssen, können Sie diesen Schritt auch automatisieren. Dazu muss der Befehl in die //crontab// eingetragen werden. Diese können sie wie folgt öffnen:
 +
 +<code>
 +sudo crontab -e
 +</code>
 +
 +Falls Sie noch nie die Crontab geöffnet haben, werden Sie beim ersten Mal gefragt, welchen Editor Sie verwenden möchten:
 +
 +<code>
 +no crontab for root - using an empty one
 +
 +Select an editor.  To change later, run 'select-editor'.
 +  1. /bin/nano        <---- easiest
 +  2. /usr/bin/vim.tiny
 +  3. /bin/ed
 +
 +Choose 1-3 [1]:
 +</code>
 +
 +Geben Sie nun die Ziffer **1** ein und drücken Sie **Enter**.
 +
 +Fügen Sie nun folgende Zeile am Ende der Datei ein (Pfad wieder anpassen):
 +
 +<code>
 +0 2 * * * php /var/www/html/einsatzleiterwiki/lib/plugins/docsearch/cron.php
 +</code>
 +
 +Damit wird der Suchindex für Mediendateien täglich um 2 Uhr neu erzeugt.
 +
 +Die fünf Zahlen (oder Sternchen) bedeuten dabei:
 +
 +<code>
 +*                  Befehl der ausgeführt werden soll
 +-                 -
 +|                 |
 +|                 +----- Wochentag (0 - 7) (Sonntag ist 0 und 7)
 +|             +------- Monat (1 - 12)
 +|         +--------- Tag (1 - 31)
 +|     +----------- Stunde (0 - 23)
 ++------------- Minute (0 - 59)
 +</code>
 +
 +Weitere Informationen dazu finden Sie unter [[https://wiki.ubuntuusers.de/Cron/]]
 +
 +Speichern Sie nun die Crontab mit der Tastenkombination ''STRG + o'' (kleiner Buchstabe o) und bestätigen Sie mit Enter. Die Bearbeitung können Sie mittels der Tastenkombination ''STRG + x'' beenden.
 +
 +Die Einrichtung ist damit abgeschlossen.
wiki/hilfe/plugins/optional/docsearch.1633381448.txt.gz · Zuletzt geändert: 04.10.2021 21:04 von christoph_ziehr