>> Inhaltsverzeichnis >> weitere Handbücher >> Suchmaschine

weitere Handbücher

Suchmaschine

Allgemeines

Mit diesem Skript können sie ihre Besucher den Inhalt ihrer Homepage durchsuchen lassen. Um es verwenden zu können sind keine Programmierkenntnisse erforderlich.

Für die Installation dieses Pakets benötigen sie die Java VM von Sun. Dabei handelt es sich um ein kostenloses Produkt, dass sie unter http://java.sun.com herunterladen können.

Dieses Skript benötigt PHP und funktioniert deswegen normalerweise nicht auf ihrer lokalen Festplatte sondern nur im Internet. Damit dieses Skript auf ihrer Webseite funktioniert muss von ihrem Anbieter PHP Unterstützung bereitgestellt werden. Fragen sie im Zweifel ihren Anbieter.

Features

 

mitgelieferte Dateien

Tools zum Erstellen der Suchdaten
tools/index.jar enthält Programmcode
tools/start.bat Startdatei
tools/suchindexErstellen.bat Kommandozeile
sonstige Dateien
plugins/search Verzeichnis für Programmdateien der Suchmaschine
plugins/search_admin Administrationsanwendung
skins/default/search Template-Dateien

Installation


Um dieses Skript nutzen zu können benötigen sie Webspace mit PHP-Unterstützung und FTP-Zugang. Außerdem ein FTP-Programm zum Hochladen der Dateien.

Suchmaschine installieren:

  1. Zuerst sollten sie den Suchindex erstellen. Verwenden sie dazu die Datei "start.bat" im Verzeichnis "tools/". Weitere Details zur Verwendung dieses Tools finden sie im nächsten Abschnitt. Der Suchindex selbst wird vom Programm automatisch erzeugt und in den beiden Dateien keywords.dat und documents.dat gespeichert. Sobald sie diese Datei erstellt haben, ist ihre Suchmaschine einsatzbereit.
  2. Stellen sie nun mit ihrem FTP-Programm eine Verbindung zu ihrem Anbieter her.
  3. Laden sie den Ordner zusammen mit den Unterverzeichnissen in einen Ordner auf ihrer Homepage.
  4. Schließen sie die FTP-Verbindung.

Tipp: Die Dateien "suchindexErstellen.class", "suchindexErstellen$1.class" und "suchindexErstellen.bat" müssen sie nicht ins Internet laden.

Verwendung des Indexers

Sie müssen die Seiten ihrer Homepage nicht von Hand eintragen. Dem Paket liegt ein kleines Java-Tool bei, dass ihnen diese Arbeit abnehmen kann.


Abbildung: graf. Oberfläche zum
Erstellen eines Suchindex

Installation von Java

Ob sie dieses Programm unter Windows, Linux, Unix oder auf einem Mac. einsetzen wollen ist nicht entscheidend. Was sie allerdings benötigen ist eine funktionierende Laufzeitumgebung. Die aktuelle, für ihr System passende Version erhalten sie kostenlos bei Java.Sun.com. Sie benötigen mindestens Java 2 Version 1.4.2 oder höher mit Swing- und Beans-Bibliotheken. Java ist für Linux bereits in vielen Distributionen enthalten. Auch Nutzer von Windows, die den Browser Netscape Navigator 7 voll installiert haben sollten Java bereits installiert haben und nutzen können.

Um herauszufinden, ob Java auf ihrem System bereits installiert ist, genügt es meist nach der Datei "java.exe" zu suchen. Unter Windows, indem sie im Startmenü auf "Suchen" > "Dateien und Ordner" gehen.

Diese Datei muss außerdem im Systempfad verknüpft sein. Dies wiederum können sie unter Windows prüfen, indem sie im Startmenü die "DOS-Eingabeaufforderung" starten oder direkt den Eintrag "Ausführen" wählen und einfach "java" eingeben. Ihnen sollte nun eine Liste mit Optionen angezeigt werden. Wenn nicht, sollte es unter Umständen schon genügen, die Datei direkt in den Windows-Ordner zu kopieren. Nur falls das nicht genügt, editieren sie bitte die Datei "autoexec.bat" und fügen sie den folgenden Eintrag hinzu (vorher bitte Kopie anlegen):

SET PATH="JAVA-Verzeichnis\bin\java.exe;%PATH%"

Unter Windows-XP machen sie dies in der Systemsteuerung unter "System" > "Erweitert" > "Umgebungsvariablen" > "Systemvariablen". Starten sie den Rechner anschließend neu und versuchen sie noch einmal "java" in der Eingabeaufforderung einzugeben. Sollte auch dies nicht von Erfolg gekrönt sein, bleibt ihnen nichts anderes übrig, als Java neu zu installieren.

Sie können unter Windows erfahren welche Version der Java Virtual Machine sie installiert haben, indem sie den Parameter "java -version" in der Eingabeaufforderung eingeben.

Programm nutzen

Dieser Teil ist eigentlich ganz einfach. Starten sie die Datei start.bat mit Doppelklick. Das Programm hat eine grafische Oberfläche mit vielen bunten Icons und ist weitestgehend selbsterklärend. Es fragt die notwendigen Eingaben von ihnen ab und erstellt anschließend per Klick einen Suchindex.

Alternativ: Kommandozeile

Achtung! Sie müssen die Kommandozeile NICHT benutzen. Es existiert eine grafische Nutzeroberfläche, welche sie mit der Datei "start.bat" ausführen können. Sollte diese jedoch nicht funktionieren oder es ihnen lieber ist, können sie das Programm auch von der Kommandozeile aus starten.

Sie können die Indexierung über die DOS-Eingabeaufforderung, oder wahlweise mit Hilfe der Datei "suchIndexErstellen.bat" ausführen.

Diese Datei ist anfangs so eingestellt, dass das aktuelle Verzeichnis inklusive seiner Unterverzeichnisse durchsucht wird. Möchten sie das ändern, müssen sie diese Datei editieren oder das Programm von Hand über die Eingabeaufforderung starten. Ansonsten genügt es die Datei einfach per Doppelklick auszuführen.

In der Eingabeaufforderung:

java -classpath index.jar suchindexErstellen VERZEICHNIS VERFOLGEN METATAGS

VERZEICHNIS: ist das Verzeichnis, das durchsucht werden soll. Das aktuelle Verzeichnis ist zum Beispiel .\ das übergeordnete Verzeichnis ..\ heißt das Verzeichnis Homepage, geben sie homepage\ an usw.
Bitte verwenden sie lediglich relative Pfadangaben (also nicht C:\\...) sonst werden die Dateien mit ihrer Festplatte verknüpft.
VERFOLGEN: gibt an, ob die in diesem Verzeichnis enthaltenen Unterverzeichnisse ebenfalls durchsucht werden sollen oder nicht. Geben sie true an falls das geschehen soll oder false falls nicht.
METATAGS: gibt an, ob die in den Meta-Tags enthaltenen Keywords ebenfalls gespeichert werden sollen oder nicht. Geben sie true an, falls sie dies möchten, oder false falls nicht.

 Beispiele:

1) Wenn sich ihre Homepage in "C:\Homepage" befindet und die Suchmaschine liegt in "C:\Homepage\suchmaschine" müssen die Java-Dateien in "C:\Homepage\suchmaschine" kopiert werden. Von hier muss auch der Aufruf erfolgen:

java -classpath index.jar suchindexErstellen ..\ true true

2) Angenommen ihre Homepage befindet sich in "C:\Homepage", ihre Suchmaschine befindet sich wieder im Verzeichnis "C:\Homepage\suchmaschine" und sie möchten aber nur das Verzeichnis "C:\Homepage\test" ohne seine Unterverzeichnisse durchsuchen. Dann geben sie folgendes ein:

java -classpath index.jar suchindexErstellen ..\test\ false true

3) Ihre Homepage befindet sich (wieder) in "C:\Homepage", ihre Suchmaschine befindet sich dieses Mal im gleichen Verzeichnis und sie möchten nur das Verzeichnis "C:\Homepage\test" und seine Unterverzeichnisse - so lautet die Eingabe wie folgt:

java -classpath index.jar suchindexErstellen .\test\ true true

Startdatei:

Öffnen sie zunächst die Datei suchindexErstellen.bat mit einem normalen Texteditor (zum Beispiel Notepad). Hier finden sie genau den gleichen Dateiaufruf wie oben inklusive der Beschreibung. Ändern sie die Einstellungen ihren Wünschen entsprechend, speichern und starten sie die Datei.

Welche Informationen werden gespeichert?

Die Datenbank enthält alle in einem Dokument gefundenen Begriffe, "Keywords" und den Titel der Seite.
Die Suche beschränkt sich auf HTML-Dokumente (*.htm, *.html, *.xml, *.shtml). Gespeichert werden neben den gefundenen Suchbegriffen die URL der Seite und die ersten 80 Zeichen als Beschreibung.

Nicht durchsucht werden außerdem alle Verzeichnisse, deren Name mit einem Unterstrich: "_" beginnt. Der Grund ist, dass einige Homepageprogramme (wie z.Bsp. Frontpage) diese Schreibweise nutzen um Systemverzeichnisse zu markieren, die natürlich nicht durchsucht werden sollen.

Häufige Fragen

Die Dokumente auf meiner Homepage haben sich geändert. Was muss ich machen damit die neuen Dateien auch gefunden werden?

Mit der Datei "suchindexErstellen.bat" oder "start.bat" einen neuen Suchindex der Homepage erstellen und ins Netz laden. Dabei müssen die alten Dateien "keywords.dat" und "documents.dat" ersetzt werden. Falls vorhanden sollten sie den Cache der Suchmaschine leeren indem sie im Verzeichnis "cache/" die Datei(en) "*.cache" löschen.

Ich habe einen neuen Suchindex erstellt aber es werden immer noch die alten Ergebnisse angezeigt.

Das kann passieren, wenn sich noch alte Daten im Cache der Suchmaschine befinden. Löschen sie dazu im Verzeichnis "cache/" alle Dateien mit der Endung "*.cache" und versuchen sie es erneut.

Wenn ich die Datei "index.php" aufrufe wird nur der Quellcode angezeigt. Warum? 

Dieses Skript benötigt PHP. Wenn der Quellcode im Browser angezeigt wird dann kann es sein, dass PHP von ihrem Anbieter nicht unterstützt wird. Fragen sie im Zweifel ihren Anbieter.

Ich habe einen Suchindex erstellt und zusammen mit der Suchmaschine ins Netz geladen, aber es wird entweder gar nichts oder immer nur 0 Treffer angezeigt.

Das Anzeigen der Trefferliste erledigt ein JavaScript. Das macht die Suchmaschine extrem schnell und entlastet den Server, weil beim Blättern durch die Suchergebnisse keine Daten vom Server nachgeladen werden müssen. Allerdings: muss dazu JavaScript in ihrem Browser aktiviert sein. Wenn die Seite leer bleibt prüfen sie bitte ob JavaScript deaktiviert ist oder durch eine Firewall blockiert wird.

Im Verzeichnis "tools" liegen 2 Dateien "start.bat" und "suchindexErstellen.bat". Was ist der Unterschied zwischen diesen beiden?

Beide tun exakt das gleiche. Nur, dass die Datei "start.bat" eine hübsche, grafische Oberfläche aufruft, die alle Daten über ein Menü abfragt. Die Datei "suchindexErstellen.bat" ignoriert diese Oberfläche und startet das Programm direkt von der Kommandozeile aus. Dort müssen sie die Parameter von Hand direkt in der Datei ändern.
Wer also bunte Menüs möchte, der nimmt "start.bat" und wer lieber die Kommandozeile mag, "suchindexErstellen.bat".

Ich habe die Suchmaschine ins Netz geladen und bekomme beim Suchen eine Fehlermeldung: "Fehler 500 Suchindex nicht gefunden"

Vermutlich haben sie den Suchindex noch nicht erstellt oder die Dateien im falschen Verzeichnis abgelegt. Wie sie einen Suchindex erstellen können sie im Abschnitt "Verwendung des Indexers" lesen.

Ich habe die Suchmaschine ins Netz geladen und bekomme beim Suchen eine Fehlermeldung: "Fehler 404 Seite nicht gefunden"

Vermutlich haben sie vergessen einige wichtige Dateien, ins Internet zu übertragen. Bitte prüfen sie ob diese Dateien vorhanden sind.

Ich habe die Suchmaschine ins Netz geladen und bekomme beim Suchen eine Fehlermeldung: "Fehler 403 Zugriff verweigert"

Das kann passieren wenn nicht ausreichende Zugriffsrechte gesetzt sind. Prüfen sie bitte mit ihrem FTP-Programm ob für die Ordner "cache/" und "config/", sowie alle Unterverzeichnisse und Dateien ausreichende Zugriffsrechte (lesen UND schreiben) gesetzt sind. Sie erreichen dies unter UNIX zum Beispiel mit dem Befehl CHMOD 777. Eine detaillierte Erläuterung der Zugriffsrechte finden sie in der Installationsanleitung im Abschnitt für Anfänger.

Ich habe versucht die Datei "start.bat" auszuführen, aber es hat nicht funktioniert.

Bitte prüfen sie, ob sie mindestens Version 1.4.2 der Java Virtual Machine installiert haben. Geben sie dazu in der Eingabeaufforderung ein "java -version". Sollte sie eine ältere Version haben, laden sie sich aus dem Netz unter java.sun.com kostenlos eine aktuellere Version der Java Virtual Machine herunter. Oder versuchen sie die Datei "suchindexErstellen.bat" um das Programm von der Kommandozeile aus zu steuern. Das ist zwar nicht so bequem, dafür reicht dann allerdings schon Version 1.3 der Java Virtual Machine aus.

Meine Frage war nicht dabei - was kann ich tun?

Für registrierte Kunden gibt es einen kostenlosen EMail-Support über unsere Webseite. Schreiben Sie eine Mail unter Angabe Ihrer Lizenznummer an . Ich setze mich umgehend mit Ihnen in Verbindung.

Falls Sie nicht registriert sind und das auch nicht vorhaben, aber trotzdem Hilfe, oder eine persönliche Beratung in Anspruch nehmen möchten, können Sie dies dennoch tun. Sie zahlen lediglich eine geringe Aufwandsentschädigung. Gern informiere ich Sie über EMail zu den Details.

© 2001, 2002, 2003, 2004, 2005, 2006Homepage: Thomas Meyer, www.all-community.de