Inhaltsverzeichnis
weitere Handbücher
Suchmaschine
Mit diesem Skript können sie ihre Besucher den Inhalt ihrer Homepage durchsuchen lassen. Um es verwenden zu können sind keine Programmierkenntnisse erforderlich.
Für die Installation dieses Pakets benötigen sie die Java VM von Sun. Dabei handelt es sich um ein kostenloses Produkt, dass sie unter http://java.sun.com herunterladen können.
Dieses Skript benötigt PHP und funktioniert deswegen normalerweise nicht auf ihrer lokalen Festplatte sondern nur im Internet. Damit dieses Skript auf ihrer Webseite funktioniert muss von ihrem Anbieter PHP Unterstützung bereitgestellt werden. Fragen sie im Zweifel ihren Anbieter.
automatische Indexierung über mitgeliefertes Java-Programm
läuft via Java Virtual-Machine auf allen gängigen 32-Bit Betriebsystemen (Mac, Linux, Windows, BeOS, ...)
das Layout kann den eigenen Wünschen angepasst werden
intelligente Suche, findet bei Suchbegriffen wie "neu" auch Titel wie "Neues" oder "Neuigkeiten"
mehrseitige Trefferlisten
integrierte Online-Hilfe und Installationsanleitung
Auto-Caching für 30 Einträge
Statistik der 100 am Häufigsten gesuchten Begriffe
für PHP 4
Tools zum Erstellen der Suchdaten | |
---|---|
tools/index.jar |
enthält Programmcode |
tools/start.bat |
Startdatei |
tools/suchindexErstellen.bat |
Kommandozeile |
sonstige Dateien | |
plugins/search |
Verzeichnis für Programmdateien der Suchmaschine |
plugins/search_admin |
Administrationsanwendung |
skins/default/search |
Template-Dateien |
Um dieses Skript nutzen zu können benötigen sie Webspace mit PHP-Unterstützung und FTP-Zugang. Außerdem ein FTP-Programm zum Hochladen der Dateien.
Suchmaschine installieren:
start.bat
"
im Verzeichnis "tools/
". Weitere Details zur
Verwendung dieses Tools finden sie im nächsten
Abschnitt. Der Suchindex selbst wird vom Programm
automatisch erzeugt und in den beiden Dateien keywords.dat
und documents.dat
gespeichert. Sobald sie
diese Datei erstellt haben, ist ihre Suchmaschine
einsatzbereit.Tipp: Die Dateien "suchindexErstellen.class", "suchindexErstellen$1.class" und "suchindexErstellen.bat" müssen sie nicht ins Internet laden.
Sie müssen die Seiten ihrer Homepage nicht von Hand eintragen. Dem Paket liegt ein kleines Java-Tool bei, dass ihnen diese Arbeit abnehmen kann.
Ob sie dieses Programm unter Windows, Linux, Unix oder auf einem Mac. einsetzen wollen ist nicht entscheidend. Was sie allerdings benötigen ist eine funktionierende Laufzeitumgebung. Die aktuelle, für ihr System passende Version erhalten sie kostenlos bei Java.Sun.com. Sie benötigen mindestens Java 2 Version 1.4.2 oder höher mit Swing- und Beans-Bibliotheken. Java ist für Linux bereits in vielen Distributionen enthalten. Auch Nutzer von Windows, die den Browser Netscape Navigator 7 voll installiert haben sollten Java bereits installiert haben und nutzen können.
Um herauszufinden, ob Java auf ihrem System bereits installiert ist, genügt es meist nach der Datei "java.exe" zu suchen. Unter Windows, indem sie im Startmenü auf "Suchen" > "Dateien und Ordner" gehen.
Diese Datei muss außerdem im Systempfad verknüpft sein. Dies wiederum können sie unter Windows prüfen, indem sie im Startmenü die "DOS-Eingabeaufforderung" starten oder direkt den Eintrag "Ausführen" wählen und einfach "java" eingeben. Ihnen sollte nun eine Liste mit Optionen angezeigt werden. Wenn nicht, sollte es unter Umständen schon genügen, die Datei direkt in den Windows-Ordner zu kopieren. Nur falls das nicht genügt, editieren sie bitte die Datei "autoexec.bat" und fügen sie den folgenden Eintrag hinzu (vorher bitte Kopie anlegen):
SET PATH="JAVA-Verzeichnis\bin\java.exe;%PATH%"
Unter Windows-XP machen sie dies in der Systemsteuerung unter "System" > "Erweitert" > "Umgebungsvariablen" > "Systemvariablen". Starten sie den Rechner anschließend neu und versuchen sie noch einmal "java" in der Eingabeaufforderung einzugeben. Sollte auch dies nicht von Erfolg gekrönt sein, bleibt ihnen nichts anderes übrig, als Java neu zu installieren.
Sie können unter Windows erfahren welche Version der Java Virtual Machine sie installiert haben, indem sie den Parameter "java -version" in der Eingabeaufforderung eingeben.
Dieser Teil ist eigentlich ganz einfach. Starten sie die Datei start.bat mit Doppelklick. Das Programm hat eine grafische Oberfläche mit vielen bunten Icons und ist weitestgehend selbsterklärend. Es fragt die notwendigen Eingaben von ihnen ab und erstellt anschließend per Klick einen Suchindex.
Achtung! Sie müssen die Kommandozeile NICHT benutzen. Es existiert eine grafische Nutzeroberfläche, welche sie mit der Datei "start.bat" ausführen können. Sollte diese jedoch nicht funktionieren oder es ihnen lieber ist, können sie das Programm auch von der Kommandozeile aus starten.
Sie können die Indexierung über die DOS-Eingabeaufforderung, oder wahlweise mit Hilfe der Datei "suchIndexErstellen.bat" ausführen.
Diese Datei ist anfangs so eingestellt, dass das aktuelle Verzeichnis inklusive seiner Unterverzeichnisse durchsucht wird. Möchten sie das ändern, müssen sie diese Datei editieren oder das Programm von Hand über die Eingabeaufforderung starten. Ansonsten genügt es die Datei einfach per Doppelklick auszuführen.
In der Eingabeaufforderung:
java -classpath index.jar suchindexErstellen VERZEICHNIS VERFOLGEN METATAGS
VERZEICHNIS: ist das
Verzeichnis, das durchsucht werden soll. Das aktuelle Verzeichnis ist
zum Beispiel .\ das übergeordnete
Verzeichnis ..\ heißt das Verzeichnis
Homepage, geben sie homepage\ an usw.
Bitte verwenden sie lediglich relative Pfadangaben (also nicht C:\\...)
sonst werden die Dateien mit ihrer Festplatte verknüpft.
VERFOLGEN: gibt an, ob die in diesem Verzeichnis enthaltenen
Unterverzeichnisse ebenfalls durchsucht werden sollen oder nicht. Geben
sie true an falls das geschehen soll oder false
falls nicht.
METATAGS: gibt an, ob die in den Meta-Tags enthaltenen Keywords
ebenfalls gespeichert werden sollen oder nicht. Geben sie true
an, falls sie dies möchten, oder false
falls nicht.
Beispiele:
1) Wenn sich ihre Homepage in "C:\Homepage" befindet und die Suchmaschine liegt in "C:\Homepage\suchmaschine" müssen die Java-Dateien in "C:\Homepage\suchmaschine" kopiert werden. Von hier muss auch der Aufruf erfolgen:
java -classpath
index.jar suchindexErstellen ..\ true true
2) Angenommen ihre Homepage befindet sich in "C:\Homepage", ihre Suchmaschine befindet sich wieder im Verzeichnis "C:\Homepage\suchmaschine" und sie möchten aber nur das Verzeichnis "C:\Homepage\test" ohne seine Unterverzeichnisse durchsuchen. Dann geben sie folgendes ein:
java -classpath
index.jar suchindexErstellen ..\test\ false true
3) Ihre Homepage befindet sich (wieder) in "C:\Homepage", ihre Suchmaschine befindet sich dieses Mal im gleichen Verzeichnis und sie möchten nur das Verzeichnis "C:\Homepage\test" und seine Unterverzeichnisse - so lautet die Eingabe wie folgt:
java -classpath
index.jar suchindexErstellen .\test\ true true
Startdatei:
Öffnen sie
zunächst die Datei suchindexErstellen.bat
mit einem normalen Texteditor (zum Beispiel Notepad). Hier finden sie
genau den gleichen Dateiaufruf wie oben inklusive der Beschreibung.
Ändern sie die Einstellungen ihren Wünschen
entsprechend, speichern und starten sie die Datei.
Die Datenbank enthält alle in einem Dokument
gefundenen Begriffe, "Keywords" und den Titel der Seite.
Die Suche beschränkt sich auf HTML-Dokumente (*.htm, *.html,
*.xml, *.shtml). Gespeichert werden neben den gefundenen Suchbegriffen
die URL der Seite und die ersten 80 Zeichen als Beschreibung.
Nicht durchsucht werden außerdem alle Verzeichnisse, deren Name mit einem Unterstrich: "_" beginnt. Der Grund ist, dass einige Homepageprogramme (wie z.Bsp. Frontpage) diese Schreibweise nutzen um Systemverzeichnisse zu markieren, die natürlich nicht durchsucht werden sollen.
Die Dokumente auf meiner Homepage haben sich geändert. Was muss ich machen damit die neuen Dateien auch gefunden werden?
Mit der Datei "suchindexErstellen.bat
"
oder "start.bat
" einen neuen
Suchindex der Homepage erstellen und ins Netz laden. Dabei
müssen die alten
Dateien "keywords.dat
" und "documents.dat
"
ersetzt werden. Falls vorhanden sollten sie den Cache der Suchmaschine
leeren
indem sie im Verzeichnis "cache/
" die Datei(en) "*.cache
"
löschen.
Ich habe einen neuen Suchindex erstellt aber es werden immer noch die alten Ergebnisse angezeigt.
Das kann passieren, wenn sich noch alte Daten im Cache
der Suchmaschine
befinden. Löschen sie dazu im Verzeichnis "cache/
"
alle Dateien mit der Endung "*.cache
" und versuchen sie es
erneut.
Wenn ich die Datei "index.php" aufrufe wird nur der Quellcode angezeigt. Warum?
Dieses Skript benötigt PHP. Wenn der Quellcode im Browser angezeigt wird dann kann es sein, dass PHP von ihrem Anbieter nicht unterstützt wird. Fragen sie im Zweifel ihren Anbieter.
Ich habe einen Suchindex erstellt und zusammen mit der Suchmaschine ins Netz geladen, aber es wird entweder gar nichts oder immer nur 0 Treffer angezeigt.
Das Anzeigen der Trefferliste erledigt ein JavaScript. Das macht die Suchmaschine extrem schnell und entlastet den Server, weil beim Blättern durch die Suchergebnisse keine Daten vom Server nachgeladen werden müssen. Allerdings: muss dazu JavaScript in ihrem Browser aktiviert sein. Wenn die Seite leer bleibt prüfen sie bitte ob JavaScript deaktiviert ist oder durch eine Firewall blockiert wird.
Im Verzeichnis "tools" liegen 2 Dateien "start.bat" und "suchindexErstellen.bat". Was ist der Unterschied zwischen diesen beiden?
Beide tun exakt das gleiche. Nur, dass die Datei
"start.bat" eine hübsche, grafische Oberfläche
aufruft, die alle Daten über ein Menü abfragt. Die
Datei "suchindexErstellen.bat" ignoriert diese Oberfläche und
startet das Programm direkt von der Kommandozeile aus. Dort
müssen sie die Parameter von Hand direkt in der Datei
ändern.
Wer also bunte Menüs möchte, der nimmt "start.bat"
und wer lieber die Kommandozeile mag, "suchindexErstellen.bat".
Ich habe die Suchmaschine ins Netz geladen und bekomme beim Suchen eine Fehlermeldung: "Fehler 500 Suchindex nicht gefunden"
Vermutlich haben sie den Suchindex noch nicht erstellt oder die Dateien im falschen Verzeichnis abgelegt. Wie sie einen Suchindex erstellen können sie im Abschnitt "Verwendung des Indexers" lesen.
Ich habe die Suchmaschine ins Netz geladen und bekomme beim Suchen eine Fehlermeldung: "Fehler 404 Seite nicht gefunden"
Vermutlich haben sie vergessen einige wichtige Dateien, ins Internet zu übertragen. Bitte prüfen sie ob diese Dateien vorhanden sind.
Ich habe die Suchmaschine ins Netz geladen und bekomme beim Suchen eine Fehlermeldung: "Fehler 403 Zugriff verweigert"
Das kann passieren wenn nicht ausreichende
Zugriffsrechte gesetzt sind. Prüfen
sie bitte mit ihrem FTP-Programm ob für die Ordner "cache/
"
und "config/
", sowie alle Unterverzeichnisse und Dateien
ausreichende Zugriffsrechte (lesen UND schreiben) gesetzt sind. Sie
erreichen dies unter UNIX zum Beispiel mit dem Befehl CHMOD 777. Eine
detaillierte
Erläuterung der Zugriffsrechte finden sie in der Installationsanleitung
im Abschnitt für Anfänger.
Ich habe versucht die Datei "start.bat" auszuführen, aber es hat nicht funktioniert.
Bitte prüfen sie, ob sie mindestens Version 1.4.2 der Java Virtual Machine installiert haben. Geben sie dazu in der Eingabeaufforderung ein "java -version". Sollte sie eine ältere Version haben, laden sie sich aus dem Netz unter java.sun.com kostenlos eine aktuellere Version der Java Virtual Machine herunter. Oder versuchen sie die Datei "suchindexErstellen.bat" um das Programm von der Kommandozeile aus zu steuern. Das ist zwar nicht so bequem, dafür reicht dann allerdings schon Version 1.3 der Java Virtual Machine aus.
Meine Frage war nicht dabei - was kann ich tun?
Für registrierte Kunden gibt es einen kostenlosen EMail-Support über unsere Webseite.
Schreiben Sie eine Mail unter Angabe Ihrer Lizenznummer an .
Ich setze mich umgehend mit Ihnen in Verbindung.
Falls Sie nicht registriert sind und das auch nicht vorhaben, aber trotzdem Hilfe, oder eine persönliche Beratung in Anspruch nehmen möchten, können Sie dies dennoch tun. Sie zahlen lediglich eine geringe Aufwandsentschädigung. Gern informiere ich Sie über EMail zu den Details.
© 2001, 2002, 2003, 2004, 2005, 2006Thomas Meyer, www.all-community.de