Software & Infrastruktur

Eine Einführung in die Sucherweiterung für eZ Publish: Die eigene Suchmaschine mit eZ Find 2.0

Seite 3 / 4

eZ Publish und eZ Systems
eZ Publish ist das Enterprise CMS der
norwegischen Firma eZ Systems für mittlere bis große Installationen.
Das in PHP 5 entwickelte System ist unter der GPL verfügbar. Besonders hervorzuheben
sind der objektorientierte Ansatz zur einfachen Modellierung von
Inhalten, die umfangreiche Unterstützung für mehrsprachige Webauftritte, die Versionierung von Content-Objekten und die einfache Erweiterbarkeit in
Form von Extensions. Inhalte werden als Objekte einer bestimmten Klasse
angelegt, zum Beispiel Nachrichten, Blogeinträge oder Bilder, die
wiederum bestimmte Attribute haben (z. B. Überschrift, Text und Autor). Bei
Extensions wie eZ Find handelt es sich um Plugins zur Erweiterung der
Funktionalität oder des Designs. Die Flexibilität von eZ Publish
zeigt sich auch in den Anbindungsmöglichkeiten an diverse
Drittherstellersysteme wie Apple Final Cut Server, Adobe
Indesign, SDL Trados, SugarCRM, diversen Payment-Gateways und weitere.

Such-Performance

Bei eZ Find wird der Suchindex getrennt vom eigentlichen CMS angelegt. Dadurch ergeben sich mehrere Vorteile: Eine Suchanfrage belastet das Backend des CMS nicht, bei Volltextsuchen müssen beispielsweise keine Full-Table-Scans vom Datenbankserver durchgeführt werden. Gerade bei hochfrequentierten Webseiten kann dies bereits zu einer spürbar schnelleren Performance gegenüber der CMS-eigenen Suche führen. Häufige Suchanfragen führen bei Solr ebenfalls dazu, dass der Index-Cache optimiert wird und eZ Find mit jeder Suche schneller wird.

eZ Find unterstützt den Einsatz im Cluster-Modus, um höhere Geschwindigkeiten oder Ausfallsicherheit zu gewährleisten. Pro Server werden jedoch bereits bis zu 100 Millionen Objekte unterstützt, sodass Cluster nur in sehr umfangreichen Installationen notwendig sind. Als Faustregel gilt, dass bei einem Index mit 10 Millionen Objekten 10 Suchanfragen pro Sekunde – inklusive Facets, Hervorhebungen, Rechtschreibkontrolle und ähnliche Artikelvorschläge – auf gängiger Hardware realistisch sind.

Relevancy Tuning

Im Rahmen der Indizierung lassen sich bestimmte Boost-Faktoren angeben, die sich auf die intern genutzte Relevanzpunktzahl auswirken. Bestimmten Inhaltsklassen kann in der Anzeige somit der Vorzug gegeben werden oder Treffer in bestimmten Attributen werden stärker gewertet: Taucht der Suchbegriff in einer Überschrift auf, ist die Relevanz höher, als wenn der Suchbegriff in einem ALT-Tag eines Bilds steht. Im Gegensatz zu Solr sorgt das Zusammentreffen mehrerer Boost-Faktoren nicht dafür, dass diese multipliziert werden. Sie werden lediglich addiert.

Auch unterschiedliche Sprachen können in Abhängigkeit des Suchkontexts besondere Gewichtung erhalten. Prinzipiell durchsucht eZ Find die aktuelle Sprache, insofern die Suche nicht explizit auch andere Sprachen miteinbeziehen soll. Ebenso, wie bestimmte Objektklassen oder Attribute eine höhere Relevanz bekommen können, lassen sich Klassen auch aus der Indizierung ausklammern.

Startet ein angemeldeter Besucher eine Suchabfrage, werden automatisch die entsprechenden Berechtigungen bei der Anzeige der Ergebnisse berücksichtigt. Gibt es einen für anonyme Besucher verborgenen Bereich, taucht dieser auch nicht in einer normalen Suche auf, identifiziert sich ein Nutzer hingegen als Partner oder Lieferant, so kann er natürlich auch die zugehörigen, für anonyme Anwender versteckten Bereiche durchsuchen.

Facets und ähnliche Treffer

Hat eine Suche einmal Ergebnisse gefunden, lassen sich diese mit eZ Find beliebig sortieren und weiter verfeinern. Diese Filtermöglichkeit wird auch als Drill-Down-Navigation oder Facetting bezeichnet [5]. Ein bekanntes Anwendungsgebiet sind Preissuchmaschinen. Die Facetten stellen in der Regel Kategorien dar. Sucht man in einem Portal nach „Pizza“, könnte es Ergebnisse in den Kategorien Nachrichten, Rezepte und Forumsbeiträge geben. Ohne eine neue Suche zu starten, erlauben die Facetten eine weitere Eingrenzung der Ergebnisse eben nur auf Rezepte.

Bitte beachte unsere Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Schreib den ersten Kommentar!

Melde dich mit deinem t3n Account an oder fülle die unteren Felder aus.

Bitte schalte deinen Adblocker für t3n.de aus!

Hey du! Schön, dass du hier bist. 😊

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team bestehend aus 65 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Danke für deine Unterstützung.

Digitales High Five,
Stephan Dörner (Chefredakteur t3n.de) & das gesamte t3n-Team

Anleitung zur Deaktivierung