Bei Solr handelt es sich um einen Enterprise-Search-Server, basierend auf der Lucene Search Engine. Beides sind in Java entwickelte Projekte der Apache Software Foundation und haben ihre Leistungsfähigkeit mit Referenzen wie eBay, iTunes und Twitter schon längst bewiesen [1].
Wie der Name erahnen lässt, liefert „Apache Solr für TYPO3“ [2] eine Integration von Solr als TYPO3-Extension („solr“ im TYPO3 Extension Repository) [3]. Die Entwicklung der Extension begann als Prototyp bei der dkd Internet Service GmbH im Sommer 2008. Im Frühjahr 2009 begann dann die Umsetzung zur ausgewachsenen Extension mit tiefgehender Integration in das Enterprise Content Management System.
Zu den Prinzipien während der Entwicklung gehörte eine saubere Architektur, verständlicher Code sowie das Ziel einer möglichst einfachen und konsistenten Konfiguration. Darüber hinaus sollen die Redakteure so wenig wie möglich mit der Suche in Kontakt kommen oder auf bestimmte neue Arbeitsweisen achten müssen. Designer müssen sich in der Gestaltung des Interfaces frei entfalten können, ohne durch technologische Gegebenheiten beschränkt zu werden. Zu guter Letzt soll dem Besucher einer Website eine mit modernen Funktionen ausgestatte On-Site-Suche geboten werden, wie er sie etwa von Google kennt.
Neuheiten in Version 2.0
Zu den offensichtlichsten Neuerungen gehört der Installer, der nunmehr die komplette Installation eines Solr-Servers übernimmt. Damit ist es auch ohne jegliche Java-Kenntnisse möglich, einen Solr-Server zu installieren. In der eingesetzten Solr-Version 3.5 hat Apache insbesondere die RAM-Nutzung, Geschwindigkeit und die Query-Syntax verbessert. Außerdem hielten neue Funktionen Einzug in das System, etwa ein neuer Query-Handler, der sowohl Teilwort- und Phrasensuchen als auch boolsche Operatoren ermöglicht.
Während der Installation wird nun standardmäßig eine Multi-Core-Umgebung konfiguriert. Dies erleichtert die Handhabung von mehrsprachigen Webseiten, weil für jede Sprache ein eigener Core mit entsprechenden Algorithmen zur Sprachanalyse verwendet wird. Insgesamt unterstützt Solr nun 36 Sprachen.
Auf TYPO3-Seite unterstützen neue Prüfmethoden und Meldungen im Reports-Modul bei der Fehlersuche. Außerdem wurden die Konfigurationsoptionen der Extension an vielen Stellen vereinheitlicht und logischer gruppiert, um schnell erste Erfolge zu erzielen.
Setzte die letzte öffentliche Version im TYPO3 Extension Repository noch auf die bekannte Frontend-Indexierung, tritt nun die Index-Queue mitsamt Record Monitor und Garbage Collection an deren Stelle.
Über ein neues Modul im TYPO3-Backend können einfache Administrationsaufgaben am Solr-Index ausgeführt werden. Andere Module geben einen Einblick darüber, welche Daten im Index vorhanden sind. An vielen Stellen, an denen man zuvor händisch Daten angeben musste, können diese nun über einfache Menüs ausgewählt werden. Sollten doch einmal Probleme auftreten, helfen erweiterte Logmeldungen, diese zu beheben.
Suchwörter werden nicht nur auf der Ergebnisseite hervorgehoben, sondern auch auf der eigentlichen Zielseite. Ergebnisse können in Gruppen, etwa nach Typ, ausgegeben werden und können über weitere Facetten vom Besucher gefiltert werden. Auch die Indexierung von Mount Pages und Dateianhängen in Datensätzen wie tt_news unterstützt die Extension nun.
All diese Neuerungen brachten diverse Schnitte in der Entwicklung mit sich, die sich auf bestehende Installationen auswirken können. Wer also ein Update plant, sollte vorab einen Blick ins ChangeLog werfen. Als Grundlage wird nun die Long-Term-Support-Version TYPO3 4.5 vorausgesetzt.
Ingo Renner








von alem_r 16.10.2012 (08:55Uhr) 1.
Danke für den coolen Beitrag. Noch ne technische Frage:
Wenn man mehrere Typo3 Installationen auf dem Server hat kann man dies auch für mehrere Installationen nutzen?
Installiert sich der Solr-Server für jede Installation einzeln oder gibt es dann einen Solr-Server als Dienst welcher dann verschiedene "Mandate" pflegt?
Ist das überhaupt zu empfehlen oder lieber pro Installation wo SOLR nötig ist lieber eigene Umgebung?
von olivier 16.10.2012 (10:22Uhr) 2.
Der Apache Solr Server kann mehrere Index-Kerne bereitstellen. Je nach Strategie können dann verschiedene TYPO3 Installationen einen eigenen Index-Kern nutzen oder sich einen Kern teilen. Die einzelnen Index-Dokumente werden durch die Site-ID eindeutig identifiziert.
BTW: Bald started unser SaaS für Apache-Solr: http://www.hosted-solr.com/
von mirkokaufmann 17.10.2012 (22:15Uhr) 3.
Hallo zusammen,
das Release der 2.0 Version ist ja schon ein paar Tage her, aber ich möchte die Index-Queue nicht mehr missen. Die generelle Queue-Konfiguration via TypoScript und seit Neuestem auch die Priorisierung von verschiedenen Index-Typen ermöglicht einen schnellen Aufbau des Suchindexes für umfassende Websites. Spezielle Projekt-Anforderungen lassen sich ebenfalls schnell durch einen eigenen Indexer abdecken.
Vielleicht hilft mein Artikel noch jemanden bei der Installation:
http://www.internetagentur-kaufmann.de/blog/artikel/typo3-solr-suche-die-10-haeufigsten-konfigurationfehler/
Solr in TYPO3 macht einfach Spaß - Schnell. Schneller. Solr.
Beste Grüße
Mirko
von Jpsy 18.10.2012 (12:06Uhr) 4.
Toller Beitrag. Vielen Dank!