Die große Zahl unterschiedlicher Zeichensätze stammt aus einer Zeit, in der Speicher ein äußerst knappes Gut war. So besaß jeder Zeichensatz nur eine überschaubare Anzahl an Zeichen. Wollte man nun den Zeichensatz einer Website zum Beispiel von Deutsch nach Arabisch wechseln, musste man von „ISO 8859-1“ nach „ar-win1256“ umschalten. Diese Umstellung konnte aber nur für eine komplette Website gemacht werden. Innerhalb einer Seite oder innerhalb eines XML-Dokuments war dies nicht möglich. Es musste also ein gemeinsamer Zeichensatz für alle Sprachen geschaffen werden. Die Lösung heißt Unicode, wobei sich der Zeichensatz UTF-8 durchgesetzt hat. Dabei stehen bis zu 4 Byte für die Kodierung eines Zeichens zur Verfügung. Die Anzahl an möglichen unterschiedlichen Zeichen wuchs dadurch von 128 Zeichen bei 7 Bit oder 256 bei 8 Bit auf über eine Millionen an.
„Frisches“ TYPO3 mit UTF-8-Datenbank
Sofern Sie MySQL in der Version 4.1 oder 5.x einsetzen, können Sie eine aktuelle TYPO3-Version mit UTF-8 verwenden. Leider wird UTF-8 von TYPO3 noch nicht standardmäßig aktiviert. Zunächst müssen Sie TYPO3 daher mit einer UTF-8 Datenbank aufsetzen. Meist hat man bei einem Hoster schon ein fertiges TYPO3 ohne UTF-8-Unterstützung installiert. Die Datenbank zu konvertieren würde länger dauern, als sie neu zu erstellen. Dabei kommt es aber auf die richtige Reihenfolge an.
Installieren Sie zunächst die Extension „phpmyadmin“ [1]. Klicken Sie anschließend auf den Menüpunkt „phpmyadmin“ und dann direkt auf „Operationen“. Wählen Sie nun bei Kollation „utf8_general_ci“ aus. „utf8_unicode_ci“ ist zwar genauer, aber langsamer und unterscheidet sich im Deutschen nur bei SELECT-Abfragen, bei denen im Datensatz ein „ß“ vorkommt. Hier würde im einen Fall nach einem einfachen, im anderen Fall nach einem doppelten „s“ sortiert.
Durch Klick auf den Datenbanknamen über der Tabellenauflistung kommen Sie zur Ansicht der Tabellenstrukturen. Markieren Sie nun alle Tabellen mit „Alle markieren“ und wählen aus der Drop-Down-Box unten „markierte: => Löschen“ aus. Nach einer Sicherheitsabfrage werden die Tabellen endgültig gelöscht. Die Datenbank mit der voreingestellten Kollation ist anschließend aber immer noch vorhanden.



