Weil Excel Mist baut: Wissenschaftler mussten menschliche Gene umbenennen
Die automatische Formatierung von Excel dürfte so gut wie jeden schon einmal in den Wahnsinn getrieben haben. Wissenschaftler mussten deswegen sogar die Richtlinien zur Benennung von Genen anpassen und 27 menschliche Gene umbenennen. Doch warum eigentlich?
Excel interpretiert Namen von Genen als Datumsangaben
Das menschliche Genom besteht aus mehreren zehntausend Genen, die mit einem alphanumerischen Code benannt sind. Dieser Code wird in der Genetik Symbol genannt. Diese Namensgebung führt bei einigen Genen zu ärgerlichen Problemen mit Excel. So lautete der Code für das Gen Membrane Associated Ring-CH-Type Finger 1 MARCH1. Für Excel kann das nur eins Bedeuten: ein Datum! Folglich wurde die Eingabe automatisch zu MAR-1 geändert. Ingesamt 27 Gene waren von diesem Problem betroffen. Das HUGO Gene Nomenclature Committee (HGNC) sah sich daher gezwungen, die Richtlinien zur Nomenklatur von Genen zu ändern. Aus MARCH1 wurde daher MARCHF1.
Wie The Verge berichtet, ist das Problem seit einigen Jahren bekannt. 2016 zeigte eine Studie, dass etwa ein Fünftel der untersuchten wissenschaftlichen Artikel von solchen Fehlern betroffen ist. Die Fehler treten deshalb so häufig auf, weil Excel oft das erste Programm ist, das Wissenschaftler und Wissenschaftlerinnen bei ihrer Arbeit zur Hand haben. Zudem lässt sich das Problem nicht so einfach beheben, da Excel keine Möglichkeit bietet, die automatische Formatierung zu deaktivieren. Zwar könne jeder den Datentyp für einzelne Spalten und Zeilen händisch anpassen, jedoch treten die Fehler erneut auf, wenn eine andere Person mit der Datei arbeitet.
Wenn sich Excel nicht ändert, muss es die Wissenschaft tun
Der Wissenschaft blieben nur zwei Möglichkeiten: Darauf warten, dass Microsoft seine Office-Programme benutzerfreundlicher gestaltet, oder die Richtlinien für eine ganze wissenschaftliche Disziplin über den Haufen werfen.
Diese Woche veröffentlichte das HGNC also neue Richtlinien zur Benennung von Genen, einschließlich für „Symbole, die die Handhabung und den Abruf von Daten beeinflussen“. Die bereits benannten und vom Excel-Problem betroffenen Gene wurden umbenannt. Um Verwirrungen zu vermeiden, verfügt das HGNC über eine Liste der alten Symbole und Namen. Neu zu benennende Gene werden jetzt mit einem Blick auf mögliche Probleme mit Excel benannt. Im vergangenen Jahr seien laut The Verge bereits 27 Gene umbenannt worden.
In der Vergangenheit seien die Richtlinien für die Nomenklatur schon häufig geändert worden, erklärt Elspeth Bruford, Koordinatorin des HGNC, gegenüber The Verge. So wurden etwa die Gene MARS und CARS in MARS1 und CARS1 umbenannt, um Verwechslungen mit den englischen Substantiven zu vermeiden. Daher sollen Gennamen kurz und spezifisch sein, nur aus lateinischen Buchstaben und arabischen Ziffern bestehen und keine Namen oder Wörter buchstabieren (insbesondere Beleidigungen). Dies sei vor allem im Hinblick auf die medizinische Nutzung von Gensymbolen wichtig, wenn etwa medizinisches Personal Eltern eine genetische Anomalie ihres Kindes erklären muss. Dass die Richtlinien geändert werden müssen, um Probleme mit Software auszuschließen, ist jedoch ein Novum.
Auch interessant:
- Bei dieser Domain kommen unzählige sensible Daten an – jetzt soll sie verkauft werden
- Excel: So macht ihr krasse Beats in der Tabellenkalkulation
- Domain-Irrtum: Mittelständler lockt täglich bis zu 50.000 Tesla-Fans auf seine Website
Hä? Das Excel was fehltinterpretiert habe ich auch häufiger, dann stelle ich einfach die Formatierung auf „Text“ und alles ist gut.
Die Frage, die Software zu wechseln und das Monopol zu durchbrechen, stellt sich in der Wissenschaft erst gar nicht. Es gäbe auch Alternativen die nicht kostenlos, jedoch mindestens genauso gut, in der Bedienung noch besser sind zum Beispiel Softmaker Office. Dieses wäre auch kompatibel zu MS-Office, unterstützt den direkten PDF-Export, bringt ein umfangreiches Handbuch (PDF und/oder gedruckt) mit…
Ein Manko gibt’s natürlich auch, dass Es bei größeren Dokumenten manchmal träge wirkt…
Ein einfaches Hochkomma vor dem Text löst das Problem…