Ratgeber

Data Science – Ressourcen zum selber lernen

Ein ausgewachsener Pinguin unter Jungtieren – der Job eines Data-Scientist ist es, Anomalien in Daten zu erkennen. (Foto: Shutterstock/Jeremy Richards)

Hinweis: Wir haben in diesem Artikel Provisions-Links verwendet und sie durch "*" gekennzeichnet. Erfolgt über diese Links eine Bestellung, erhält t3n.de eine Provision.

Das Internet bietet unendlich viele Ressourcen zum Programmieren lernen – Entwickler, die sich das Handwerk selber beigebracht haben, sind mittlerweile gar nicht mehr so selten. Theoretisch könnt ihr euch auch selber zum Data-Scientist weiterbilden, dafür bietet das Netz mittlerweile nämlich ebenfalls sehr viele – oft sogar kostenlose – Ressourcen. 

Data-Science ist ein interdisziplinäres Feld, in dem wissenschaftliche Methoden, Prozesse, Algorithmen und Systeme angewandt werden, um Wissen und Einsichten aus großen Datenmengen zu ziehen. Anders gesagt: Data-Scientists wenden wissenschaftliche Methoden an, um Muster oder Einsichten zu gewinnen, auf deren Basis Unternehmen Vorgänge optimieren und bessere Entscheidungen treffen können.

In den letzten Jahren hat die Nachfrage nach Data-Scientists dementsprechend rasant zugenommen. Der Einstieg ist jedoch gar nicht so einfach. Naturwissenschaftler mit Statistikkenntnissen haben ganz gute Karten, aber auch sie müssen sich eine ganze Reihe weiterer zusätzlicher Kenntnisse aneignen. Meistens hapert es an den technischen Skills. Da hattet ihr zwar Statistik I, II und III an der Uni belegt und alle drei bestanden, Python, die in der Datenwissenschaft meistgenutzte Programmiersprache, aber noch nie auch nur eines Blickes gewürdigt. Überhaupt, Programmiersprachen lernt man an der Uni in den Fachbereichen Physik oder Biologie wahrscheinlich nicht.

An dieser Stelle anzusetzen, ist wahrscheinlich nicht die schlechteste Idee. Bevor ihr Python entsprechend nutzen könnt, solltet ihr erstmal die Grundkonzepte der Sprache verstehen lernen. Wer keine Erfahrung hat, dem seien die kostenlosen Einsteigerkurse von Codecademy* ans Herz gelegt. Dort schreibt ihr von der ersten Lektion an kleine Programme und lernt so die Basics – Syntax, Funktionen, Loops, Klassen, Module und sowas. Codecademy bietet außerdem ein kostenpflichtiges Pro-Programm, in dem ihr zusätzliche Projekte bearbeiten könnt. Ob sich das im Einzelfall lohnt, müsst ihr selbst entscheiden.

Datenanalyse mit Python

Wenn ihr euch mit den Python-Basics – oder auch gerne darüber hinaus – einigermaßen sicher fühlt, könnt ihr anfangen, euch mit Datenanalyse und wie ihr Python dabei einsetzen könnt, zu befassen. Ein Blick wert ist dafür zum Beispiel dataquest.io – dort findet ihr relativ viele kostenfreie Inhalte – und Lernpfade für Datenanalysten, Data-Scientists und Dateningenieure. Wer doch ein bisschen Geld über hat, das sie oder er in Bildung investieren kann und will, ist ganz gut damit beraten, es in ein paar Monate Premiummitgliedschaft bei dataquest.io zu stecken – Kostenpunkt zwischen 24,50 und 49 US-Dollar pro Monat, abhängig von dem Modell, für das ihr euch entscheidet.

Wenn ihr euch für die Investition entschieden habt, habt ihr durch den Dataquest-Kurs wahrscheinlich einen ganz guten Überblick über Machine Learning mit Python gewonnen. Wenn nicht, nehmt euch am Besten Scikit-Learn vor – eine der meistgenutzten Machine-Learning-Libraries. Die Doku ist ziemlich gut und ausführlich – dort findet ihr Tutorials ohne Ende. Außerdem einen Blick wert ist das GitHub-Repo von Andreas Mueller – einer der Core-Entwickler der Library. Dort findet ihr Bücher, Slides und Notizen zu Workshops, die Mueller wohl ab und an gibt. Wenn ihr das durch habt, könnt und solltet ihr euch an kleineren Machine-Learning-Projekten versuchen – Programmieren lernt ihr am Besten, indem ihr es einfach macht!

Bitte beachte unsere Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Schreib den ersten Kommentar!

Melde dich mit deinem t3n Account an oder fülle die unteren Felder aus.

Bitte schalte deinen Adblocker für t3n.de aus!

Hey du! Schön, dass du hier bist. 😊

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team bestehend aus 65 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Danke für deine Unterstützung.

Digitales High Five,
Stephan Dörner (Chefredakteur t3n.de) & das gesamte t3n-Team

Anleitung zur Deaktivierung