Linear regression
X = RealDistribution('uniform', [-20, 60])
Y = RealDistribution('gaussian', 1.5)
f(x) = 3*x/20 + 5
xvals = [X.get_random_element() for _ in range(100)]
data = [(x, f(x) + Y.get_random_element()) for x in xvals]
m, b = var('m b')
g(x) = m*x + b
g(x) = g(x).subs(find_fit(data, g, solution_dict=True))
p = list_plot(data) + plot(g, (x, -20, 60), color='red')
p.save('linear_regression.svg')
Relevante Bilder
Relevante Artikel
Lineare EinfachregressionIn der Statistik ist die lineare Einfachregression, auch einfache lineare Regression, selten univariate lineare Regression genannt, ein regressionsanalytisches Verfahren und ein Spezialfall der linearen Regression. Die Bezeichnung einfach gibt an, dass bei der linearen Einfachregression nur eine unabhängige Variable verwendet wird, um die Zielgröße zu erklären. Ziel ist die Schätzung von Achsenabschnitt und Steigung der Regressionsgeraden sowie die Schätzung der Varianz der Störgrößen. .. weiterlesen
Maschinelles LernenMaschinelles Lernen (ML) entwickelt, untersucht und verwendet statistische Algorithmen, auch Lernalgorithmen genannt. Lernalgorithmen können Lösungen für Probleme lernen, die zu kompliziert sind, um sie mit Regeln zu beschreiben, zu denen es aber viele Daten gibt, die als Beispiele für die gewünschte Lösung dienen können. Ein Lernalgorithmus bildet vorgegebene Beispieldaten auf ein mathematisches Modell ab. Dabei passt der Lernalgorithmus das Modell so an, dass es von den Beispieldaten auf neue Fälle verallgemeinern kann. Dieser Vorgang wird Training genannt. Nach dem Training ist der gefundene Lösungsweg im Modell gespeichert. Er wird nicht explizit programmiert. Das trainierte Modell kann für neue Daten Vorhersagen treffen oder Empfehlungen und Entscheidungen erzeugen. In der mathematischen Statistik bezeichnet man dieses Fachgebiet auch als statistisches Lernen. .. weiterlesen
Überwachtes LernenÜberwachtes Lernen ist eine wichtige Kategorie des Maschinellen Lernens. Dabei wird ein Lernalgorithmus mit Datensätzen trainiert und validiert, die für jede Eingabe einen passenden Ausgabewert enthalten. Man bezeichnet solche Datensätze als markiert oder gelabelt. Ein Beispiel wäre ein Datensatz mit Bildern von Katzen und Hunden, dem jemand zu jedem Bild ein Label hinzugefügt hat, das die Information enthält, ob auf dem Bild eine Katze oder ein Hund abgebildet ist. Mit dem Datensatz wird dann ein Algorithmus trainiert, der mit Hilfe der Information der Label eine Funktion erzeugt, die idealerweise auch bei neuen Bildern korrekt erkennt, ob sie einen Hund oder eine Katze zeigen. Häufige Anwendungen für das überwachte Lernen sind Klassifikation und Regression. .. weiterlesen