7 Methoden, den Durchschnitt in Python zu berechnen – Von Grundlagen bis Anwendungen

1. Grundlegende Methode zum Berechnen des Durchschnitts in Python

Eine der grundlegendsten Methoden, um den Durchschnitt von Daten in Python zu berechnen, besteht darin, die Funktionen sum() und len() zu kombinieren. Da diese die standardmäßigen eingebauten Funktionen von Python verwenden, sind keine zusätzlichen Bibliotheken notwendig und die Methode ist für Einsteiger sehr leicht verständlich.

Grundlegende Methode zur Durchschnittsberechnung

Der Durchschnittswert wird erhalten, indem die Summe der Daten durch die Anzahl der Daten geteilt wird. Zum Beispiel sieht der Code zum Berechnen des Durchschnitts von Zahlen, die in einer Liste gespeichert sind, wie folgt aus.
# Beispieldaten
numbers = [10, 20, 30, 40, 50]

# Summe berechnen
total = sum(numbers)

# Durchschnittswert berechnen
average = total / len(numbers)

print(f"Daten: {numbers}")
print(f"Durchschnittswert: {average}")

Erklärung des Codes

In diesem Code wird zuerst sum() verwendet, um alle Werte der Liste numbers zu summieren, und dann len(), um die Anzahl der Elemente in der Liste zu erhalten. Schließlich wird der Durchschnittswert durch Division der Summe durch die Anzahl der Elemente erhalten. Die len()-Funktion gibt die Länge der Liste zurück, sodass der Durchschnittswert für beliebig viele Daten genau berechnet werden kann. Da diese Methode nur die grundlegenden Funktionen von Python verwendet, hat sie den Vorteil, flexibel anwendbar zu sein. Zudem ist sie für kleine Datensätze die optimale Methode.

2. Berechnung des Mittelwerts mit dem statistics-Modul

Python hat in seiner Standardbibliothek das statistics-Modul, mit dem der Mittelwert einfacher berechnet werden kann. Die statistics.mean()-Funktion nimmt iterierbare Objekte wie Listen oder Tupel entgegen und berechnet ihren Mittelwert.

Methode zur Mittelwertberechnung mit statistics.mean()

import statistics

# Beispieldaten
numbers = [10, 20, 30, 40, 50]

# Mittelwert berechnen
average = statistics.mean(numbers)

print(f"Daten: {numbers}")
print(f"Mittelwert: {average}")

Erklärung des Codes

Dieser Code berechnet den Mittelwert mit der mean()-Funktion aus dem statistics-Modul. Diese Funktion berechnet den Mittelwert für die übergebenen Zahlen unabhängig vom Datentyp oder Format. Da es Teil der Standardbibliothek ist, ist keine Installation erforderlich, und es kann sofort verwendet werden – das ist ein praktischer Vorteil. statistics.mean() verwendet intern sum() und len(), daher ist das Ergebnis dasselbe wie bei der zuvor beschriebenen Methode, aber der Code ist knapper und reduziert das Risiko von Fehlern.
侍エンジニア塾

3. Schnelle Berechnung des Mittelwerts mit dem numpy-Modul

Bei der Verarbeitung großer Datenmengen oder in Szenarien, in denen numerische Berechnungen häufig verwendet werden, ist das Python-numpy-Modul geeignet.numpy ist eine Bibliothek, die eine effiziente Manipulation und Berechnung numerischer Daten ermöglicht und insbesondere bei der Verarbeitung großer Datenmengen stark ist.

Methode zur Berechnung des Mittelwerts mit numpy.mean()

import numpy as np

# Beispieldaten
numbers = np.array([10, 20, 30, 40, 50])

# Berechnung des Mittelwerts
average = np.mean(numbers)

print(f"Daten: {numbers}")
print(f"Mittelwert: {average}")

Erläuterung des Codes

Hier verwenden wir numpy.array, um die Liste in ein numpy-Array umzuwandeln, und berechnen den Mittelwert mit der np.mean()-Funktion.numpy-Arrays ermöglichen im Gegensatz zu Listen direkte numerische Operationen, und die Berechnungen werden insbesondere bei großen Datensätzen beschleunigt. Darüber hinaus kann mit der numpy.average()-Funktion auch der gewichtete Mittelwert berechnet werden, was für verschiedene Datenanalysen geeignet ist. Wenn Sie große Datenmengen schnell verarbeiten oder eine Gewichtung der Daten benötigen, ist numpy die optimale Wahl.

4. Berechnung des Durchschnitts für tabellarische Daten mit pandas

Die Python-Datenanalyse-Bibliothekpandas zeichnet sich besonders durch die Verarbeitung tabellarischer Daten aus.pandas.DataFrameObjekt ermöglicht es, den Durchschnitt eines Datensatzes, der mehrere Spalten umfasst, einfach zu berechnen.

So berechnen Sie den Durchschnitt mit DataFrame.mean()

import pandas as pd

# Erstellen eines Beispieldatensatzes
data = {'A': [10, 20, 30, 40, 50],
        'B': [15, 25, 35, 45, 55]}
df = pd.DataFrame(data)

# Berechnung des Durchschnitts für jede Spalte
average = df.mean()

print(f"Datensatz:
{df}")
print(f"Durchschnitt pro Spalte:
{average}")

Erklärung des Codes

In diesem Beispiel erstellen wir einen DataFramedf mit zwei Spalten und berechnen den Durchschnitt jeder Spalte mit der Funktiondf.mean(). DataFrames eignen sich hervorragend für die Verarbeitung tabellarischer Daten und ermöglichen statistische Berechnungen pro Spalte. Zum Beispiel, wenn eine Aggregation nach Kategorien erforderlich ist, kann diegroupby-Methode verwendet werden, um nach bestimmten Bedingungen zu aggregieren.pandas ist eine der am weitesten verbreiteten Bibliotheken für die Datenanalyse und kann auch komplexe Datenverarbeitungen bewältigen.
RUNTEQ(ランテック)|超実戦型エンジニア育成スクール

5. Spezielle Methoden zur Berechnung von Durchschnitten (gewichteter Durchschnitt, harmonischer Mittelwert, geometrischer Mittelwert)

Bei der Berechnung von Durchschnitten gibt es neben dem üblichen arithmetischen Mittel auch Methoden, die für bestimmte Bedingungen geeignet sind. Im Folgenden stellen wir Berechnungsmethoden für spezielle Durchschnitte wie den gewichteten Durchschnitt, den harmonischen Mittelwert und den geometrischen Mittelwert vor.

Berechnungsmethode für den gewichteten Durchschnitt

Der gewichtete Durchschnitt wird verwendet, wenn jedem Datensatz eine unterschiedliche Wichtigkeit (Gewicht) zugewiesen werden soll. Zum Beispiel kann mit der Funktion numpy.average() der gewichtete Durchschnitt einfach berechnet werden.
import numpy as np

# Beispieldaten und Gewichte
data = [10, 20, 30, 40, 50]
weights = [0.1, 0.2, 0.4, 0.2, 0.1]

# Berechne gewichteten Durchschnitt
weighted_average = np.average(data, weights=weights)

print(f\"Daten: {data}\")
print(f\"Gewichte: {weights}\")
print(f\"Gewichteter Durchschnitt: {weighted_average}\")

Berechnungsmethode für den harmonischen Mittelwert

Der harmonische Mittelwert eignet sich für das Handling von Verhältnissen oder Geschwindigkeiten, zum Beispiel um die Durchschnittsgeschwindigkeit zu berechnen, wenn dieselbe Distanz mit unterschiedlichen Geschwindigkeiten zurückgelegt wird.statistics.harmonic_mean() Mit der Funktion kann der harmonische Mittelwert einfach berechnet werden.
import statistics

# Beispieldaten
data = [10, 20, 30]

# Berechne harmonischen Mittelwert
harmonic_mean = statistics.harmonic_mean(data)

print(f\"Daten: {data}\")
print(f\"Harmonischer Mittelwert: {harmonic_mean}\")

Berechnungsmethode für den geometrischen Mittelwert

Der geometrische Mittelwert wird für Wachstumsraten oder Zinseszinsberechnungen verwendet. In Python kann er einfach mit dem math-Modul berechnet werden, und mit numpy noch effizienter.
import numpy as np

# Beispieldaten
data = [1.1, 1.3, 1.5]

# Berechne geometrischen Mittelwert
geometric_mean = np.prod(data) ** (1 / len(data))

print(f\"Daten: {data}\")
print(f\"Geometrischer Mittelwert: {geometric_mean}\")

6. Fehlerbehandlung und Maßnahmen zur Verbesserung der Genauigkeit

Beim Berechnen des Durchschnitts müssen Sie die Verbesserung der Genauigkeit und die Fehlerbehandlung berücksichtigen. Insbesondere bei Berechnungen mit Gleitkommazahlen ist Vorsicht geboten. Python bietet Tools, um diese Genauigkeitsprobleme zu verbessern.

Genauigkeitsprobleme bei Gleitkommazahlen

Bei Berechnungen mit Gleitkommazahlen kann das Ergebnis Fehler enthalten. In Fällen, in denen Genauigkeit wichtig ist, ist die Verwendung des Moduls decimal.Decimal effektiv.
from decimal import Decimal

# Beispieldaten
data = [Decimal('0.1'), Decimal('0.2'), Decimal('0.3')]

# Durchschnitt berechnen
average = sum(data) / len(data)

print(f"Daten: {data}")
print(f"Durchschnitt (nach Genauigkeitsverbesserung): {average}")

Grundlagen der Fehlerbehandlung

Zum Beispiel tritt ein Fehler auf, wenn Sie versuchen, den Durchschnitt einer leeren Liste zu berechnen. Für solche Fälle ist eine Fehlerbehandlung wichtig, die überprüft, ob die Liste nicht leer ist.
# Beispieldaten (einschließlich leerer Liste)
data = []

# Fehlerprüfung
if len(data) > 0:
    average = sum(data) / len(data)
    print(f"Durchschnitt: {average}")
else:
    print("Fehler: Die Daten sind leer")

7. Zusammenfassung

In diesem Artikel haben wir verschiedene Methoden zur Berechnung des Durchschnitts in Python erläutert.sum() und len() für grundlegende Berechnungen bis hin zu fortgeschrittenen Methoden unter Verwendung des statistics-Moduls, numpy und pandas – wir haben eine breite Palette vorgestellt. Durch die Auswahl der optimalen Methode je nach Datentyp und Verwendungszweck wird eine genauere und effizientere Datenanalyse möglich. Als nächsten Schritt wird das Lernen von Methoden zur Visualisierung von Daten, wie z. B. das Erstellen von Diagrammen der Berechnungsergebnisse des Durchschnitts mit matplotlib, zu einem tieferen Verständnis der Daten führen.
RUNTEQ(ランテック)|超実戦型エンジニア育成スクール