1. Einführung
Python ist eine sehr beliebte Programmiersprache für Datenanalyse, maschinelles Lernen und wissenschaftliches Rechnen. Unter ihnen ist die numpy (NumPy) Bibliothek ein leistungsfähiges Werkzeug zur Vereinfachung numerischer Berechnungen. Dieser Artikel bietet eine detaillierte Erklärung von Python’s „np.array„, von den Grundlagen bis zu praktischen Anwendungen, und stellt konkrete Techniken vor, die nützlich sind für die Verarbeitung und Analyse numerischer Daten.
Offizielle Seite
2. Was ist numpy?
numpy ist eine Bibliothek für numerisches Rechnen, die mehrdimensionale Arrays (ndarray), Matrixoperationen und statistische Analysefunktionen bietet und als Grundlage für Datenanalyse dient. In Kombination mit anderen Python-Bibliotheken macht sie komplexe Datenverarbeitung einfach und schnell.
Installation von numpy
Die Installation von numpy ist einfach. Führen Sie einfach den folgenden Befehl aus.
pip install numpy
Warum numpy wählen
Die schnellen und effizienten Datenverarbeitungsfähigkeiten von numpy sind für wissenschaftliches Rechnen und Data Science unverzichtbar. Weitere Details zu numpy finden Sie in der offiziellen Dokumentation.
Why NumPy? Powerful n-dimensional arrays. Numerical computin…
3. Grundlagen von np.array
Das np.array von Python ist die Kern‑Datenstruktur von numpy und bietet Funktionalität zum effizienten Umgang mit numerischen Daten. Zum Beispiel, so erstellen Sie ein eindimensionales Array.
import numpy as np
array_1d = np.array([1, 2, 3, 4, 5])
print(array_1d)
Tip: Das Angeben des Datentyps von
np.arraykann auch die Speichereffizienz verbessern. Verwenden Sie das Argumentdtype, um Ganzzahltypen (wieint32) oder Gleitkommatypen anzugeben.

4. Erstellen mehrdimensionaler Arrays
np.array unterstützt auch mehrdimensionale Arrays. Zum Beispiel erstellt der folgende Code ein zweidimensionales Array.
array_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(array_2d)
FAQ Q: Wie erstelle ich Arrays mit drei oder mehr Dimensionen? A: Sie können sie erstellen, indem Sie eine weiter verschachtelte Liste an
np.arrayübergeben.
5. Array-Operationen
np.array ermöglicht das Abrufen von Elementen und das Durchführen partieller Operationen mittels Indexierung und Slicing. Unten ist ein einfaches Beispiel für Indexierung.
array_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(array_2d[1, 2])  # Output: 6
Mit Slicing können Sie leicht bestimmte Zeilen oder Spalten extrahieren.
6. Umformen von Arrays
In der Datenanalyse muss man häufig die Form von Arrays ändern; die Methode reshape ermöglicht ein effizientes Umformen.
array_1d = np.array([1, 2, 3, 4, 5, 6])
array_2d = array_1d.reshape(2, 3)
print(array_2d)
Tip: Sie können auch die Methode
resizezum Umformen verwenden, aber seien Sie vorsichtig, da sie das ursprüngliche Array direkt verändert.
7. Array-Operationen
Die arithmetischen Fähigkeiten von numpy machen Operationen zwischen Arrays einfach. Das folgende Beispiel führt eine elementweise Addition von zwei Arrays durch.
array1 = np.array([1, 2, 3])
array2 = np.array([4, 5, 6])
print(array1 + array2)  # Output: [5 7 9]
FAQ Q: Kann ich Operationen durchführen, wenn die Arrays unterschiedliche Formen haben? A: Durch die Verwendung von
numpys Broadcasting‑Funktion können Sie korrekt Operationen auf Arrays mit unterschiedlichen Formen ausführen.
8. Verwendung statistischer Funktionen
In der Datenanalyse ist das Prüfen statistischer Kennzahlen wie Mittelwert, Maximal‑ und Minimalwert sowie Varianz eines Arrays wichtig. Zum Beispiel, unten wird gezeigt, wie man den Mittelwert eines Arrays berechnet.
array = np.array([1, 2, 3, 4, 5])
print(array.mean())  # Output: 3.0
9. Praktisches Beispiel: Anwendung in der Datenanalyse
Hier analysieren wir anhand fiktiver Verkaufsdaten die Wachstumsraten und untersuchen monatliche Verkaufstrends.
import numpy as np
import matplotlib.pyplot as plt
sales_data = np.array([120, 150, 170, 200, 220, 180, 190, 210, 230, 250, 240, 260])
# Monthly sales growth rate
growth_rate = (sales_data[1:] - sales_data[:-1]) / sales_data[:-1] * 100
print("Monthly growth rate:", growth_rate)
# Plotting the sales data
plt.plot(range(1, 13), sales_data, marker='o')
plt.title("Monthly Sales Trend")
plt.xlabel("Month")
plt.ylabel("Sales (thousands)")
plt.grid(True)
plt.show()
Tipp: Die Visualisierung der Daten erleichtert es, Wachstumsspitzen und Trends intuitiv zu erkennen, was für die Geschäftsanalyse hilfreich ist.
10. Zusammenfassung
Dieser Artikel erklärte die Grundlagen der Verwendung von np.array in Python und deren Anwendung in der Datenanalyse. Die wichtigsten Punkte sind wie folgt.
- Grundlegende Verwendung: Erstellen von np.arrayund Festlegen von Datentypen.
- Mehrdimensionale Arrays: Erstellen und Manipulieren von zweidimensionalen und dreidimensionalen Arrays.
- Umformen: Methoden zum Umformen mit reshapeundflatten.
- Operationen und Statistiken: Elementweise Operationen und Berechnung statistischer Kennzahlen.
- Praktische Beispiele: Berechnung von Wachstumsraten und Visualisierung von Verkaufsdaten.
Diese Konzepte bilden die Grundlage für Datenanalyse‑ und Machine‑Learning‑Projekte, nutzen Sie sie also unbedingt. Wenn Sie Ihr Verständnis vertiefen möchten, konsultieren Sie auch die offizielle numpy‑Dokumentation und weitere verwandte Themen.

 
 




