NumPy np.array meistern: Grundlagen bis fortgeschrittene Datenanalyse

1. Einführung

Python ist eine sehr beliebte Programmiersprache für Datenanalyse, maschinelles Lernen und wissenschaftliches Rechnen. Unter ihnen ist die numpy (NumPy) Bibliothek ein leistungsfähiges Werkzeug zur Vereinfachung numerischer Berechnungen. Dieser Artikel bietet eine detaillierte Erklärung von Python’s „np.array„, von den Grundlagen bis zu praktischen Anwendungen, und stellt konkrete Techniken vor, die nützlich sind für die Verarbeitung und Analyse numerischer Daten.

Offizielle Seite

2. Was ist numpy?

numpy ist eine Bibliothek für numerisches Rechnen, die mehrdimensionale Arrays (ndarray), Matrixoperationen und statistische Analysefunktionen bietet und als Grundlage für Datenanalyse dient. In Kombination mit anderen Python-Bibliotheken macht sie komplexe Datenverarbeitung einfach und schnell.

Installation von numpy

Die Installation von numpy ist einfach. Führen Sie einfach den folgenden Befehl aus.

pip install numpy

Warum numpy wählen

Die schnellen und effizienten Datenverarbeitungsfähigkeiten von numpy sind für wissenschaftliches Rechnen und Data Science unverzichtbar. Weitere Details zu numpy finden Sie in der offiziellen Dokumentation.

Why NumPy? Powerful n-dimensional arrays. Numerical computin…

3. Grundlagen von np.array

Das np.array von Python ist die Kern‑Datenstruktur von numpy und bietet Funktionalität zum effizienten Umgang mit numerischen Daten. Zum Beispiel, so erstellen Sie ein eindimensionales Array.

import numpy as np
array_1d = np.array([1, 2, 3, 4, 5])
print(array_1d)

Tip: Das Angeben des Datentyps von np.array kann auch die Speichereffizienz verbessern. Verwenden Sie das Argument dtype, um Ganzzahltypen (wie int32) oder Gleitkommatypen anzugeben.

4. Erstellen mehrdimensionaler Arrays

np.array unterstützt auch mehrdimensionale Arrays. Zum Beispiel erstellt der folgende Code ein zweidimensionales Array.

array_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(array_2d)

FAQ Q: Wie erstelle ich Arrays mit drei oder mehr Dimensionen? A: Sie können sie erstellen, indem Sie eine weiter verschachtelte Liste an np.array übergeben.

年収訴求

5. Array-Operationen

np.array ermöglicht das Abrufen von Elementen und das Durchführen partieller Operationen mittels Indexierung und Slicing. Unten ist ein einfaches Beispiel für Indexierung.

array_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(array_2d[1, 2])  # Output: 6

Mit Slicing können Sie leicht bestimmte Zeilen oder Spalten extrahieren.

6. Umformen von Arrays

In der Datenanalyse muss man häufig die Form von Arrays ändern; die Methode reshape ermöglicht ein effizientes Umformen.

array_1d = np.array([1, 2, 3, 4, 5, 6])
array_2d = array_1d.reshape(2, 3)
print(array_2d)

Tip: Sie können auch die Methode resize zum Umformen verwenden, aber seien Sie vorsichtig, da sie das ursprüngliche Array direkt verändert.

7. Array-Operationen

Die arithmetischen Fähigkeiten von numpy machen Operationen zwischen Arrays einfach. Das folgende Beispiel führt eine elementweise Addition von zwei Arrays durch.

array1 = np.array([1, 2, 3])
array2 = np.array([4, 5, 6])
print(array1 + array2)  # Output: [5 7 9]

FAQ Q: Kann ich Operationen durchführen, wenn die Arrays unterschiedliche Formen haben? A: Durch die Verwendung von numpys Broadcasting‑Funktion können Sie korrekt Operationen auf Arrays mit unterschiedlichen Formen ausführen.

8. Verwendung statistischer Funktionen

In der Datenanalyse ist das Prüfen statistischer Kennzahlen wie Mittelwert, Maximal‑ und Minimalwert sowie Varianz eines Arrays wichtig. Zum Beispiel, unten wird gezeigt, wie man den Mittelwert eines Arrays berechnet.

array = np.array([1, 2, 3, 4, 5])
print(array.mean())  # Output: 3.0

9. Praktisches Beispiel: Anwendung in der Datenanalyse

Hier analysieren wir anhand fiktiver Verkaufsdaten die Wachstumsraten und untersuchen monatliche Verkaufstrends.

import numpy as np
import matplotlib.pyplot as plt

sales_data = np.array([120, 150, 170, 200, 220, 180, 190, 210, 230, 250, 240, 260])

# Monthly sales growth rate
growth_rate = (sales_data[1:] - sales_data[:-1]) / sales_data[:-1] * 100
print("Monthly growth rate:", growth_rate)

# Plotting the sales data
plt.plot(range(1, 13), sales_data, marker='o')
plt.title("Monthly Sales Trend")
plt.xlabel("Month")
plt.ylabel("Sales (thousands)")
plt.grid(True)
plt.show()

Tipp: Die Visualisierung der Daten erleichtert es, Wachstumsspitzen und Trends intuitiv zu erkennen, was für die Geschäfts­analyse hilfreich ist.

10. Zusammenfassung

Dieser Artikel erklärte die Grundlagen der Verwendung von np.array in Python und deren Anwendung in der Datenanalyse. Die wichtigsten Punkte sind wie folgt.

  1. Grundlegende Verwendung: Erstellen von np.array und Festlegen von Datentypen.
  2. Mehrdimensionale Arrays: Erstellen und Manipulieren von zweidimensionalen und dreidimensionalen Arrays.
  3. Umformen: Methoden zum Umformen mit reshape und flatten.
  4. Operationen und Statistiken: Elementweise Operationen und Berechnung statistischer Kennzahlen.
  5. Praktische Beispiele: Berechnung von Wachstumsraten und Visualisierung von Verkaufsdaten.

Diese Konzepte bilden die Grundlage für Datenanalyse‑ und Machine‑Learning‑Projekte, nutzen Sie sie also unbedingt. Wenn Sie Ihr Verständnis vertiefen möchten, konsultieren Sie auch die offizielle numpy‑Dokumentation und weitere verwandte Themen.