Valda NumPy np.array: Alused kuni edasijõudnud andmeanalüüs

1. Sissejuhatus

Python on väga populaarne programmeerimiskeel andmeanalüüsi, masinõppe ja teadusliku arvutamise jaoks. numpy (NumPy) teekond on võimas tööriist numbriliste arvutuste sujuvamaks muutmiseks. See artikkel pakub üksikasjalikku selgitust Python’i “np.array” kohta, alates põhitõdedest kuni praktiliste rakendusteni, ning tutvustab konkreetseid tehnikaid, mis on kasulikud numbriliste andmete töötlemiseks ja analüüsimiseks.

Ametlik lehekülg

2. Mis on numpy?

numpy on numbrilise arvutamise teek, mis pakub mitmemõõtmelisi massiive (ndarray), maatriksioperatsioone ja statistilise analüüsi funktsioone, olles andmeanalüüsi alus. Koostöös teiste Python’i teekidega muudab see keeruka andmetöötluse lihtsaks ja kiireks.

Kuidas paigaldada numpy

numpy paigaldamine on lihtne. Lihtsalt käivita allolev käsk.

pip install numpy

Miks valida numpy

numpy kiire ja tõhus andmetöötlusvõimekus on asendamatu teadusliku arvutamise ja andmeteaduse jaoks. Lisateabe saamiseks numpy kohta vaata ametlikku dokumentatsiooni.

Why NumPy? Powerful n-dimensional arrays. Numerical computin…

年収訴求

3. np.array põhitõed

Python’i np.array on numpy põhistruktuur ja sisaldab funktsioone numbriliste andmete tõhusaks käsitlemiseks. Näiteks, siin on, kuidas luua ühe‑mõõtmeline massiiv.

import numpy as np
array_1d = np.array([1, 2, 3, 4, 5])
print(array_1d)

Nipp: np.array andmetüübi määramine võib samuti parandada mäluefektiivsust. Kasuta dtype argumenti, et määrata täisarvu tüübid (näiteks int32) või ujukomaarvude tüübid.

4. Mitmemõõtmeliste massiivide loomine

np.array toetab ka mitmemõõtmelisi massiive. Näiteks, järgmine kood loob kahemõõtmelise massiivi.

array_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(array_2d)

FAQ Q: Kuidas ma loon massiive, millel on kolm või enam dimensiooni? A: Saad need luua, andes np.array-le veelgi sisemisi loendeid.

侍エンジニア塾

5. Massiivi operatsioonid

np.array võimaldab elemente kätte saada ja osalisi operatsioone teha indekseerimise ja lõikamise abil. Allpool on lihtne näide indekseerimisest.

array_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(array_2d[1, 2])  # Output: 6

Lõikamise abil saad hõlpsasti välja võtta kindlad read või veerud.

6. Massiivide ümberkujundamine

Andmeanalüüsis on sageli vaja muuta massiivide kuju; reshape meetodi kasutamine võimaldab seda tõhusalt teha.

array_1d = np.array([1, 2, 3, 4, 5, 6])
array_2d = array_1d.reshape(2, 3)
print(array_2d)

Nipp: Saad ümberkujundamiseks kasutada ka resize meetodit, kuid ole ettevaatlik, sest see muudab algset massiivi otse.

7. Massiivi operatsioonid

numpy aritmeetiliste võimaluste kasutamine teeb massiivide vahelised operatsioonid lihtsaks. Allolev näide teostab kahe massiivi elementaarse liitmise.

array1 = np.array([1, 2, 3])
array2 = np.array([4, 5, 6])
print(array1 + array2)  # Output: [5 7 9]

KKK Q: Kas ma saan teostada operatsioone, kui massiividel on erinevad kujundid? A: Kasutades numpy‘s levitamise (broadcasting) funktsiooni, saad õigesti teostada operatsioone massiividega, millel on erinevad kujundid.

8. Statistiliste funktsioonide kasutamine

Andmeanalüüsis on oluline kontrollida statistilisi näitajaid, nagu massiivi keskmine, maksimaalne ja minimaalne väärtus ning dispersioon. Näiteks allpool on, kuidas arvutada massiivi keskmist.

array = np.array([1, 2, 3, 4, 5])
print(array.mean())  # Output: 3.0

9. Praktiline näide: rakendamine andmeanalüüsis

Siin, kasutades väljamõeldud müügiandmeid, analüüsime müügitõusu määra ja uurime igakuiseid müügitrende.

import numpy as np
import matplotlib.pyplot as plt

sales_data = np.array([120, 150, 170, 200, 220, 180, 190, 210, 230, 250, 240, 260])

# Monthly sales growth rate
growth_rate = (sales_data[1:] - sales_data[:-1]) / sales_data[:-1] * 100
print("Monthly growth rate:", growth_rate)

# Plotting the sales data
plt.plot(range(1, 13), sales_data, marker='o')
plt.title("Monthly Sales Trend")
plt.xlabel("Month")
plt.ylabel("Sales (thousands)")
plt.grid(True)
plt.show()

Vihje: Andmete visualiseerimine muudab intuitiivse kasvutippude ja trendide tuvastamise lihtsamaks, mis on kasulik ärianalüüsiks.

10. Kokkuvõte

See artikkel selgitas np.array kasutamise põhitõdesid Pythonis ja selle rakendusi andmeanalüüsis. Peamised punktid on järgmised.

  1. Põhiline kasutamine: np.array loomine ja andmetüüpide määramine.
  2. Mitmemõõtmelised massiivid: Kahe- ja kolmemõõtmeliste massiivide loomine ja manipuleerimine.
  3. Kujunduse muutmine: reshape ja flatten kasutamise meetodid.
  4. Operatsioonid ja statistika: Elemendi tasemel toimuvad operatsioonid ja statistiliste mõõdikute arvutamine.
  5. Praktilised näited: Kasvu määrade arvutamine ja müügiandmete visualiseerimine.

Need kontseptsioonid moodustavad aluse andmeanalüüsi ja masinõppe projektidele, seega kasuta neid kindlasti. Kui soovid oma arusaamist süvendada, tutvu ka ametliku numpy dokumentatsiooniga ning teiste seotud teemadega.

年収訴求