- 1 1. Põhiline meetod keskmise arvutamiseks Pythonis
- 2 2. Keskmise arvutamine statistics mooduli abil
- 3 3. Kiire keskmise arvutamine numpy mooduli abil
- 4 4. Keskmise arvutamine tabelandmete puhul kasutades pandas
- 5 5. Erilised keskmise arvutamise meetodid (kaalutud, harmooniline keskmine, geomeetriline keskmine)
- 6 6. Veahaldus- ja täpsuse parandamise tehnikad
- 7 7. Kokkuvõte
1. Põhiline meetod keskmise arvutamiseks Pythonis
Kõige põhilisem viis andmete keskmise arvutamiseks Pythonis on kombineerida sum() funktsioon len() funktsiooniga. Kuna see kasutab Pythoni sisseehitatud standardfunktsioone, ei ole vaja täiendavaid teeke, mis teeb selle algajatele väga lihtsasti mõistetavaks.
Põhiline keskmise arvutamise meetod
Keskmine saadakse, jagades andmete summa andmepunktide arvuga. Näiteks kood, mis arvutab loendis salvestatud numbrite keskmise, näeb välja järgmiselt:
# Sample data
numbers = [10, 20, 30, 40, 50]
# Calculate the sum
total = sum(numbers)
# Calculate the average
average = total / len(numbers)
print(f"Data: {numbers}")
print(f"Average: {average}")
Koodi selgitus
Selles koodis kasutame kõigepealt sum(), et liita kõik väärtused loendis numbers, seejärel kasutame len(), et saada loendi elementide arv. Lõpuks jagame summa elementide arvuga, et saada keskmine. len() funktsioon tagastab loendi pikkuse, seega saab keskmiseelt arvutada sõltumata andmepunktide arvust.
Kuna see meetod kasutab ainult Pythoni põhilisi võimalusi, pakub see paindlikkuse ja kohanemisvõime eeliseid. See on ka optimaalne lähenemine väikeste andmekogumite korral.
2. Keskmise arvutamine statistics mooduli abil
Python sisaldab standardraamatukogu statistics moodulit, mis teeb keskmiste arvutamise lihtsamaks. statistics.mean() funktsioon võtab sisendiks iteratiivseid objekte, nagu loendid või tuplid, ja arvutab nende keskmise.
Kuidas arvutada keskmist kasutades statistics.mean()
import statistics
# Sample data
numbers = [10, 20, 30, 40, 50]
# Calculate the average
average = statistics.mean(numbers)
print(f"Data: {numbers}")
print(f"Average: {average}")
Koodi selgitus
See kood kasutab statistics mooduli mean() funktsiooni keskmise saamiseks. See funktsioon arvutab numbrite kogumi keskmise sõltumata andmetüübist või vormingust. Kuna see on standardraamatukogu osa, ei ole vaja installida ning seda saab kohe kasutada.
Kuna statistics.mean() kasutab sisemiselt sum() ja len(), on tulemus sama kui eespool mainitud meetodil, kuid kood muutub lühemaks ja vähendab vigade võimalust.

3. Kiire keskmise arvutamine numpy mooduli abil
Kui on tegemist suurte andmemahtudega või teostatakse sageli numbrilisi arvutusi, on sobiv Python’i numpy moodul. numpy on teek, mis võimaldab tõhusat numbriliste andmete manipuleerimist ja arvutamist, eriti silmapaistvalt suurt andmekogumitel.
Kuidas arvutada keskmist kasutades numpy.mean()
import numpy as np
# Sample data
numbers = np.array([10, 20, 30, 40, 50])
# Calculate the average
average = np.mean(numbers)
print(f"Data: {numbers}")
print(f"Average: {average}")
Koodi selgitus
Siin kasutame numpy.array, et teisendada loend numpy massiiviks ja arvutada keskmine np.mean() funktsiooniga. numpy massiivid, erinevalt listidest, võimaldavad otse numbrilisi operatsioone, mis kiirendab arvutamist eriti siis, kui andmete maht on suur.
Lisaks, kasutades numpy.average() funktsiooni, saab arvutada kaalutud keskmisi, toetades mitmesuguseid andmeanalüü Kui on vaja suuri andmekogumeid kiiresti töödelda või andmetele kaaluda rakendada, on numpy optimaalne valik.
4. Keskmise arvutamine tabelandmete puhul kasutades pandas
Python’i andmeanalüüsi teek pandas on suurepärane tabelandmete töötlemisel. Kasutades pandas.DataFrame objekti, saab hõlpsasti arvutada mitme veeru ulatuvate andmekogumite keskmise.
Kuidas arvutada keskmist kasutades DataFrame.mean()
import pandas as pd
# Create a sample DataFrame
data = {'A': [10, 20, 30, 40, 50],
'B': [15, 25, 35, 45, 55]}
df = pd.DataFrame(data)
# Compute the mean of each column
average = df.mean()
print(f"DataFrame:
{df}")
print(f"Mean of each column:
{average}")
Koodi selgitus
Selles näites loome kahe veeruga DataFrame’i df ja kasutame funktsiooni df.mean(), et arvutada iga veeru keskmine. DataFrame’id sobivad hästi tabelandmete töötlemiseks, võimaldades teha statistilisi arvutusi veeru kaupa. Näiteks, kui peate andmeid kategooriate kaupa kokku võtma, võite kasutada groupby meetodit, et koondada andmeid kindlate tingimuste alusel.
pandas on üks kõige laialdasemalt kasutatavaid teeke andmeanalüüsis ja suudab käsitleda keerukat andmetöötlust.
5. Erilised keskmise arvutamise meetodid (kaalutud, harmooniline keskmine, geomeetriline keskmine)
Lisaks tavapärasele aritmeetilisele keskmisele on olemas keskmistamise meetodid, mis on kohandatud konkreetsetele tingimustele. Allpool tutvustame eritehnikaid, nagu kaalutud keskmine, harmooniline keskmine ja geomeetriline keskmine.
Kuidas arvutada kaalutud keskmist
Kaalutud keskmist kasutatakse, kui soovite igale andmepunktile anda erineva tähtsuse (kaalud). Näiteks funktsioon numpy.average() suudab hõlpsasti arvutada kaalutud keskmise.
import numpy as np
# Sample data and weights
data = [10, 20, 30, 40, 50]
weights = [0.1, 0.2, 0.4, 0.2, 0.1]
# Calculate the weighted average
weighted_average = np.average(data, weights=weights)
print(f"Data: {data}")
print(f"Weights: {weights}")
print(f"Weighted average: {weighted_average}")
Kuidas arvutada harmoonilist keskmist
Harmooniline keskmine sobib suhete või kiiruste käsitlemiseks, näiteks kui arvutate keskmist kiirust, mis on sama vahemaa läbimine erinevate kiiruste juures. Funktsiooni statistics.harmonic_mean() kasutamine teeb arvutuse lihtsaks.
import statistics
# Sample data
data = [10, 20, 30]
# Calculate the harmonic mean
harmonic_mean = statistics.harmonic_mean(data)
print(f"Data: {data}")
print(f"Harmonic mean: {harmonic_mean}")
Kuidas arvutada geomeetrilist keskmist
Geomeetrilist keskmist kasutatakse kasvumäärade ja liitintressi arvutuste jaoks. Pythoni abil saate seda hõlpsasti arvutada math mooduliga ning seda saab tõhusalt arvutada ka numpy abil.
import numpy as np
# Sample data
data = [1.1, 1.3, 1.5]
# Calculate the geometric mean
geometric_mean = np.prod(data) ** (1 / len(data))
print(f"Data: {data}")
print(f"Geometric mean: {geometric_mean}")
6. Veahaldus- ja täpsuse parandamise tehnikad
Keskmise arvutamisel tuleb arvestada täpsuse parandamise ja vigade käsitlemisega. Eriti tuleb olla ettevaatlik ujukomaarvudega töötamisel. Python pakub tööriistu nende täpsusprobleemide lahend.
Ujukomaarvude täpsusprobleemid
Ujukomaarvudega arvutuste tegemisel võivad tulemused sisaldada vigu. Kui täpsus on kriitiline, on decimal.Decimal mooduli kasutamine tõhus.
from decimal import Decimal
# Sample data
data = [Decimal('0.1'), Decimal('0.2'), Decimal('0.3')]
# Calculate the average
average = sum(data) / len(data)
print(f"Data: {data}")
print(f"Average (improved precision): {average}")
Veahaldus põhialused
Näiteks tühja loendi keskmise arvutamise katse tekitab vea. Sellistel juhtudel on oluline lisada veahaldus, mis kontrollib, kas loend ei ole tühi.
# Sample data (including an empty list case)
data = []
# Error checking
if len(data) > 0:
average = sum(data) / len(data)
print(f"Average: {average}")
else:
print("Error: Data is empty")
7. Kokkuvõte
Selles artiklis selgitasime mitmesuguseid viise Pythonis keskmise arvutamiseks. sum() ja len() kasutati põhiliste arvutuste jaoks ning tutvustasime laia valikut täiustatud meetodeid, mis kasutavad ära statistics moodulit, numpy ja pandas. Valides optimaalse lähenemise andmetüübi ja eesmärgi põhjal, saate saavutada täpsema ja efektiivsema andmeanalüüsi.
Järgmise sammuna andmete visualiseerimise õppimine – näiteks arvutatud keskmiste graafiline kujutamine matplotlib abil – annab teile sügavama arusaama andmetest.




