7 viisi keskmiste arvutamiseks Pythonis: alates põhialgsest kuni edasijõudnuteni

1 1. Põhiline meetod keskmise arvutamiseks Pythonis
- 1.1 Põhiline keskmise arvutamise meetod
- 1.2 Koodi selgitus
2 2. Keskmise arvutamine statistics mooduli abil
- 2.1 Kuidas arvutada keskmist kasutades statistics.mean()
- 2.2 Koodi selgitus
3 3. Kiire keskmise arvutamine numpy mooduli abil
- 3.1 Kuidas arvutada keskmist kasutades numpy.mean()
- 3.2 Koodi selgitus
4 4. Keskmise arvutamine tabelandmete puhul kasutades pandas
- 4.1 Kuidas arvutada keskmist kasutades DataFrame.mean()
- 4.2 Koodi selgitus
5 5. Erilised keskmise arvutamise meetodid (kaalutud, harmooniline keskmine, geomeetriline keskmine)
6 6. Veahaldus- ja täpsuse parandamise tehnikad
- 6.1 Ujukomaarvude täpsusprobleemid
- 6.2 Veahaldus põhialused
7 7. Kokkuvõte

1. Põhiline meetod keskmise arvutamiseks Pythonis

Kõige põhilisem viis andmete keskmise arvutamiseks Pythonis on kombineerida sum() funktsioon len() funktsiooniga. Kuna see kasutab Pythoni sisseehitatud standardfunktsioone, ei ole vaja täiendavaid teeke, mis teeb selle algajatele väga lihtsasti mõistetavaks.

Põhiline keskmise arvutamise meetod

Keskmine saadakse, jagades andmete summa andmepunktide arvuga. Näiteks kood, mis arvutab loendis salvestatud numbrite keskmise, näeb välja järgmiselt:

# Sample data
numbers = [10, 20, 30, 40, 50]

# Calculate the sum
total = sum(numbers)

# Calculate the average
average = total / len(numbers)

print(f"Data: {numbers}")
print(f"Average: {average}")

Koodi selgitus

Selles koodis kasutame kõigepealt sum(), et liita kõik väärtused loendis numbers, seejärel kasutame len(), et saada loendi elementide arv. Lõpuks jagame summa elementide arvuga, et saada keskmine. len() funktsioon tagastab loendi pikkuse, seega saab keskmiseelt arvutada sõltumata andmepunktide arvust.

Kuna see meetod kasutab ainult Pythoni põhilisi võimalusi, pakub see paindlikkuse ja kohanemisvõime eeliseid. See on ka optimaalne lähenemine väikeste andmekogumite korral.

2. Keskmise arvutamine statistics mooduli abil

Python sisaldab standardraamatukogu statistics moodulit, mis teeb keskmiste arvutamise lihtsamaks. statistics.mean() funktsioon võtab sisendiks iteratiivseid objekte, nagu loendid või tuplid, ja arvutab nende keskmise.

Kuidas arvutada keskmist kasutades statistics.mean()

import statistics

# Sample data
numbers = [10, 20, 30, 40, 50]

# Calculate the average
average = statistics.mean(numbers)

print(f"Data: {numbers}")
print(f"Average: {average}")

Koodi selgitus

See kood kasutab statistics mooduli mean() funktsiooni keskmise saamiseks. See funktsioon arvutab numbrite kogumi keskmise sõltumata andmetüübist või vormingust. Kuna see on standardraamatukogu osa, ei ole vaja installida ning seda saab kohe kasutada.

Kuna statistics.mean() kasutab sisemiselt sum() ja len(), on tulemus sama kui eespool mainitud meetodil, kuid kood muutub lühemaks ja vähendab vigade võimalust.

3. Kiire keskmise arvutamine numpy mooduli abil

Kui on tegemist suurte andmemahtudega või teostatakse sageli numbrilisi arvutusi, on sobiv Python’i numpy moodul. numpy on teek, mis võimaldab tõhusat numbriliste andmete manipuleerimist ja arvutamist, eriti silmapaistvalt suurt andmekogumitel.

Kuidas arvutada keskmist kasutades numpy.mean()

import numpy as np

# Sample data
numbers = np.array([10, 20, 30, 40, 50])

# Calculate the average
average = np.mean(numbers)

print(f"Data: {numbers}")
print(f"Average: {average}")

Koodi selgitus

Siin kasutame numpy.array, et teisendada loend numpy massiiviks ja arvutada keskmine np.mean() funktsiooniga. numpy massiivid, erinevalt listidest, võimaldavad otse numbrilisi operatsioone, mis kiirendab arvutamist eriti siis, kui andmete maht on suur.

Lisaks, kasutades numpy.average() funktsiooni, saab arvutada kaalutud keskmisi, toetades mitmesuguseid andmeanalüü Kui on vaja suuri andmekogumeid kiiresti töödelda või andmetele kaaluda rakendada, on numpy optimaalne valik.

4. Keskmise arvutamine tabelandmete puhul kasutades pandas

Python’i andmeanalüüsi teek pandas on suurepärane tabelandmete töötlemisel. Kasutades pandas.DataFrame objekti, saab hõlpsasti arvutada mitme veeru ulatuvate andmekogumite keskmise.

Kuidas arvutada keskmist kasutades DataFrame.mean()

import pandas as pd

# Create a sample DataFrame
data = {'A': [10, 20, 30, 40, 50],
        'B': [15, 25, 35, 45, 55]}
df = pd.DataFrame(data)

# Compute the mean of each column
average = df.mean()

print(f"DataFrame:
{df}")
print(f"Mean of each column:
{average}")

Koodi selgitus

Selles näites loome kahe veeruga DataFrame’i df ja kasutame funktsiooni df.mean(), et arvutada iga veeru keskmine. DataFrame’id sobivad hästi tabelandmete töötlemiseks, võimaldades teha statistilisi arvutusi veeru kaupa. Näiteks, kui peate andmeid kategooriate kaupa kokku võtma, võite kasutada groupby meetodit, et koondada andmeid kindlate tingimuste alusel.
pandas on üks kõige laialdasemalt kasutatavaid teeke andmeanalüüsis ja suudab käsitleda keerukat andmetöötlust.

5. Erilised keskmise arvutamise meetodid (kaalutud, harmooniline keskmine, geomeetriline keskmine)

Lisaks tavapärasele aritmeetilisele keskmisele on olemas keskmistamise meetodid, mis on kohandatud konkreetsetele tingimustele. Allpool tutvustame eritehnikaid, nagu kaalutud keskmine, harmooniline keskmine ja geomeetriline keskmine.

Kuidas arvutada kaalutud keskmist

Kaalutud keskmist kasutatakse, kui soovite igale andmepunktile anda erineva tähtsuse (kaalud). Näiteks funktsioon numpy.average() suudab hõlpsasti arvutada kaalutud keskmise.

import numpy as np

# Sample data and weights
data = [10, 20, 30, 40, 50]
weights = [0.1, 0.2, 0.4, 0.2, 0.1]

# Calculate the weighted average
weighted_average = np.average(data, weights=weights)

print(f"Data: {data}")
print(f"Weights: {weights}")
print(f"Weighted average: {weighted_average}")

Kuidas arvutada harmoonilist keskmist

Harmooniline keskmine sobib suhete või kiiruste käsitlemiseks, näiteks kui arvutate keskmist kiirust, mis on sama vahemaa läbimine erinevate kiiruste juures. Funktsiooni statistics.harmonic_mean() kasutamine teeb arvutuse lihtsaks.

import statistics

# Sample data
data = [10, 20, 30]

# Calculate the harmonic mean
harmonic_mean = statistics.harmonic_mean(data)

print(f"Data: {data}")
print(f"Harmonic mean: {harmonic_mean}")

Kuidas arvutada geomeetrilist keskmist

Geomeetrilist keskmist kasutatakse kasvumäärade ja liitintressi arvutuste jaoks. Pythoni abil saate seda hõlpsasti arvutada math mooduliga ning seda saab tõhusalt arvutada ka numpy abil.

import numpy as np

# Sample data
data = [1.1, 1.3, 1.5]

# Calculate the geometric mean
geometric_mean = np.prod(data) ** (1 / len(data))

print(f"Data: {data}")
print(f"Geometric mean: {geometric_mean}")

6. Veahaldus- ja täpsuse parandamise tehnikad

Keskmise arvutamisel tuleb arvestada täpsuse parandamise ja vigade käsitlemisega. Eriti tuleb olla ettevaatlik ujukomaarvudega töötamisel. Python pakub tööriistu nende täpsusprobleemide lahend.

Ujukomaarvude täpsusprobleemid

Ujukomaarvudega arvutuste tegemisel võivad tulemused sisaldada vigu. Kui täpsus on kriitiline, on decimal.Decimal mooduli kasutamine tõhus.

from decimal import Decimal

# Sample data
data = [Decimal('0.1'), Decimal('0.2'), Decimal('0.3')]

# Calculate the average
average = sum(data) / len(data)

print(f"Data: {data}")
print(f"Average (improved precision): {average}")

Veahaldus põhialused

Näiteks tühja loendi keskmise arvutamise katse tekitab vea. Sellistel juhtudel on oluline lisada veahaldus, mis kontrollib, kas loend ei ole tühi.

# Sample data (including an empty list case)
data = []

# Error checking
if len(data) > 0:
    average = sum(data) / len(data)
    print(f"Average: {average}")
else:
    print("Error: Data is empty")

7. Kokkuvõte

Selles artiklis selgitasime mitmesuguseid viise Pythonis keskmise arvutamiseks. sum() ja len() kasutati põhiliste arvutuste jaoks ning tutvustasime laia valikut täiustatud meetodeid, mis kasutavad ära statistics moodulit, numpy ja pandas. Valides optimaalse lähenemise andmetüübi ja eesmärgi põhjal, saate saavutada täpsema ja efektiivsema andmeanalüüsi.

Järgmise sammuna andmete visualiseerimise õppimine – näiteks arvutatud keskmiste graafiline kujutamine matplotlib abil – annab teile sügavama arusaama andmetest.

7 viisi keskmiste arvutamiseks Pythonis: alates põhialgsest kuni edasijõudnuteni

1. Põhiline meetod keskmise arvutamiseks Pythonis

Põhiline keskmise arvutamise meetod

Koodi selgitus

2. Keskmise arvutamine statistics mooduli abil

Kuidas arvutada keskmist kasutades statistics.mean()

Koodi selgitus

3. Kiire keskmise arvutamine numpy mooduli abil

Kuidas arvutada keskmist kasutades numpy.mean()

Koodi selgitus

4. Keskmise arvutamine tabelandmete puhul kasutades pandas

Kuidas arvutada keskmist kasutades DataFrame.mean()

Koodi selgitus

5. Erilised keskmise arvutamise meetodid (kaalutud, harmooniline keskmine, geomeetriline keskmine)

Kuidas arvutada kaalutud keskmist

Kuidas arvutada harmoonilist keskmist

Kuidas arvutada geomeetrilist keskmist

6. Veahaldus- ja täpsuse parandamise tehnikad

Ujukomaarvude täpsusprobleemid

Veahaldus põhialused

7. Kokkuvõte

Stringide teisendamine numbriteks Pythonis veahaldamisega

Pythoni astendamine: põhialused, meetodid ja optimeerimine