7 Paraan Kumuha ng Mean sa Python | Simula hanggang Advanced

1. Pangunahing Paraan sa Pagkuha ng Average gamit ang Python

Bilang paraan para kunin ang average ng data sa Python, ang pinaka-pangunahing ay ang pagsasama ng function sum() at function len(). Ito ay gumagamit ng built-in na function ng Python, kaya hindi kailangan ng karagdagang library, at napakadaling maintindihan para sa mga baguhan.

Pangunahing Paraan ng Pagkalkula ng Average

Ang average ay nakukuha sa pamamagitan ng paghahati ng kabuuang halaga ng data sa bilang ng data. Halimbawa, ang code para kalkulahin ang average ng mga numerong nakalista ay ganito:

# Halimbawang Data
numbers = [10, 20, 30, 40, 50]

# Kalkulahin ang Kabuuan
total = sum(numbers)

# Kalkulahin ang Average
average = total / len(numbers)

print(f"Data: {numbers}")
print(f"Average: {average}")

Paliwanag ng Code

Sa code na ito, una ay ginagamit ang sum() upang pagsamahin ang lahat ng halaga ng listahan numbers, pagkatapos ay ginagamit ang len() para makuha ang bilang ng mga elemento ng listahan. Sa huli, hinahati ang kabuuan sa bilang ng mga elemento upang makuha ang average. Ang function na len() ay nagbabalik ng haba ng listahan, kaya kahit anong bilang ng data ay eksaktong makukuha ang average.

Ang pamamaraang ito ay gumagamit lamang ng mga pangunahing tampok ng Python, kaya may kalamangan sa pagiging flexible at madaling i-apply. Bukod pa rito, ito ay pinakamainam kapag ang dataset ay maliit.

2. Pagkalkula ng average gamit ang statistics module

Sa Python, mayroong standard library na statistics module, na nagbibigay-daan upang mas madaling kalkulahin ang average.statistics.mean() function ay tumatanggap ng mga iterable na object tulad ng list o tuple, at kinakalkula ang kanilang average.

Paano magkwenta ng average gamit ang statistics.mean()

import statistics

# Halimbawang data
numbers = [10, 20, 30, 40, 50]

# Kalkulahin ang average
average = statistics.mean(numbers)

print(f"Data: {numbers}")
print(f"Average: {average}")

Paliwanag ng code

Ang code na ito ay gumagamit ng function mean() mula sa module statistics upang kunin ang average. Ang function na ito ay nagkakalkula ng average ng hanay ng mga numerong ibinigay, anuman ang uri o format ng data. Dahil ito ay bahagi ng standard library, hindi na kailangan ng pag-install, at agad itong magagamit.

statistics.mean() ay gumagamit internally ng sum() at len(), kaya ang resulta ay katulad ng nabanggit na paraan, ngunit ang code ay mas maikli at may benepisyo ng pagbawas ng mga error.

年収訴求

3. Paggamit ng numpy module para sa mabilis na pagkalkula ng average

Kapag humahawak ng malaking dami ng data o madalas gumagawa ng numerikal na kalkulasyon, ang Python na numpy module ay angkop. numpy ay isang library na nagpapahintulot ng epektibong pag-manipula at kalkulasyon ng numerikal na data, at lalo na mahusay sa pagproseso ng malakihang data.

Paraan ng pagkalkula ng average gamit ang numpy.mean()

import numpy as np

# Halimbawang data
numbers = np.array([10, 20, 30, 40, 50])

# Kalkulahin ang average
average = np.mean(numbers)

print(f"Data: {numbers}")
print(f"Average: {average}")

Paliwanag ng code

Dito, ginagamit ang numpy.array upang i-convert ang listahan sa numpy array, at kinukalkula ang average gamit ang function na np.mean(). Ang numpy array, kumpara sa listahan, ay nagpapahintulot ng direktang numerikal na operasyon, at lalo na kapag malaki ang sukat ng data, napapabilis ang kalkulasyon.Bukod pa rito, kung gagamitin ang function na numpy.average(), maaaring kalkulahin ang weighted average at masuportahan ang iba’t ibang uri ng pagsusuri ng data. Kapag nais mong magproseso ng malaking data nang mabilis o kailangan ng pagbigat ng data, ang numpy ay ang pinakamainam.

4. Pagkalkula ng average ng tabular na data gamit ang pandas

Ang data analysis library ng Pythonpandas ay partikular na mahusay sa pagproseso ng tabular na data.pandas.DataFrame object gamit ang, madaling kalkulahin ang average ng dataset na sumasaklaw sa maraming column.

Paraan ng pagkalkula ng average gamit ang DataFrame.mean()

import pandas as pd

# Paglikha ng sample na DataFrame
data = {'A': [10, 20, 30, 40, 50],
        'B': [15, 25, 35, 45, 55]}
df = pd.DataFrame(data)

# Kalkulahin ang average ng bawat column
average = df.mean()

print(f"DataFrame:
{df}")
print(f"Average ng bawat column:
{average}")

Paliwanag ng Code

Sa halimbawang ito, lumikha kami ng 2-column na DataFrame df, at ginamit ang function na df.mean() upang kalkulahin ang average ng bawat column. Ang DataFrame ay angkop para sa pagproseso ng tabular na data, at maaaring magsagawa ng estadistikal na kalkulasyon bawat column. Halimbawa, kung kailangan ng pag-aggregate ayon sa kategorya, maaaring gamitin ang groupby method upang mag-aggregate batay sa partikular na kondisyon.

pandas ay isa sa mga pinaka-malawak na ginagamit na library sa data analysis, at kayang harapin ang komplikadong pagproseso ng data.
May mga paraan ng pagkalkula ng average bukod sa karaniwang arithmetic mean na angkop sa tiyak na mga kondisyon. Sa ibaba, ipapakita namin ang mga espesyal na paraan ng pagkalkula ng average tulad ng weighted average, harmonic average, at geometric average.

Paraan ng Pagkalkula ng Weighted Average

Ginagamit ang weighted average kapag nais mong magbigay ng iba’t ibang kahalagahan (bigat) sa bawat data. Halimbawa, numpy.average() function, madali mong makakalkula ang average na may bigat.

import numpy as np

# Sample data at bigat
data = [10, 20, 30, 40, 50]
weights = [0.1, 0.2, 0.4, 0.2, .1]

# Kalkulahin ang weighted average
weighted_average = np.average(data, weights=weights)

print(f"Data: {data}")
print(f"Bigat: {weights}")
print(f"Weighted Average: {weighted_average}")

Paraan ng Pagkalkula ng Harmonic Average

Ang harmonic average ay angkop sa paghawak ng mga ratio o bilis, halimbawa kapag kinakalkula ang average na bilis sa paglalakbay ng parehong distansya sa iba’t ibang bilis. Gamit ang statistics.harmonic_mean() function, maaaring kalkulahin ito nang madali.

import statistics

# Sample data
data = [10, 20, 30]

# Kalkulahin ang harmonic average
harmonic_mean = statistics.harmonic_mean(data)

print(f"Data: {data}")
print(f"Harmonic Average: {harmonic_mean}")

Paraan ng Pagkalkula ng Geometric Average

Ang geometric average ay ginagamit sa mga rate ng paglago at compound interest calculations. Sa Python, maaaring kalkulahin ito nang madali gamit ang math, gamit ang numpy para sa mas epektibong paraan.

import numpy as np

# Sample data
data = [1.1, 1.3, 1.5]

# Kalkulahin ang geometric average
geometric_mean = np.prod(data) ** (1 / len(data))

print(f"Data: {data}")
print(f"Geometric Average: {geometric_mean}")
侍エンジニア塾

6. Mga Estratehiya para sa Error Handling at Pagpapabuti ng Katumpakan

Kapag nagkakalkula ng average, kailangan isaalang-alang ang pagpapabuti ng katumpakan at error handling. Lalo na, dapat mag-ingat sa mga kalkulasyon gamit ang floating-point numbers. May mga tool ang Python para mapabuti ang mga isyung ito sa katumpakan.

Mga Isyu sa Katumpakan ng Floating-Point Numbers

Kapag nagkakalkula gamit ang floating-point numbers, maaaring may kasamang error ang resulta. Kung mahalaga ang katumpakan, epektibo ang paggamit ng decimal.Decimal module.<

from decimal import Decimal

# Halimbawa ng data
data = [Decimal('0.1'), Decimal('0.2'), Decimal('0.3')]

# Kalkulahin ang average
average = sum(data) / len(data)

print(f"Data: {data}")
print(f"Average (pagkatapos ng pagpapabuti ng katumpakan): {average}")

Mga Pangunahing Kaalaman sa Error Handling

Halimbawa, kung susubukang kalkulahin ang average ng isang walang laman na list, mag-eerror. Kaya mahalaga ang error handling na nagche-check kung hindi walang laman ang list.<

# Halimbawa ng data (kabilang ang kaso ng walang laman na list)
data = []

# Pagsusuri ng error
if len(data) > 0:
    average = sum(data) / len(data)
    print(f"Average: {average}")
else:
    print("Error: Walang laman ang data")

7. Buod

Sa artikulong ito, ipinaliwanag namin ang iba’t ibang paraan upang kalkulahin ang average gamit ang Python.sum() at len(), mula sa pangunahing kalkulasyon gamit ang, hanggang sa mga advanced na pamamaraan na gumagamit ng module na statistics, numpy, at pandas, ipinakilala namin ang malawak na saklaw. Sa ng pagpili ng pinakaangkop na paraan batay sa uri at gamit ng data, magiging mas tumpak at epektibo ang pagsusuri ng data.

Bilang susunod na hakbang, kung matutunan mong i-graph ang resulta ng kalkulasyon ng average gamit ang matplotlib, makakakuha ka ng mas malalim na pag-unawa sa data.

侍エンジニア塾