Python संग Excel फाइल सञ्चालन | Pandas र OpenPyXL गाइड

目次

1. Python द्वारा Excel फाइलहरू संचालन गर्ने सुविधा

1.1 पृष्ठभूमि

Excel डेटा व्यवस्थापन र व्यापार रिपोर्ट निर्माणको लागि व्यापक रूपमा प्रयोग गरिन्छ, र डेटा प्रभावकारी रूपमा प्रक्रिया गर्नको लागि उपकरणको रूपमा महत्वपूर्ण भूमिका खेल्छ। तर, म्यानुअल रूपमा डेटा ह्यान्डल गर्दा समय लाग्छ र त्रुटि हुने सम्भावना बढ्छ। त्यसैले, Python को स्वचालन स्क्रिप्ट प्रयोग गरेर Excel डेटा पढ्ने र प्रशोधन गर्नेले कामको दक्षता र शुद्धता सुधार गर्न सम्भव हुन्छ।

1.2 Python को बल

Python एक प्रोग्रामिङ भाषा हो जसले संक्षिप्त कोडसँग जटिल कार्यहरू कार्यान्वयन गर्न सक्छ, र Pandas वा OpenPyXL जस्ता लाइब्रेरीहरू प्रयोग गरेर Excel फाइलहरू पढ्ने र सम्पादन गर्ने काम सजिलो बनाउँछ। यस प्रकारको Python को सुविधा प्रयोग गरेर, कार्यहरूको स्वचालन र दक्षता उल्लेखनीय रूपमा सुधार्न सकिन्छ।

2. Python मा Excel पढ्नका लागि मुख्य पुस्तकालयहरूको परिचय

2.1 Pandas प्रयोग गरेर Excel को पढाइ

Pandas डेटा विश्लेषण र डेटा हेरफेरमा विशेषीकृत Python पुस्तकालय हो, जसले Excel फाइलको पढाइलाई सजिलो बनाउँछ।read_excel() फङ्क्शन प्रयोग गरेर, Excel डेटा लाई डेटा फ्रेमको रूपमा पढ्न सकिन्छ, जसले प्रशोधन र विश्लेषणमा उपयोगी हुन्छ।
import pandas as pd

# Excel फाइलको पढाइ
df = pd.read_excel('example.xlsx')
print(df)

बहु शीटको सञ्चालन

Pandas द्वारा बहु शीट भएको Excel फाइल पनि सजिलै पढ्न सकिन्छ।sheet_name=None प्रयोग गर्दा, सबै शीटहरूलाई शब्दकोश स्वरूपमा प्राप्त गर्न सकिन्छ।
df_sheets = pd.read_excel('example.xlsx', sheet_name=None)
for sheet_name, df_sheets.items():
    print(f"Sheet: {sheet_name}")
    print(df)

2.2 OpenPyXL प्रयोग गरेर Excel को पढाइ

OpenPyXL Excel फाइलको सम्पादन र ढाँचा सञ्चालनलाई समर्थन गर्ने पुस्तकालय हो, जसले विशेष सेल वा पङ्क्तिलाई प्रत्यक्ष रूपमा हेरफेर गर्न चाहने अवस्थामा उपयुक्त छ। साथै, Excel को लेआउट र ग्राफ आदि पनि कायम राख्न सकिने कारणले, व्यापारिक दस्तावेजको स्वचालित निर्माणमा पनि उपयुक्त छ।
from openpyxl import load_workbook

# Excel फाइललाई पढ्ने
wb = load_workbook('example.xlsx')
ws = wb['Sheet1']

# सेलको मान प्राप्त गर्ने
cell_value = ws['A1'].value
print(cell_value)

3. Pandas vs OpenPyXL: कुनलाई चयन गर्नु पर्छ?

3.1 प्रदर्शनको अन्तर

Pandas ले ठूलो डेटा को सङ्कलन र फिल्टरिङमा अत्यन्त प्रभावकारी छ, तर ठूलो आकारको Excel फाइलहरू संचालन गर्दा मेमोरीको प्रयोग धेरै हुन सक्छ। अर्कोतर्फ, OpenPyXL मेमोरी दक्षतामा उत्कृष्ट छ, र read_only=True विकल्प प्रयोग गरेर Excel फाइललाई प्रभावकारी रूपमा पढ्न सम्भव हुन्छ।
# OpenPyXL को केवल‑पढ्ने मोड
wb = load_workbook('large_file.xlsx', read_only=True)

3.2 कार्यहरू र बहुपयोगिता

Pandas डेटा विश्लेषण र सांख्यिकीय प्रक्रिया गर्दा अत्यन्त उपयोगी छ। डेटा फ्रेम स्वरूपमा सञ्चालन सरल छ, र डेटा को रूपान्तरण तथा विश्लेषण छिटो गर्न सकिन्छ। अर्कोतर्फ, OpenPyXL Excel फाइलको सम्पादन, VBA कोडको संरक्षण, ग्राफ निर्माण जस्ता कार्यहरूलाई समर्थन गर्दछ, र Excel फाइल स्वयंको सञ्चालनका लागि उपयुक्त छ।

4. वास्तविक प्रयोग उदाहरण: Excel फाइलको पढाइदेखि डेटा प्रशोधनसम्म

4.1 आधारभूत Excel फाइलको पढाइ

Pandas प्रयोग गरेर सरल Excel फाइलको पढाइको उदाहरण हो।
df = pd.read_excel('sales_data.xlsx')
print(df)

4.2 विशिष्ट शीट वा सेलको सञ्चालन

OpenPyXL प्रयोग गरेर, विशिष्ट शीट वा सेलको डेटा प्राप्त गरी, नयाँ डेटा लेखिन्छ।
from openpyxl import load_workbook

wb = load_workbook('sales_data.xlsx')
ws = wb['2023']
print(ws['A1'].value)

# नयाँ मान लेख्ने
ws['B1'] = 'नयाँ डेटा'
wb.save('updated_sales_data.xlsx')

4.3 डेटाको फिल्टरिङ र सङ्कलन

Pandas प्रयोग गरेर, विशिष्ट शर्तहरूमा आधारित डेटाको फिल्टरिङ र सङ्कलन गरिन्छ।
filtered_df = df[df['मिति'].between('2023-09-01', '2023-09-30')]
total_sales = filtered_df['बिक्रीसंख्या'].sum()
print(f"सेप्टेम्बरको बिक्री कुल: {total_sales}")

5. Excel फाइल सञ्चालनमा ध्यान दिनुपर्ने बुँदा र उत्तम अभ्यासहरू

5.1 त्रुटि ह्यान्डलिङ्गको कार्यान्वयन

Excel फाइल पढ्दा, फाइल अवस्थित नभएको वा डेटा ढाँचा फरक भएको अवस्थामा त्रुटि ह्यान्डलिङ्ग कार्यान्वयन गर्नु महत्त्वपूर्ण छ।
try:
    df = pd.read_excel('non_existent_file.xlsx')
except FileNotFoundError as e:
    print(f"त्रुटि: फाइल फेला परेन: {e}")

5.2 क्यारेक्टर कोड र ढाँचासँग सम्बन्धित ध्यान दिनुपर्ने बुँदा

Excel फाइलमा जापानी भाषा समावेश भएको अवस्थामा, अक्षर बिग्रन नदिन उपयुक्त एन्कोडिङ सेट गर्नु महत्त्वपूर्ण छ।
df = pd.read_csv('data.csv', encoding='utf-8')

5.3 ठूलो डेटा को प्रभावकारी प्रक्रिया

Pandas को chunksize विकल्प र OpenPyXL को read_only मोड प्रयोग गरेर, ठूलो डेटालाई प्रभावकारी रूपमा प्रक्रिया गरौं।
# Pandas को chunksize विकल्प
chunks = pd.read_csv('large_data.csv', chunksize=1000)
for chunk in chunks:
    print(chunk)

5.4 OpenPyXL मा ढाँचा संरक्षण र ग्राफ निर्माण

OpenPyXL मा, सेलको ढाँचा कायम राख्दै डेटा थप्ने वा सम्पादन गर्ने सम्भव छ। साथै, Excel को ग्राफ निर्माण गर्ने सुविधा पनि उपलब्ध छ।
from openpyxl.chart import BarChart, Reference

# ग्राफ निर्माण
chart = BarChart()
data = Reference(ws, min_col=2, min_row=1, max_col=2, max_row=10)
chart.add_data(data, titles_from_data=True)
ws.add_chart(chart, "E5")

6. निष्कर्ष: Python प्रयोग गरेर Excel सञ्चालनको दक्षता

Pandas र OpenPyXL दुवै विभिन्न प्रयोजनका लागि उपयुक्त शक्तिशाली उपकरणहरू हुन्। डेटा विश्लेषणको लागि Pandas, Excel फाइल स्वयंको सञ्चालनको लागि OpenPyXL उपयुक्त छन्, र उद्देश्य अनुसार उपकरणको प्रयोगले प्रभावकारी Excel सञ्चालनलाई सम्भव बनाउँछ। Python प्रयोग गरेर, कार्यको स्वचालन र डेटा प्रशोधनमा उल्लेखनीय सुधार आउँछ, जसले उत्पादनशीलता बढाउन सम्भव बनाउँछ।
RUNTEQ(ランテック)|超実戦型エンジニア育成スクール