目次
- 1 1. Python द्वारा Excel फाइलहरू संचालन गर्ने सुविधा
- 2 2. Python मा Excel पढ्नका लागि मुख्य पुस्तकालयहरूको परिचय
- 3 3. Pandas vs OpenPyXL: कुनलाई चयन गर्नु पर्छ?
- 4 4. वास्तविक प्रयोग उदाहरण: Excel फाइलको पढाइदेखि डेटा प्रशोधनसम्म
- 5 5. Excel फाइल सञ्चालनमा ध्यान दिनुपर्ने बुँदा र उत्तम अभ्यासहरू
- 6 6. निष्कर्ष: Python प्रयोग गरेर Excel सञ्चालनको दक्षता
1. Python द्वारा Excel फाइलहरू संचालन गर्ने सुविधा
1.1 पृष्ठभूमि
Excel डेटा व्यवस्थापन र व्यापार रिपोर्ट निर्माणको लागि व्यापक रूपमा प्रयोग गरिन्छ, र डेटा प्रभावकारी रूपमा प्रक्रिया गर्नको लागि उपकरणको रूपमा महत्वपूर्ण भूमिका खेल्छ। तर, म्यानुअल रूपमा डेटा ह्यान्डल गर्दा समय लाग्छ र त्रुटि हुने सम्भावना बढ्छ। त्यसैले, Python को स्वचालन स्क्रिप्ट प्रयोग गरेर Excel डेटा पढ्ने र प्रशोधन गर्नेले कामको दक्षता र शुद्धता सुधार गर्न सम्भव हुन्छ।1.2 Python को बल
Python एक प्रोग्रामिङ भाषा हो जसले संक्षिप्त कोडसँग जटिल कार्यहरू कार्यान्वयन गर्न सक्छ, र Pandas वा OpenPyXL जस्ता लाइब्रेरीहरू प्रयोग गरेर Excel फाइलहरू पढ्ने र सम्पादन गर्ने काम सजिलो बनाउँछ। यस प्रकारको Python को सुविधा प्रयोग गरेर, कार्यहरूको स्वचालन र दक्षता उल्लेखनीय रूपमा सुधार्न सकिन्छ।2. Python मा Excel पढ्नका लागि मुख्य पुस्तकालयहरूको परिचय
2.1 Pandas प्रयोग गरेर Excel को पढाइ
Pandas डेटा विश्लेषण र डेटा हेरफेरमा विशेषीकृत Python पुस्तकालय हो, जसले Excel फाइलको पढाइलाई सजिलो बनाउँछ।read_excel()
फङ्क्शन प्रयोग गरेर, Excel डेटा लाई डेटा फ्रेमको रूपमा पढ्न सकिन्छ, जसले प्रशोधन र विश्लेषणमा उपयोगी हुन्छ।import pandas as pd
# Excel फाइलको पढाइ
df = pd.read_excel('example.xlsx')
print(df)
बहु शीटको सञ्चालन
Pandas द्वारा बहु शीट भएको Excel फाइल पनि सजिलै पढ्न सकिन्छ।sheet_name=None
प्रयोग गर्दा, सबै शीटहरूलाई शब्दकोश स्वरूपमा प्राप्त गर्न सकिन्छ।df_sheets = pd.read_excel('example.xlsx', sheet_name=None)
for sheet_name, df_sheets.items():
print(f"Sheet: {sheet_name}")
print(df)
2.2 OpenPyXL प्रयोग गरेर Excel को पढाइ
OpenPyXL Excel फाइलको सम्पादन र ढाँचा सञ्चालनलाई समर्थन गर्ने पुस्तकालय हो, जसले विशेष सेल वा पङ्क्तिलाई प्रत्यक्ष रूपमा हेरफेर गर्न चाहने अवस्थामा उपयुक्त छ। साथै, Excel को लेआउट र ग्राफ आदि पनि कायम राख्न सकिने कारणले, व्यापारिक दस्तावेजको स्वचालित निर्माणमा पनि उपयुक्त छ।from openpyxl import load_workbook
# Excel फाइललाई पढ्ने
wb = load_workbook('example.xlsx')
ws = wb['Sheet1']
# सेलको मान प्राप्त गर्ने
cell_value = ws['A1'].value
print(cell_value)
3. Pandas vs OpenPyXL: कुनलाई चयन गर्नु पर्छ?
3.1 प्रदर्शनको अन्तर
Pandas ले ठूलो डेटा को सङ्कलन र फिल्टरिङमा अत्यन्त प्रभावकारी छ, तर ठूलो आकारको Excel फाइलहरू संचालन गर्दा मेमोरीको प्रयोग धेरै हुन सक्छ। अर्कोतर्फ, OpenPyXL मेमोरी दक्षतामा उत्कृष्ट छ, रread_only=True
विकल्प प्रयोग गरेर Excel फाइललाई प्रभावकारी रूपमा पढ्न सम्भव हुन्छ।# OpenPyXL को केवल‑पढ्ने मोड
wb = load_workbook('large_file.xlsx', read_only=True)
3.2 कार्यहरू र बहुपयोगिता
Pandas डेटा विश्लेषण र सांख्यिकीय प्रक्रिया गर्दा अत्यन्त उपयोगी छ। डेटा फ्रेम स्वरूपमा सञ्चालन सरल छ, र डेटा को रूपान्तरण तथा विश्लेषण छिटो गर्न सकिन्छ। अर्कोतर्फ, OpenPyXL Excel फाइलको सम्पादन, VBA कोडको संरक्षण, ग्राफ निर्माण जस्ता कार्यहरूलाई समर्थन गर्दछ, र Excel फाइल स्वयंको सञ्चालनका लागि उपयुक्त छ।4. वास्तविक प्रयोग उदाहरण: Excel फाइलको पढाइदेखि डेटा प्रशोधनसम्म
4.1 आधारभूत Excel फाइलको पढाइ
Pandas प्रयोग गरेर सरल Excel फाइलको पढाइको उदाहरण हो।df = pd.read_excel('sales_data.xlsx')
print(df)
4.2 विशिष्ट शीट वा सेलको सञ्चालन
OpenPyXL प्रयोग गरेर, विशिष्ट शीट वा सेलको डेटा प्राप्त गरी, नयाँ डेटा लेखिन्छ।from openpyxl import load_workbook
wb = load_workbook('sales_data.xlsx')
ws = wb['2023']
print(ws['A1'].value)
# नयाँ मान लेख्ने
ws['B1'] = 'नयाँ डेटा'
wb.save('updated_sales_data.xlsx')
4.3 डेटाको फिल्टरिङ र सङ्कलन
Pandas प्रयोग गरेर, विशिष्ट शर्तहरूमा आधारित डेटाको फिल्टरिङ र सङ्कलन गरिन्छ।filtered_df = df[df['मिति'].between('2023-09-01', '2023-09-30')]
total_sales = filtered_df['बिक्रीसंख्या'].sum()
print(f"सेप्टेम्बरको बिक्री कुल: {total_sales}")
5. Excel फाइल सञ्चालनमा ध्यान दिनुपर्ने बुँदा र उत्तम अभ्यासहरू
5.1 त्रुटि ह्यान्डलिङ्गको कार्यान्वयन
Excel फाइल पढ्दा, फाइल अवस्थित नभएको वा डेटा ढाँचा फरक भएको अवस्थामा त्रुटि ह्यान्डलिङ्ग कार्यान्वयन गर्नु महत्त्वपूर्ण छ।try:
df = pd.read_excel('non_existent_file.xlsx')
except FileNotFoundError as e:
print(f"त्रुटि: फाइल फेला परेन: {e}")
5.2 क्यारेक्टर कोड र ढाँचासँग सम्बन्धित ध्यान दिनुपर्ने बुँदा
Excel फाइलमा जापानी भाषा समावेश भएको अवस्थामा, अक्षर बिग्रन नदिन उपयुक्त एन्कोडिङ सेट गर्नु महत्त्वपूर्ण छ।df = pd.read_csv('data.csv', encoding='utf-8')
5.3 ठूलो डेटा को प्रभावकारी प्रक्रिया
Pandas कोchunksize
विकल्प र OpenPyXL को read_only
मोड प्रयोग गरेर, ठूलो डेटालाई प्रभावकारी रूपमा प्रक्रिया गरौं।# Pandas को chunksize विकल्प
chunks = pd.read_csv('large_data.csv', chunksize=1000)
for chunk in chunks:
print(chunk)
5.4 OpenPyXL मा ढाँचा संरक्षण र ग्राफ निर्माण
OpenPyXL मा, सेलको ढाँचा कायम राख्दै डेटा थप्ने वा सम्पादन गर्ने सम्भव छ। साथै, Excel को ग्राफ निर्माण गर्ने सुविधा पनि उपलब्ध छ।from openpyxl.chart import BarChart, Reference
# ग्राफ निर्माण
chart = BarChart()
data = Reference(ws, min_col=2, min_row=1, max_col=2, max_row=10)
chart.add_data(data, titles_from_data=True)
ws.add_chart(chart, "E5")