Python स्ट्रिङ विभाजन गाइड | split, splitlines, re.split प्रयोग

目次

1. Pythonमा स्ट्रिङ विभाजनको आवश्यकता

1.1. स्ट्रिङ अपरेसनको महत्त्व

Python मा स्ट्रिङ अपरेसन अत्यन्त महत्त्वपूर्ण छ। दैनिक पाठ डेटा प्रशोधन, डेटा विश्लेषणको पूर्वप्रक्रिया आदि विभिन्न परिस्थितिहरूमा स्ट्रिङलाई विभाजन गर्ने कार्य आवश्यक पर्छ। उदाहरणका लागि, CSV फाइलको विश्लेषण, प्रयोगकर्ता इनपुटको प्रशोधन, वा वेब स्क्र्यापिङ द्वारा प्राप्त पाठ डेटा प्रशोधन गर्दा, स्ट्रिङ विभाजन अनिवार्य विधि हो।

1.2. यस लेखमा के सिक्न सकिन्छ

यस लेखमा, Python मा स्ट्रिङलाई विभाजन गर्ने आधारभूत विधिबाट लिएर उन्नत रेगुलर एक्सप्रेशन प्रयोग गरेर विभाजनसम्म विस्तृत रूपमा व्याख्या गरिनेछ। साथै, split(), splitlines(), re.split() जस्ता प्रमुख मेथडहरूको प्रयोगलाई केन्द्रित गर्दै, व्यावहारिक कोड उदाहरणहरू समेत समेटी व्याख्या गरिनेछ।

2. Python को split() मेथडले मूलभूत स्ट्रिंग विभाजन

2.1. split() मेथड के हो?

split() मेथड Python मा स्ट्रिंग ह्यान्डलिंगको सबैभन्दा आधारभूत मेथडहरूमध्ये एक हो। निर्दिष्ट विभाजक (डेलिमिटर) द्वारा स्ट्रिंगलाई विभाजन गरी सूचीको रूपमा फिर्ता गर्छ। डिफल्ट रूपमा स्पेस, ट्याब, नयाँ लाइन जस्ता खाली अक्षरहरू विभाजकको रूपमा प्रयोग हुन्छ।
text = "apple banana cherry"
fruits = text.split()
print(fruits)  # आउटपुट: ['apple', 'banana', 'cherry']

2.2. विभाजक अक्षर निर्दिष्ट गर्ने

विभाजक अक्षर निर्दिष्ट गरेर स्ट्रिंगलाई विभाजन गर्न पनि सम्भव छ। उदाहरणका लागि, कमा वा सेमिकोलन जस्ता विभाजकले विभाजित स्ट्रिंगलाई विभाजन गर्न चाहनुहुन्छ भने, तलको जस्तै लेख्न सकिन्छ।
text = "apple,banana,cherry"
fruits = text.split(",")
print(fruits)  # आउटपुट: ['apple', 'banana', 'cherry']

2.3. विभाजन संख्या सीमित गर्ने

split() मेथडको दोस्रो आर्गुमेन्टमा विभाजन संख्या निर्दिष्ट गरेर, अधिकतम कति पटक विभाजन गर्न सकिन्छ भन्ने सीमा राख्न सकिन्छ।
text = "apple,banana,cherry,orange"
fruits = text.split(",", 2)
print(fruits)  # आउटपुट: ['apple', 'banana', 'cherry,orange']
यसले आवश्यक भाग मात्र विभाजन गरेर प्राप्त गर्न सकिन्छ, र विशिष्ट विभाजन पछि भागलाई कायम राख्न चाहनुहुन्छ भने उपयोगी हुन्छ।
侍エンジニア塾

3. splitlines() प्रयोग गरेर लाइन ब्रेक कोडलाई आधार बनाएर विभाजन गर्ने तरिका

3.1. splitlines() मेथडको सारांश

splitlines() यो स्ट्रिङको लाइन ब्रेक कोडलाई आधार बनाएर स्ट्रिङलाई विभाजन गर्ने मेथड हो। फाइलको सामग्रीलाई प्रत्येक पङ्क्तिमा प्रक्रिया गर्न चाहनुहुन्छ भने वा लाइन ब्रेक समावेश गर्ने डेटा ह्यान्डल गर्दा विशेष रूपमा उपयोगी हुन्छ।
text = """apple
banana
cherry"""
lines = text.splitlines()
print(lines)  # आउटपुट: ['apple', 'banana', 'cherry']

3.2. लाइन ब्रेक कोडलाई राख्ने तरिका

splitlines() मेथडमा, लाइन ब्रेक कोडलाई राख्ने कि नराख्ने विकल्प पनि छ। आर्गुमेन्टमा True पास गरेर, विभाजन पछि स्ट्रिङमा लाइन ब्रेक कोडलाई राख्न सकिन्छ।
text = """applenbananancherry"""
lines = text.splitlines(True)
print(lines)  # आउटपुट: ['applen', 'bananan', 'cherry']
यो विधि मूल पाठको ढाँचालाई कायम राख्दै प्रत्येक पङ्क्तिमा प्रक्रिया गर्न चाहनुहुन्छ भने उपयोगी हुन्छ।

4. रेगुलर एक्सप्रेशन प्रयोग गरेर re.split() द्वारा स्ट्रिङ विभाजन

4.1. re.split() को आधारभूत प्रयोग

Python को re मोड्युल प्रयोग गर्दा, रेगुलर एक्सप्रेशन प्रयोग गरेर स्ट्रिङलाई लचिलो रूपमा विभाजन गर्न सकिन्छ। उदाहरणका लागि, विभिन्न विभाजक अक्षरहरूलाई एकै साथ प्रयोग गरेर विभाजन गर्दा उपयोगी हुन्छ।
import re
text = "apple123banana456cherry"
fruits = re.split(r'd+', text)
print(fruits)  # आउटपुट: ['apple', 'banana', 'cherry']

4.2. बहु विभाजक अक्षरहरूद्वारा विभाजन

यदि धेरै विभाजक अक्षरहरू प्रयोग गरेर स्ट्रिङ विभाजन गर्न चाहनुहुन्छ भने, रेगुलर एक्सप्रेशनमा विभाजक अक्षरहरू निर्दिष्ट गर्न सकिन्छ। उदाहरणका लागि, अल्पविराम, सेमिकोलन, स्पेसलाई विभाजक अक्षर बनाउने अवस्थामा, तलको जस्तै लेख्न सकिन्छ।
text = "apple, banana; cherry"
fruits = re.split(r'[;, ]+', text)
print(fruits)  # आउटपुट: ['apple', 'banana', 'cherry']

4.3. जटिल ढाँचामा विभाजन

re.split() ले, निश्चित ढाँचा वा नियम अनुसार स्ट्रिङ विभाजन गर्न अत्यन्त शक्तिशाली छ। उदाहरणका लागि, निश्चित अंकको संयोजन वा अक्षर ढाँचामा स्ट्रिङ विभाजन गर्न सम्भव छ।
text = "apple100banana200cherry"
fruits = re.split(r'd+', text)
print(fruits)  # आउटपुट: ['apple', 'banana', 'cherry']

5. अन्य उपयोगी मेथडहरू: partition() र rpartition()

5.1. partition() मेथडको प्रयोग

partition() मेथडले निर्दिष्ट विभाजक अक्षर प्रयोग गरेर स्ट्रिङलाई तीन भागमा विभाजन गर्छ। विभाजक अक्षरलाई नै समेटेको परिणाम फिर्ता गर्ने कारण, विभाजक अक्षर आवश्यक परेमा यो उपयोगी हुन्छ।
text = "apple@banana@cherry"
parts = text.partition("@")
print(parts)  # आउटपुट: ('apple', '@', 'banana@cherry')

5.2. rpartition() द्वारा दायाँपट्टि विभाजन

rpartition() ले, partition() जस्तै, विभाजक अक्षरलाई दायाँपट्टि खोजी विभाजन गर्छ। अन्तिम पटक देखा पर्ने विभाजक अक्षरबाट विभाजन गर्न चाहनुहुन्छ भने यो उपयोगी हुन्छ।
text = "apple@banana@cherry"
parts = text.rpartition("@")
print(parts)  # आउटपुट: ('apple@banana', '@', 'cherry')

6. कोड उदाहरण र अनुप्रयोग: Python मा स्ट्रिङ विभाजनको अभ्यास

6.1. स्ट्रिङ विभाजनको अनुप्रयोग उदाहरण

उदाहरणका लागि, प्रयोगकर्ताबाट प्राप्त इनपुटलाई प्रक्रिया गर्दा, प्रयोगकर्ताले इनपुट गरेको डेटा विशेष ढाँचामा विभाजन गरी प्रक्रिया गर्नु आवश्यक पर्न सक्छ। तलको उदाहरणमा, प्रयोगकर्ताले कम्मा द्वारा विभाजित इनपुट गरेको डेटा विभाजन गरी प्रत्येकलाई देखाइन्छ।
user_input = "name:apple, age:30, city:Tokyo"
info = user_input.split(", ")
for item in info:
    key, value = item.split(":")
    print(f"{key}: {value}")

6.2. फाइलबाट डेटा प्रक्रिया

फाइलभित्रको डेटा प्रक्रिया गर्दा, प्रत्येक पङ्क्तिमा विभाजन गरी प्रक्रिया गर्नु आवश्यक पर्न सक्छ। तलको कोडले टेक्स्ट फाइलबाट डेटा पढी, प्रत्येक पङ्क्तिमा विभाजन गरी सूचीमा सुरक्षित गर्ने उदाहरण हो।
with open('data.txt', 'r') as file:
    lines = file.read().splitlines()
print(lines)

7. सारांश: Python को स्ट्रिङ विभाजन मेथडहरूलाई पूर्ण रूपमा प्रयोग गरौं

7.1. सारांश

Python मा, स्ट्रिङलाई विभाजन गर्न विभिन्न मेथडहरू उपलब्ध छन्।split(), splitlines(), re.split(), partition() जस्ता मेथडहरूलाई पूर्ण रूपमा प्रयोग गरेर, डेटा पूर्वप्रक्रिया र विश्लेषणलाई प्रभावकारी रूपमा गर्न सकिन्छ।

7.2. अर्को चरण

यस लेखमा परिचय गराइएका मेथडहरूलाई प्रयोग गरेर, साना प्रोजेक्टहरू वा स्क्रिप्टहरू बनाउनुहोस्, र वास्तविक परिस्थितिमा कुन विधि उत्तम हो भनी परीक्षण गर्नुहोस्।