Gabay sa Paghiwalay sa Python: split, splitlines, re.split

1. Kahalagahan ng paghahati ng mga string sa Python

1.1. Kahalagahan ng pagproseso ng mga string

Sa Python, napakahalaga ang pagproseso ng mga string. Sa pang-araw-araw na paghawak ng text data, pati na rin sa pre-processing ng data analysis, kinakailangan ang paghahati ng mga string sa iba’t ibang sitwasyon. Halimbawa, sa pag-analisa ng mga CSV file, pagproseso ng input ng user, o paghawak ng text data na nakuha mula sa web scraping, ang paghahati ng string ay isang mahalagang pamamaraan.

1.2. Ano ang matututunan sa artikulong ito

Sa artikulong ito, tatalakayin namin mula sa mga pangunahing paraan ng paghahati ng mga string sa Python hanggang sa mas advanced na paghahati gamit ang regular expressions. Ipapaliwanag din namin ang paggamit ng mga pangunahing method tulad ng split(), splitlines(), at re.split(), kasama ang mga praktikal na halimbawa ng code.

2. Python split() method para sa pangunahing paghahati ng string

2.1. Ano ang split() method?

split() method ay isa sa mga pinaka-pangunahing method sa pag-manipula ng string sa Python. Hinahati nito ang string batay sa tinukoy na delimiter at ibinabalik ito bilang listahan. Sa default, ginagamit ang whitespace characters (space, tab, newline) bilang delimiter.
text = "apple banana cherry"
fruits = text.split()
print(fruits)  # Output: ['apple', 'banana', 'cherry']

2.2. Pagtukoy ng delimiter

Maaari ring tukuyin ang delimiter upang hatiin ang string. Halimbawa, kung ang string ay pinaghiwalay ng mga kuwit o semicolon, isusulat ito tulad ng sumusunod.
text = "apple,banana,cherry"
fruits = text.split(",")
print(fruits)  # Output: ['apple', 'banana', 'cherry']

2.3. Paglimita sa bilang ng paghahati

split() method ay maaaring limitahan ang bilang ng paghahati sa pamamagitan ng ikalawang argumento.
text = "apple,banana,cherry,orange"
fruits = text.split(",", 2)
print(fruits)  # Output: ['apple', 'banana', 'cherry,orange']
Sa ganitong paraan, maaari mong kunin lamang ang kinakailangang bahagi sa pamamagitan ng paghahati, na kapaki-pakinabang kapag nais mong panatilihin ang isang tiyak na bahagi pagkatapos ng paghahati.

3. Paraan ng paghahati batay sa mga newline gamit ang splitlines()

3.1. Pangkalahatang-ideya ng splitlines() na metodo

splitlines() ay isang metodo na naghahati ng string batay sa mga newline code ng string. Kapaki-pakinabang ito lalo na kapag nais mong iproseso ang nilalaman ng file linya‑linya o kapag humahawak ng data na may kasamang mga newline.
text = """apple
banana
cherry"""
lines = text.splitlines()
print(lines)  # Output: ['apple', 'banana', 'cherry']

3.2. Paraan ng pagpapanatili ng mga newline

splitlines() na metodo ay may opsyon para tukuyin kung panatilihin ang mga newline code. Sa pamamagitan ng pagpasa ng True bilang argumento, maaari mong panatilihin ang mga newline code sa mga string pagkatapos hatiin.
text = """applenbananancherry"""
lines = text.splitlines(True)
print(lines)  # Output: ['applen', 'bananan', 'cherry']
Kapaki-pakinabang ang pamamaraang ito kapag nais mong iproseso ang teksto linya‑linya habang pinapanatili ang orihinal na format nito.

4. Paghiwalayin ang mga string gamit ang re.split() na may regular na ekspresyon

4.1. Pangunahing paggamit ng re.split()

Sa paggamit ng re module ng Python, maaaring hatiin ang mga string nang flexible gamit ang regular na ekspresyon. Halimbawa, kapaki-pakinabang ito kapag nais hatiin gamit ang maramihang magkaibang delimiter nang sabay.
import re
text = "apple123banana456cherry"
fruits = re.split(r'd+', text)
print(fruits)  # Output: ['apple', 'banana', 'cherry']

4.2. Paghiwalayin gamit ang maramihang delimiter

Kung nais hatiin ang string gamit ang maramihang delimiter, maaaring tukuyin ang mga delimiter sa regular na ekspresyon. Halimbawa, kung gagamitin ang kuwit, tuldok-kuwit, at puwang bilang delimiter, isusulat ito tulad ng sumusunod.
text = "apple, banana; cherry"
fruits = re.split(r'[;, ]+', text)
print(fruits)  # Output: ['apple', 'banana', 'cherry']

4.3. Paghiwalayin gamit ang komplikadong pattern

re.split() ay napakalakas sa paghahati ng mga string alinsunod sa tiyak na mga pattern o patakaran. Halimbawa, maaaring hatiin ang string batay sa tiyak na kombinasyon ng mga numero o mga pattern ng karakter.
text = "apple100banana200cherry"
fruits = re.split(r'd+', text)
print(fruits)  # Output: ['apple', 'banana', 'cherry']
年収訴求

5. Iba pang kapaki-pakinabang na mga method: partition() at rpartition()

5.1. Paggamit ng method na partition()

partition() Ang method na partition() ay naghahati ng string sa tatlong bahagi gamit ang tinukoy na delimiter. Nagbabalik ito ng resulta na kasama ang mismong delimiter, kaya kapaki-pakinabang kapag kailangan mo ang delimiter.
text = "apple@banana@cherry"
parts = text.partition("@")
print(parts)  # Output: ('apple', '@', 'banana@cherry')

5.2. Paghahati mula sa kanan gamit ang rpartition()

rpartition() ay katulad ng partition(), ngunit hinahanap ang delimiter mula sa kanan at naghahati doon. Nakakatulong ito kapag nais mong hatiin gamit ang huling paglitaw ng delimiter.
text = "apple@banana@cherry"
parts = text.rpartition("@")
print(parts)  # Output: ('apple@banana', '@', 'cherry')

6. Mga Halimbawa ng Kodigo at Paglalapat: Praktikal na Paghahati ng String sa Python

6.1. Halimbawa ng Paglalapat ng Paghahati ng String

Halimbawa, kapag pinoproseso ang input mula sa gumagamit, maaaring kailanganin na hatiin ang data na ini-input ng gumagamit sa isang tiyak na format para maproseso ito. Sa susunod na halimbawa, hinahati ang data na ini-input ng gumagamit gamit ang kuwit bilang separator at ipinapakita ang bawat isa.
user_input = "name:apple, age:30, city:Tokyo"
info = user_input.split(", ")
for item in info:
    key, value = item.split(":")
    print(f"{key}: {value}")

6.2. Pagproseso ng Data Mula sa File

Kapag pinoproseso ang data sa loob ng file, maaaring kailanganin itong hatiin batay sa bawat linya. Ang sumusunod na code ay nagbabasa ng data mula sa isang text file, hinahati ito sa bawat linya, at iniimbak sa isang listahan.
with open('data.txt', 'r') as file:
    lines = file.read().splitlines()
print(lines)

7. Buod: Gamitin nang mahusay ang mga string split method ng Python

7.1. Buod

May iba’t ibang mga method na inihanda ang Python para hatiin ang mga string. Sa pamamagitan ng paggamit nang mahusay ng mga method tulad ng split(), splitlines(), re.split(), at partition(), magiging mas epektibo ang paunang pagproseso at pagsusuri ng data.

7.2. Susunod na Hakbang

Gamitin ang mga method na ipinakilala sa artikulong ito upang lumikha ng maliliit na proyekto o script, at subukan kung aling paraan ang pinakaangkop sa totoong sitwasyon.
RUNTEQ(ランテック)|超実戦型エンジニア育成スクール