१. पाइथनमा सम्बन्ध गुणांक कसरी गणना गर्ने?
सम्बन्ध गुणांक दुई डेटा सेटहरूबीचको सम्बन्धको शक्तिलाई मापन गर्ने एक मेट्रिक हो, जुन -१ देखि १ सम्मको दायरा हुन्छ। १ नजिकका मानहरूले बलियो सकारात्मक सम्बन्धलाई संकेत गर्छन् (जब एक मान बढ्छ, अर्को पनि बढ्छ), -१ नजिकका मानहरूले बलियो नकारात्मक सम्बन्धलाई संकेत गर्छन् (जब एक मान बढ्छ, अर्को घट्छ), र ० नजिकका मानहरूले थोरै वा कुनै सम्बन्ध नभएको सुझाव दिन्छन्।
सम्बन्ध गुणांक प्रयोग गर्ने फाइदाहरू
- डेटाबीचका सम्बन्धहरूलाई छिट्टै मूल्यांकन गर्नुहोस्
- प्रवृत्तिहरू र ढाँचाहरू बुझ्नको लागि भविष्यवाणी अन्तर्दृष्टिको रूपमा प्रभावकारी
- मेसिन लर्निङ मोडेलहरूमा फिचर चयनको लागि सहयोगी
२. पाइथनमा सम्बन्ध गुणांकहरू गणना गर्ने आधारभूत विधिहरू
पाइथनमा, तपाईं NumPy र Pandas को उपयोग गरेर सम्बन्ध गुणांकहरू सजिलै गणना गर्न सक्नुहुन्छ।
NumPy प्रयोग गरेर सम्बन्ध गुणांकहरू गणना गर्ने
NumPy एक लाइब्रेरी हो जुन संख्यात्मक गणनाको लागि विशेषीकृत छ, र numpy.corrcoef() फङ्क्शन प्रयोग गरेर तपाईं सूचीहरू वा एरेहरूबीच सम्बन्ध गुणांकहरू गणना गर्न सक्नुहुन्छ।
import numpy as np
# Prepare data
data1 = [1, 2, 3, 4, 5]
data2 = [5, 4, 3, 2, 1]
# Compute the correlation coefficient
correlation = np.corrcoef(data1, data2)
print(correlation)
Pandas प्रयोग गरेर सम्बन्ध गुणांकहरू गणना गर्ने
Pandas मा, तपाईं DataFrame को .corr() विधि प्रयोग गरेर बहुविधि चरहरूमा सम्बन्ध मैट्रिक्स उत्पन्न गर्न सक्नुहुन्छ। यो पूरै डेटासेटभित्रका सम्बन्धहरू बुझ्नको लागि उपयोगी छ।
import pandas as pd
# Create sample data
data = {
'A': [1, 2, 3, 4, 5],
'B': [5, 4, 3, 2, 1],
'C': [2, 3, 4, 5, 6]
}
df = pd.DataFrame(data)
# Compute the correlation matrix
correlation_matrix = df.corr()
print(correlation_matrix)

३. सम्बन्ध र कारणबीचको भिन्नता
धेरै अवस्थाहरूमा, सम्बन्ध गुणांकले चरहरूबीचको सम्बन्धलाई संकेत गर्छ, तर यसको मतलब एकले अर्कोलाई कारण बनाउँछ भन्ने होइन। सम्बन्ध र कारणबीचको भिन्नता बुझ्नुले डेटा विश्लेषणको विश्वसनीयतालाई सुधार गर्छ।
सम्बन्ध र कारणबीचका भिन्नताहरू
- सम्बन्ध : यसको मतलब दुई चरहरू सँगै चल्छन्, तर यसको मतलब एकले अर्कोलाई कारण बनाउँछ भन्ने होइन। उदाहरणको लागि, आइसक्रिम बिक्री र सनस्क्रिन बिक्री दुवै गर्मीमा बढ्छन्, जसले सम्बन्ध देखाउँछ, तर तिनीहरू मौसमको साझा कारकमा निर्भर हुन्छन् र कुनै प्रत्यक्ष कारण सम्बन्ध हुँदैन।
- कारण : यसले एक चरले अर्कोलाई प्रत्यक्ष प्रभाव पार्ने अवस्थालाई जनाउँछ। उदाहरणको लागि, स्विच थिच्दा बल्ब बल्छ किनकि स्विचको कार्य बल्ब बल्नेको प्रत्यक्ष कारण हो।
४. सम्बन्ध गुणांकहरूका प्रकारहरू र तिनका अनुप्रयोगहरू
सम्बन्ध गुणांकहरूका विभिन्न प्रकारहरू छन्, र डेटाका विशेषताहरूको आधारमा उपयुक्त छनोट गर्नु महत्वपूर्ण छ।
- पियर्सन सम्बन्ध गुणांक : रैखिक सम्बन्धहरूको मूल्यांकन गर्छ र डेटा लगभग सामान्य वितरण भएको हुँदा उपयुक्त हुन्छ।
- स्पीयरम्यान सम्बन्ध गुणांक : र्याङ्क-आधारित सम्बन्ध मापन गर्छ र डेटा गैर-सामान्य वा धेरै आउटलाइयरहरू भएको हुँदा प्रभावकारी हुन्छ।
- केन्डल सम्बन्ध गुणांक : र्याङ्क सम्झौताको डिग्री मूल्यांकन गर्छ र साना डेटासेटहरू वा र्याङ्क सम्बन्धहरू जोड दिँदा उपयुक्त हुन्छ।
५. सम्बन्ध गुणांकहरूको दृश्यीकरण
सम्बन्ध सम्बन्धहरूका परिणामहरूलाई दृश्यीकरण गर्नुले डेटा ढाँचाहरूलाई सहज रूपमा बुझ्न सजिलो बनाउँछ।
हीटम्याप प्रयोग गरेर दृश्यीकरण
Seaborn को heatmap() प्रयोग गरेर, हामी रङ्गहरूले सम्बन्ध मैट्रिक्सलाई दृश्यीकरण गर्छौं। फरक-फरक छायाहरूले सम्बन्धहरूको शक्तिलाई देखाउँछन्, त्यसैले तपाईं बहुविधि चरहरूबीचका सम्बन्धहरूलाई एक नजरमा बुझ्न सक्नुहुन्छ।
import seaborn as sns
import matplotlib.pyplot as plt
# Compute the correlation matrix
correlation_matrix = df.corr()
# Create a heatmap
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.show()
बार चार्टहरूसँग दृश्यीकरण
यदि तपाईं कुनै विशिष्ट चर र अन्य चरहरू बीचको सम्बन्धमा केन्द्रित हुन चाहनुहुन्छ भने, बार चार्टहरू प्रभावकारी हुन्छन्।
target_corr = df.corr()['A'].sort_values()
target_corr.plot.barh()
plt.show()

६. वास्तविक विश्व व्यवसायिक उपयोग मामहरू र सावधानीहरू
व्यवसायिक उपयोग मामहरू
- मार्केटिङ विश्लेषण : विज्ञापन खर्च र बिक्री बीचको सम्बन्ध विश्लेषण गर्दा सम्बन्ध गुणांकहरू प्रयोग गर्न सकिन्छ। बिक्री वृद्धि र विज्ञापन खर्च वृद्धि बीचको सम्बन्ध प्रमाणित गर्नुहोस् जसले प्रभावकारी विज्ञापन रणनीतिहरू योजना गर्न मद्दत गर्छ।
- प्रयोगकर्ता व्यवहार विश्लेषण : रूपान्तरण दरहरूमा असर गर्ने कारकहरू बुझ्न वेब ट्राफिक र रूपान्तरण दरहरू बीचको सम्बन्ध मूल्यांकन गर्नुहोस्।
- मेसिन लर्निङ : सम्बन्ध विश्लेषण मार्फत, मेसिन-लर्निङ मोडेलहरूमा प्रयोग गरिने विशेषताहरूको चयनलाई समर्थन गर्नुहोस्, जसले मोडेल प्रदर्शन सुधारमा योगदान दिन्छ।
सावधानीहरू
सम्बन्धले कारणता संकेत गर्दैन भन्ने कुरालाई विचार गर्नुहोस्, त्यसैले सम्बन्ध गुणांकहरू व्याख्या गर्दा सावधानी आवश्यक छ। विशेष गरी जब तेस्रो चर (कन्फाउन्डर) परिणामहरूलाई प्रभावित गर्दैछ, तपाईं गलत निष्कर्षमा पुग्न सक्नुहुन्छ। उदाहरणका लागि, आइसक्रिम बिक्री र सनस्क्रिन बिक्री दुवै गर्मीको गर्मी महिनाहरूमा बढ्छन्, त्यसैले तिनीहरू सम्बन्धित भए पनि, कुनै प्रत्यक्ष कारण सम्बन्ध हुँदैन।
७. सारांश
हामीले पाइथन प्रयोग गरेर सम्बन्ध गुणांकहरू कसरी गणना गर्ने, सम्बन्ध र कारणता बीचको भिन्नता, र व्यवसायिक अनुप्रयोगहरू र सावधानीहरूका उदाहरणहरू पनि व्याख्या गरेका छौं। सम्बन्ध विश्लेषण डाटा बीचका सम्बन्धहरू बुझ्न शक्तिशाली उपकरण हो, तर गलत व्याख्या टार्न, कारणताको परीक्षण गर्दा सावधानी अपनाउनु पर्छ।




