بايثون للمبتدئين: كيفية إزالة التكرارات من القوائم

1 1. لماذا تحتاج إلى إزالة التكرارات من القوائم في Python
2 2. كيفية إزالة التكرارات من قائمة باستخدام set
3 3. كيفية إزالة التكرارات مع الحفاظ على الترتيب
4 4. طرق متقدمة لإزالة التكر القوائم
5 5. مقارنة الأداء
6 6. الأسئلة المتكررة (FAQ)
7 7. الملخص

1. لماذا تحتاج إلى إزالة التكرارات من القوائم في Python

إزالة التكرارات من القوائم في Python أمر مهم في العديد من الحالات. خاصة عند العمل مع مجموعات بيانات كبيرة، من الضروري ضمان فرادة البيانات وتمكين المعالجة الفعالة.

لماذا يجب عليك إزالة التكرارات من القوائم

تحسين الدقة في تحليل البيانات في تحليل البيانات، يمكن أن تمنع السجلات المكررة الحصول على نتائج دقيقة. على سبيل المثال، التكرارات في بيانات المبيعات أو تجميعات الاستطلاعات يمكن أن تؤدي إلى استنتاجات خاطئة.
تكامل قاعدة البيانات عند استيراد البيانات إلى قاعدة بيانات من Python، ستسبب القيم المكررة في المفاتيح الفريدة أخطاء. إزالة التكرارات في Python مسبقًا تسمح بمعالجة البيانات بسلاسة.
تحسين كفاءة المعالجة أحجام البيانات الكبيرة غير الضرورية تضع ضغطًا على الذاكرة ووقت المعالجة. خاصة مع مجموعات البيانات الكبيرة، يمكن أن تحسن إزالة التكرارات من أداء النظام العام.

سيناريوهات نمطية لإزالة التكرارات

تنظيف البيانات: عند تنظيم البيانات المحصلة من خلال web scraping.
كشف التكرارات: العثور على التكرارات في قوائم مخزون المنتجات أو بيانات تسجيل المستخدمين.
عمليات المصفوفة: عندما تريد إزالة الإدخالات المكررة أثناء تلاعبات قائمة محددة.

غرض هذه المقالة

تشرح هذه المقالة الطرق لإزالة التكرارات من القوائم في Python، من التقنيات الأساسية إلى الأمثلة المتقدمة. سنغطي النهج البسيطة للمبتدئين بالإضافة إلى الطرق التي تحافظ على الترتيب وتأخذ في الاعتبار الأداء. سيساعد هذا القراء على اختيار أفضل طريقة لاحتياجاتهم.

2. كيفية إزالة التكرارات من قائمة باستخدام set

الطريقة الأساسية الأكثر لإزالة التكرارات من قائمة في Python هي استخدام set. set هو نوع بيانات مدمج في Python لا يسمح بالتكرارات. من خلال الاستفادة من هذه الخاصية، يمكنك بسهولة إزالة التكرارات من قائمة.

مثال كود أساسي

يظهر الكود التالي كيفية إزالة العناصر المكررة من قائمة وإنشاء قائمة تحتوي فقط على العناصر الفريدة.

# Original list
my_list = [1, 2, 2, 3, 4, 4, 5]

# Remove duplicates using set
unique_list = list(set(my_list))

print(unique_list)  # Result: [1, 2, 3, 4, 5]

نتائج التنفيذ والشرح

الإدخال : [1, 2, 2, 3, 4, 4, 5]
المخرج : [1, 2, 3, 4, 5] (تم إزالة العناصر المكررة 2 و 4)

في هذا الكود، يتم تحويل القائمة إلى نوع set، الذي يزيل التكرارات تلقائيًا. بعد ذلك، يتم استخدام دالة list() لتحويل set مرة أخرى إلى قائمة.

مزايا استخدام set

بسيطة وحدسية لأنه يمكن تنفيذها بكود موجز، فهي سهلة الفهم للمبتدئين.
سريعة بسبب خصائص set ، يتم إجراء إزالة التكرارات بكفاءة.

تحذيرات عند استخدام set

لا يتم الحفاظ على ترتيب القائمة الأصلية
انظر إلى المثال أدناه.

# Original list
my_list = [4, 3, 4, 2, 1]

# Remove duplicates using set
unique_list = list(set(my_list))

print(unique_list)  # Result: [1, 2, 3, 4]

كما يظهر هذا النتيجة، يمكن أن يعيد استخدام set ترتيب العناصر في القائمة بشكل تعسفي. لذلك، عندما يكون الترتيب مهمًا، يجب النظر في نهج أخرى.

متى تستخدم set

عندما لا يكون الترتيب مهمًا.
عندما تحتاج إلى حل بسيط وسريع.

يشرح القسم التالي بالتفصيل كيفية إزالة التكرارات مع الحفاظ على الترتيب.

3. كيفية إزالة التكرارات مع الحفاظ على الترتيب

عندما تريد إزالة التكرارات من قائمة في Python مع الحفاظ على الترتيب، فإن استخدام set غير كافٍ. لذلك، هنا نقدم طرقًا بديلة تسمح بإزالة التكرارات مع الحفاظ على الترتيب سليمًا. في هذا القسم، سنشرح كيفية استخدام dict.fromkeys() و OrderedDict.

استخدام dict.fromkeys()

منذ Python 3.6، تحافظ القواميس (dict) على ترتيب الإدراج. من خلال الاستفادة من هذه الخاصية، يمكنك إزالة التكرارات من قائمة مع الحفاظ على الترتيب الأصلي.

كود المثال

# Original list
my_list = [4, 3, 4, 2, 1]

# Remove duplicates using dict.fromkeys()
unique_list = list(dict.fromkeys(my_list))

print(unique_list)  # Result: [4, 3, 2, 1]

النتائج والشرح

الإدخال : [4, 3, 4, 2, 1] * الإخراج : [4, 3, 2, 1] يستخدم هذا الكود dict.fromkeys() لتخزين عناصر القائمة كمفاتيح في القاموس. مفاتيح القاموس لا تسمح بالتكرارات، لذا تُزال التكرارات تلقائيًا. ثم، بتحويل مفاتيح القاموس مرة أخرى إلى قائمة، تحصل على النتيجة مع الحفاظ على الترتيب.

المزايا

الحفاظ على الترتيب يمكنك إزالة التكرارات مع الحفاظ على ترتيب القائمة الأصلي.
كود مختصر dict.fromkeys()` فقط، يمكنك تحقيق كل من الحفاظ على الترتيب وإزالة التكرارات.

العيوب

إذا لم تفهم سلوك القواميس الداخلي، قد يبدو هذا صعبًا بعض الشيء للمبتدئين.

استخدام OrderedDict

نهج آخر هو OrderedDict من وحدة collections. هذه الطريقة تسمح أيضًا بإزالة التكرارات من قائمة مع الحفاظ على الترتيب.

مثال على الكود

from collections import OrderedDict

# Original list
my_list = [4, 3, 4, 2, 1]

# Remove duplicates using OrderedDict
unique_list = list(OrderedDict.fromkeys(my_list))

print(unique_list)  # Result: [4, 3, 2, 1]

النتائج والشرح

مثل القواميس العادية، OrderedDict لا يسمح بمح مكررة ويحافظ على الترتيب الذي تُدرج فيه العناصر. وعلى الرغم من تشابهه مع dict.fromkeys()، فإنه يعمل بشكل موثوق بغض النظر عن نسخة بايثون.

المزايا

متوافق للغاية يحافظ على الترتيب حتى في إصدارات بايثون الأقدم من 3.6.
موثوق للغاية يدعم OrderedDict الحفاظ على الترتيب عن قصد، لذا فهو طريقة أكثر تأكيدًا.

العيوب

يتطلب الاستيراد من المكتبة القياسية.
أكثر تعقيدًا قليلاً مقارنةً بـ dict.fromkeys() .

مقارنة الأداء

فيما يلي مقارنةداء عند استخدام dict.fromkeys() و OrderedDict.

مثال على الكود

import time
from collections import OrderedDict

# Large dataset
large_list = [i for i in range(100000)] + [i for i in range(100000)]

# Performance of dict.fromkeys()
start = time.time()
unique_list1 = list(dict.fromkeys(large_list))
print(f"dict.fromkeys() processing time: {time.time() - start:.6f} seconds")

# Performance of OrderedDict
start = time.time()
unique_list2 = list(OrderedDict.fromkeys(large_list))
print(f"OrderedDict processing time: {time.time() - start:.6f} seconds")

النتائج (مثال)

dict.fromkeys() processing time: 0.014561 seconds
OrderedDict processing time: 0.018437 seconds

dict.fromkeys() أسرع قليلاً.
OrderedDict مفيد عندما تكون التوافقية أو الموثوقية مهمة.

متى تستخدم هذه الأساليب

عندما يكون الترتيب مهمًا.
عندما تريد تحقيق الحفاظ على الترتيب وإزالة التكرارات في آن واحد.
عند مراعاة إصدارات بايثون أو التوافق المستقبلي.

4. طرق متقدمة لإزالة التكر القوائم

يمكن لبايثون التعامل مع حالات أكثر تعقيدًا لا تستطيع تقنيات إزالة التكرارات الأساسية معالجتها. يشرح هذا القسم إزالة التكرارات للقوائم ذات البعدين وإزالة التكرارات الشرطية.

كيفية إزالة التكرارات في القوائم ذات البعدين

في القوائم ذات البعدين (هيكل حيث تحتوي قائمة على قوائم أخرى)، لا يمكنك استخدام set أو dict.fromkeys() المعتاد مباشرة. ذلك لأن القوائم قابلة للتغيير، لذا لا يمكن استخدامها كمفاتيح في set أو كمفاتيح في القاموس.

الطريقة: استخدام tuples

عن طريق تحويل القوائم مؤقتًا إلى tuples، يمكنك الاستفادة من set لإزالة التكرارات حتى في القوائم ذات البعدين.

مثال على الكود

# Original two-dimensional list
nested_list = [[1, 2], [3, 4], [1, 2]]

# Remove duplicates
unique_list = [list(x) for x in set(tuple(x) for x in nested_list)]

print(unique_list)  # Result: [[1, 2], [3, 4]]

نتائج التنفيذ والشرح

الإدخال : [[1, 2], [3, 4], [1, 2]]
الإخراج : [[1, 2], [3, 4]]

في هذا الكود، يتم تحويل كل قائمة داخلية في القائمة ثنائية الأبعاد مؤقتًا إلى tuple وتخزينها في set لإزالة التكرارات. بعد ذلك، يتم تحويل النتائج مرة أخرى إلى قوائم.

المزايا

يسمح بإزالة التكرارات في القوائم ثنائية الأبعاد بطريقة موجزة.
مرن في الاستخدام لأنه يمكنك التحويل مرة أخرى إلى الهيكل الأصلي (القوائم).

العيوب

قد يكون من الصعب تطبيق هذه الطريقة إذا كانت القوائم الداخلية متداخلة بشكل أكبر وأكثر تعقيدًا.

كيفية إجراء إزالة تكرارات مشروطة

يمكنك أيضًا إزالة التكرارات فقط عندما تتحقق شروط معينة بناءً على عناصر القائمة. على سبيل المثال، النظر في إزالة التكرارات في قائمة من القواميس عندما تكون قيمة مفتاح محدد متطابقة.

مثال على الكود

فيما يلي مثال يزيل التكرارات بحيث تكون القواميس في القائمة فريدة بناءً على قيمة مفتاح "id".

# Original list (list of dictionaries)
data_list = [
    {"id": 1, "name": "Alice"},
    {"id": 2, "name": "Bob"},
    {"id": 1, "name": "Alice"},
    {"id": 3, "name": "Charlie"}
]

# Remove duplicates based on the id key
unique_list = list({item["id"]: item for item in data_list}.values())

print(unique_list)
# Result: [{'id': 1, 'name': 'Alice'}, {'id': 2, 'name': 'Bob'}, {'id': 3, 'name': 'Charlie'}]

نتائج التنفيذ والشرح

الإدخال : [{"id": 1, "name": "Alice"}, {"id": 2, "name": "Bob"}, {"id": 1, "name": "Alice"}, {"id": 3, "name": "Charlie"}]
الإخراج : [{'id': 1, 'name': 'Alice'}, {'id': 2, 'name': 'Bob'}, {'id': 3, 'name': 'Charlie'}]

في هذا الكود، يتم تحويل قائمة القواميس مؤقتًا إلى أشكال قابلة للاستخدام كمفاتيح لإزالة التكرارات. بعد ذلك، يتم استعادة الهيكل الأصلي للبيانات إلى قائمة باستخدام طريقة values().

المزايا

يمكن إزالة التكرارات المرنة بناءً على شروط تعسفية.
يمكن تطبيقه على القواميس وهياكل البيانات المعقدة الأخرى.

العيوب

قد يكون الكود معقدًا إلى حد ما، مما قد يكون صعبًا على المبتدئين.

حالات الاستخدام: إزالة التكرارات في تحليل البيانات

هذه الطرق مفيدة بشكل خاص في تحليل البيانات وتنظيف البيانات. على سبيل المثال، يمكن تطبيقها في سيناريوهات مثل:

إزالة السجلات المكررة التي تحمل نفس معرف المستخدم.
تنظيف التكرارات التي تنشأ عند دمج مصادر بيانات متعددة.
إنشاء مجموعة بيانات فريدة بناءً على قيم عمود محدد.

متى تستخدم الطرق المتقدمة

إزالة التكرارات في القوائم ثنائية الأبعاد أو قوائم القواميس.
عندما تحتاج إلى إزالة التكرارات بناءً على شروط محددة.
عند إعداد وتنظيف البيانات كخطوة معالجة مسبقة للتحليل.

5. مقارنة الأداء

عند إزالة التكرارات من قائمة في Python، يختلف الأداء (سرعة التنفيذ واستخدام الذاكرة) اعتمادًا على الطريقة المستخدمة. يقارن هذا القسم أداء الطرق التمثيلية ويأخذ في الاعتبار حالات الاستخدام المناسبة لها.

الطرق المقارنة ومعايير التقييم

الطرق المقارنة

الطريقة باستخدام set
الطريقة باستخدام dict.fromkeys()
الطريقة باستخدام OrderedDict

معايير التقييم

سرعة المعالجة (وقت التنفيذ اعتمادًا على حجم البيانات)
استخدام الذاكرة (الكفاءة عند معالجة كميات كبيرة من البيانات)

اختبارات المعيار باستخدام كود حقيقي

يُستخدم الكود التالي لقياس سرعة تنفيذ كل طريقة.

مثال على كود المعيار

import time
from collections import OrderedDict

# Creating a large dataset
large_list = [i for i in range(100000)] + [i for i in range(50000)]

# When using set
start_time = time.time()
unique_set = list(set(large_list))
print(f"set processing time: {time.time() - start_time:.6f} seconds")

# When using dict.fromkeys()
start_time = time.time()
unique_dict = list(dict.fromkeys(large_list))
print(f"dict.fromkeys() processing time: {time.time() - start_time:.6f} seconds")

# When using OrderedDict
start_time = time.time()
unique_ordered_dict = list(OrderedDict.fromkeys(large_list))
print(f"OrderedDict processing time: {time.time() - start_time:.6f} seconds")

مثال نتائج اختبار الأداء

فيما يلي مثال على نتائج زمن التنفيذ باستخدام مجموعة بيانات كبيرة (150,000 عنصر أو أكثر):

set processing time: 0.012345 seconds
dict.fromkeys() processing time: 0.016789 seconds
OrderedDict processing time: 0.018234 seconds

مناقشة النتائج

set الأسرع والأكثر كفاءة. مناسب عندما لا يكون الحفاظ على الترتيب ضروريًا.
dict.fromkeys() أبطأ قليلاً من set، لكنه مفيد جدًا عندما تحتاج إلى الحفاظ على الترتيب.
OrderedDict سرعته في التنفيذ تقريبًا مماثلة لـ dict.fromkeys()، لكنه يُستخدم عندما تكون التوافقية مع إصدارات بايثون قبل 3.6 مصدر قلق.

مقارنة استهلاك الذاكرة

فيما يلي مقارنة مختصرة لكفاءة استهلاك الذاكرة لكل طريقة.

طريقة	كفاءة الذاكرة	الخصائص
باستخدام `set`	عالي	مثالي للبيانات ذات الأحجام الكبيرة جدًا.
باستخدام `dict.fromkeys()`	متوسط	توازن جيد بين الحفاظ على الترتيب والكفاءة.
باستخدام `OrderedDict`	قليلًا منخفضًا	يُستخدم في السيناريوهات التي تعطي الأولوية للتوافق.

نقاط رئيسية لاختيار الطريقة المناسبة

متى تختار set

عندما لا يكون ترتيب البيانات مهمًا.
عندما تريد إعطاء الأولوية لسرعة التنفيذ.
عند التعامل مع بيانات على نطاق واسع.

متى تختار dict.fromkeys()

عندما تريد إزالة التكرارات مع الحفاظ على ترتيب البيانات.
عندما تفضل كتابة كود بسيط.

متى تختار OrderedDict

عندما تحتاج إلى الحفاظ على الترتيب ولكن أيضًا تريد أن يعمل على إصدارات بايثون أقدم من 3.6.
عند التعامل مع كود قديم أو أنظمة تراثية.

خيارات عملية

اعتمادًا على السيناريو الفعلي، يمكنك الاختيار كما يلي:

إعطاء الأولوية للسرعة في تنظيف البيانات : set
الحفاظ على الترتيب لتحليل البيانات : dict.fromkeys()
مشاريع طويلة الأمد تتطلب التوافق : OrderedDict

6. الأسئلة المتكررة (FAQ)

يجيب هذا القسم على الأسئلة الشائعة التي قد يطرحها القراء عند إزالة التكرارات من القوائم في بايثون. يتم شرح كل سؤال بناءً على برامج حقيقية وأمثلة عملية.

1. لماذا لا يحافظ `set` على الترتيب؟

set هو بنية بيانات لا تحافظ على الترتيب.
set هو أحد الأنواع المدمجة في بايثون التي لا تسمح بالتكرارات ولكنها لا تحتفظ بمعلومات الترتيب. لذلك، إذا كنت بحاجة إلى الحفاظ على ترتيب القائمة الأصلي، يجب عليك استخدام dict.fromkeys() أو OrderedDict، من بين خيارات أخرى.

الحل

# Preserve order using dict.fromkeys()
my_list = [4, 3, 4, 2, 1]
unique_list = list(dict.fromkeys(my_list))
print(unique_list)  # Result: [4, 3, 2, 1]

2. هل يمكنني إزالة التكرارات من قائمة ثنائية الأبعاد مع الحفاظ على الترتيب؟

نعم، هذا ممكن. ومع ذلك، نظرًا لأن عناصر القائمة الثنائية الأبعاد هي قوائم داخل قائمة، لا يمكنك استخدام set مباشرة. بدلاً من ذلك، يمكنك التعامل مع ذلك عن طريق تحويلها مؤقتًا إلى tuples.

الحل

فيما يلي مثال على إزالة التكرارات من قائمة ثنائية الأبعاد مع الحفاظ على الترتيب.

# Original two-dimensional list
nested_list = [[1, 2], [3, 4], [1, 2], [5, 6]]

# Remove duplicates while preserving order
unique_list = []
[unique_list.append(x) for x in nested_list if x not in unique_list]

print(unique_list) # Result: [[1, 2], [3, 4], [5, 6]]

3. كيف يمكنني إزالة التكرارات بفعالية في مجموعات البيانات الكبيرة؟

عند التعامل مع مجموعات بيانات كبيرة، يعتبر استخدام set هو الأكثر كفاءة. يستخدم set داخليًا جدول تجزئة (hash table)، مما يسمح بالبحث عن العناصر وتخزينها بسرعة.

الحل

# Large dataset
large_list = [i for i in range(100000)] + [i for i in range(50000)]

# Remove duplicates using set
unique_list = list(set(large_list))
print(len(unique_list))  # Result: 100000 (number of unique elements)

ملاحظات

بما أن الترتيب غير محفوظ، فكر في طريقة أخرى إذا كان الترتيب مهمًا.
إذا أصبح استهلاك الذاكرة مفرطًا، فكر في أساليب توفير الذاكرة.

4. هل من الممكن إزالة التكرارات بناءً على جزء من القائمة؟

نعم، هذا ممكن. إذا كانت القائمة تتكون من عناصر قاموس، يمكنك استخراج القيم الفريدة بناءً على مفتاح محدد.

الحل

# List of dictionaries
data_list = [
    {"id": 1, "name": "Alice"},
    {"id": 2, "name": "Bob"},
    {"id": 1, "name": "Alice"},
    {"id": 3, "name": "Charlie"}
]

# Remove duplicates based on the id key
unique_list = list({item["id"]: item for item in data_list}.values())

print(unique_list)
# Result: [{'id': 1, 'name': 'Alice'}, {'id': 2, 'name': 'Bob'}, {'id': 3, 'name': 'Charlie'}]

5. هل يجب أن أُولي اهتمامًا لتوافق الإصدارات المختلفة من بايثون؟

بدءًا من بايثون 3.6، يحتفظ dict بالترتيب. لذلك، كن حذرًا بشأن إصدار بايثون الخاص بك عند استخدام dict.fromkeys(). إذا كنت بحاجة إلى الحفاظ على الترتيب في بايثون 3.5 أو أقدم، يجب عليك استخدام OrderedDict.

الحل (لإصدارات بايثون 3.5 وأقدم)

from collections import OrderedDict

# Preserve order using OrderedDict
my_list = [4, 3, 4, 2, 1]
unique_list = list(OrderedDict.fromkeys(my_list))
print(unique_list)  # Result: [4, 3, 2, 1]

6. ما هي الأسباب المحتملة عندما لا تعمل إزالة التكرارات بشكل صحيح؟

إذا لم تعمل إزالة التكرارات بشكل صحيح، تحقق من التالي:

أنواع العناصر القابلة للتغيير في القائمة لا يمكن استخدام القوائم والقواميس كمفاتيح في set، مما قد يسبب أخطاء. حوّلها إلى tuples إذا لزم الأمر.
توافق إصدار بايثون تأكد من أن الأساليب التي تستخدمها مدعومة في إصدار بايثون الخاص بك.
تحديد الشرط بشكل غير صحيح إذا كنت تقوم بإزالة التكرارات تحت شروط معينة، قد لا يكون الشرط محددًا بشكل صحيح.

ملخص الأسئلة المتكررة

إذا كنت تريد الحفاظ على الترتيب: استخدم dict.fromkeys() أو OrderedDict.
للتعامل بكفاءة مع مجموعات بيانات كبيرة: استخدم set.
إزالة التكرارات بناءً على شرط: استخدم القواميس أو تعبيرات القائمة.

من خلال فهم هذه الأساليب واختيار الأنسب، يمكنك حل المشكلات المتعلقة بعمليات القوائم.

7. الملخص

هناك طرق متعددة لإزالة التكرارات من القوائم في بايثون، تتراوح من البسيطة إلى المتقدمة. لكل طريقة مزاياها وعيوبها، لذا من المهم اختيار الأنسب بناءً على احتياجاتك الخاصة والسيناريو.

الطرق الأساسية

الطريقة باستخدام set هي الأبسط والأسرع. لها الخصائص التالية:

المزايا: الشيفرة قصيرة والتنفيذ سريع.
العيوب: الترتيب غير محفوظ.
حالات الاستخدام: الأفضل عندما لا يكون الترتيب مهمًا أو لمعالجة مجموعات بيانات كبيرة بكفاءة.

my_list = [1, 2, 2, 3, 4, 4]
unique_list = list(set(my_list))
print(unique_list)  # Result: [1, 2, 3, 4]

طرق الحفاظ على الترتيب

**dict.fromkeys()** و OrderedDict يتيحان لك إزالة التكرارات مع الحفاظ على الترتيب. هذه الأساليب مناسبة عندما يكون ترتيب البيانات مهمًا.

dict.fromkeys() (بايثون 3.6 وما بعده)

my_list = [4, 3, 4, 2, 1]
unique_list = list(dict.fromkeys(my_list))
print(unique_list)  # Result: [4, 3, 2, 1]

OrderedDict (متاح في بايثون 3.5 وأقدم)

from collections import OrderedDict
my_list = [4, 3, 4, 2, 1]
unique_list = list(OrderedDict.fromkeys(my_list))
print(unique_list)  # Result: [4, 3, 2, 1]

الأساليب المتقدمة

القوائم الثنائية الأبعاد وإزالة التكرارات بناءً على شرط يمكن أن تعالج سيناريوهات أكثر تعقيدًا.

بالنسبة للقوائم ذات البعدين، يمكن تحويل العناصر مؤقتًا إلى tuples واستخدام set .
بالنسبة للقوائم التي تحتوي على قواميس، يمكنك إزالة التكرارات بناءً على مفتاح محدد.

# Two-dimensional list
nested_list = [[1, 2], [3, 4], [1, 2]]
unique_list = [list(x) for x in set(tuple(x) for x in nested_list)]
print(unique_list)  # Result: [[1, 2], [3, 4]]

# Conditional duplicate removal
data_list = [
    {"id": 1, "name": "Alice"},
    {"id": 2, "name": "Bob"},
    {"id": 1, "name": "Alice"}
]
unique_list = list({item["id"]: item for item in data_list}.values())
print(unique_list)  # Result: [{'id': 1, 'name': 'Alice'}, {'id': 2, 'name': 'Bob'}]

مقارنة الأداء

سرعة المعالجة واستخدام الذاكرة لكل طريقة تختلف حسب حجم البيانات والمتطلبات. أدناه ملخص.

طريقة	سرعة	يحافظ على النظام	حالات الاستخدام
باستخدام `set`	سريع	×	البيانات الكبيرة، عندما لا يكون الترتيب مهمًا
باستخدام `dict.fromkeys()`	سرعة متوسطة	○	عندما يكون الترتيب مهمًا
باستخدام `OrderedDict`	سرعة متوسطة	○	يحافظ على الترتيب في إصدارات بايثون الأقدم

كيفية اختيار الطريقة

إذا كنت بحاجة إلى معالجة بسيطة وسريعة : استخدم set .
إذا كنت تريد الحفاظ على الترتيب : استخدم dict.fromkeys() أو OrderedDict .
في الحالات المتقدمة (هياكل بيانات معقدة أو إزالة شرطية) : استخدم تحويل إلى tuple أو تعبيرات القائمة (list comprehensions).

رسالة للقراء

باستخدام الطرق التي تم تقديمها في هذه المقالة، يمكنك إزالة التكرارات من القوائم في بايثون بفعالية. اختر النهج الأنسب بناءً على خصائص بياناتك وأهدافك، وحاول تطبيقه في مشاريع أو تحليلات حقيقية.

آمل أن تكون هذه المقالة مفيدة لمن يتعلمون بايثون أو لأي شخص يحتاج إلى التعامل مع القوائم. إذا كان لديك أسئلة إضافية أو حالات خاصة، نرحب بتعليقاتك وملاحظاتك!

Prev

دليل شامل للمشغلات المنطقية في بايثون: and, or, not
Next
記事がありません

بايثون للمبتدئين: كيفية إزالة التكرارات من القوائم

1. لماذا تحتاج إلى إزالة التكرارات من القوائم في Python

لماذا يجب عليك إزالة التكرارات من القوائم

سيناريوهات نمطية لإزالة التكرارات

غرض هذه المقالة

2. كيفية إزالة التكرارات من قائمة باستخدام set

مثال كود أساسي

نتائج التنفيذ والشرح

مزايا استخدام set

تحذيرات عند استخدام set

متى تستخدم set

3. كيفية إزالة التكرارات مع الحفاظ على الترتيب

استخدام dict.fromkeys()

كود المثال

النتائج والشرح

المزايا

العيوب

استخدام OrderedDict

مثال على الكود

النتائج والشرح

المزايا

العيوب

مقارنة الأداء

مثال على الكود

النتائج (مثال)

متى تستخدم هذه الأساليب

4. طرق متقدمة لإزالة التكر القوائم

كيفية إزالة التكرارات في القوائم ذات البعدين

الطريقة: استخدام tuples

مثال على الكود

نتائج التنفيذ والشرح

المزايا

العيوب

كيفية إجراء إزالة تكرارات مشروطة

مثال على الكود

نتائج التنفيذ والشرح

المزايا

العيوب

حالات الاستخدام: إزالة التكرارات في تحليل البيانات

متى تستخدم الطرق المتقدمة

5. مقارنة الأداء

الطرق المقارنة ومعايير التقييم

اختبارات المعيار باستخدام كود حقيقي

مثال على كود المعيار

مثال نتائج اختبار الأداء

مناقشة النتائج

مقارنة استهلاك الذاكرة

نقاط رئيسية لاختيار الطريقة المناسبة

خيارات عملية

6. الأسئلة المتكررة (FAQ)

1. لماذا لا يحافظ set على الترتيب؟

الحل

2. هل يمكنني إزالة التكرارات من قائمة ثنائية الأبعاد مع الحفاظ على الترتيب؟

الحل

3. كيف يمكنني إزالة التكرارات بفعالية في مجموعات البيانات الكبيرة؟

الحل

ملاحظات

4. هل من الممكن إزالة التكرارات بناءً على جزء من القائمة؟

الحل

5. هل يجب أن أُولي اهتمامًا لتوافق الإصدارات المختلفة من بايثون؟

الحل (لإصدارات بايثون 3.5 وأقدم)

6. ما هي الأسباب المحتملة عندما لا تعمل إزالة التكرارات بشكل صحيح؟

ملخص الأسئلة المتكررة

7. الملخص

الطرق الأساسية

طرق الحفاظ على الترتيب

الأساليب المتقدمة

مقارنة الأداء

كيفية اختيار الطريقة

رسالة للقراء

دليل شامل للمشغلات المنطقية في بايثون: and, or, not

1. لماذا لا يحافظ `set` على الترتيب؟