This post is also available in: English (الإنجليزية)
ينتشر التعلم الآلي (ML) والذكاء الاصطناعي (AI) عبر مختلف الصناعات، وقد بدأت معظم الشركات في الاستثمار بنشاط في هذه التقنيات. مع توسع حجم البيانات وتعقيدها ، يوصى على نطاق واسع باستخدام ML و AI لتحليلها ومعالجتها. يوفر الذكاء الاصطناعي رؤى وتوقعات أكثر دقة لتعزيز كفاءة الأعمال وزيادة الإنتاجية وخفض تكاليف الإنتاج.
المكتبات في لغات البرمجة هي مجموعات من التعليمات البرمجية المكتوبة مسبقًا والتي يمكن للمستخدمين استخدامها لتحسين مهامهم. يستخدم المطورون مكتبات Python للذكاء الاصطناعي والتعلم الآلي لأداء مهام معقدة دون الحاجة إلى إعادة كتابة الكود.
مكتبات Python لـ AI و ML
في الواقع ، أحد الأسباب الرئيسية وراء نمو شعبية التعلم الآلي بشكل كبير هو التعلم الآلي ومكتبات التعلم العميق. يرجع السبب في تفضيل مكتبات Python لتطوير نماذج التعلم الآلي المتطورة والتعلم العميق إلى الجمع المثالي بين وقت التطوير الأقصر ، وبناء الجملة المتسق ، والمرونة. فيما يلي مكتبات Python الأكثر شيوعًا وشعبية لـ AI و ML.
1. TensorFlow
TensorFlow هي مكتبة برامج مجانية ومفتوحة المصدر تستخدم بشكل أساسي في البرمجة التفاضلية. إنها مكتبة للرياضيات تستخدمها تطبيقات التعلم الآلي والشبكات العصبية. يساعد في إجراء الحسابات العددية المتطورة.
بينما تم تطوير TensorFlow بشكل أساسي بواسطة فريق Brain من Google للاستخدام الداخلي ، تم إصداره للجمهور في نوفمبر 2015 ، بموجب ترخيص Apache 2.0. يمكن تشغيله على عدد كبير من الأنظمة الأساسية بما في ذلك وحدات معالجة الرسومات ووحدات المعالجة المركزية ووحدات المعالجة المركزية (وحدة معالجة Tensor ، وهي شريحة أجهزة تم إنشاؤها باستخدام TensorFlow).
يمكن لـ TensorFlow التعامل مع الشبكات العصبية العميقة للتعرف على الصور ، وتصنيف الأرقام المكتوبة بخط اليد ، والشبكات العصبية المتكررة ، و NLP (معالجة اللغة الطبيعية) ، وتضمين الكلمات ، و PDE (المعادلة التفاضلية الجزئية). تضمن TensorFlow Python دعمًا معماريًا ممتازًا للسماح بنشر العمليات الحسابية بسهولة عبر مجموعة واسعة من الأنظمة الأساسية ، بما في ذلك أجهزة الكمبيوتر المكتبية والخوادم والأجهزة المحمولة.
التجريد هو الميزة الرئيسية لـ TensorFlow Python في التعلم الآلي ومشاريع الذكاء الاصطناعي تتيح هذه الميزة للمطورين التركيز على المنطق الشامل للتطبيق بدلاً من التعامل مع التفاصيل الدنيوية لتنفيذ الخوارزميات. مع هذه المكتبة ، يمكن لمطوري Python الآن الاستفادة من الذكاء الاصطناعي والتعلم الآلي بسهولة لإنشاء تطبيقات متجاوبة فريدة ، والتي تستجيب لإدخالات المستخدم مثل تعبيرات الوجه أو الصوت.
فيما يلي ميزات TensorFlow:
- مكتبة مفتوحة المصدر: هي مكتبة مفتوحة المصدر تتيح إجراء عمليات حسابية سهلة وسريعة في التعلم الآلي. يسهل تحويل الخوارزميات من أداة إلى أداة TensorFlow أخرى. بمساعدة Python ، فإنه يوفر واجهة برمجة التطبيقات الأمامية لتطوير مختلف الآلات وخوارزميات التعلم العميق.
- سهل التشغيل: يمكننا تنفيذ تطبيقات TensorFlow على منصات مختلفة مثل Android و Cloud و IOS والعديد من البنى مثل وحدات المعالجة المركزية ووحدات معالجة الرسومات. هذا يسمح بتنفيذها على العديد من الأنظمة الأساسية المضمنة. تمتلك TensorFlow أجهزتها المصممة لتدريب النماذج العصبية المعروفة باسم Cloud TPUs (وحدة معالجة TensorFlow)
- التصحيح السريع: يسمح لك بعكس كل عقدة ، أي عملية فردية تتعلق بتقييمها. يعمل Tensor Board مع الرسم البياني لتصور عمله باستخدام لوحة القيادة الخاصة به. يوفر طرق الرسوم البيانية الحسابية التي تدعم نموذج سهل التنفيذ.
- فعال: يعمل مع مصفوفات متعددة الأبعاد بمساعدة موتر بنية البيانات التي تمثل الحواف في الرسم البياني الانسيابي. يحدد Tensor كل بنية باستخدام ثلاثة معايير: الترتيب ، النوع ، الشكل.
- قابلة للتطوير: توفر مساحة للتنبؤ بالمخزونات والمنتجات وما إلى ذلك بمساعدة التدريب باستخدام نفس النماذج ومجموعات البيانات المختلفة. كما أنه يسمح بتقنيات التعلم المتزامن وغير المتزامن واستيعاب البيانات. النهج الرسومي يؤمن تنفيذ التوازي الموزع.
- سهولة التجربة: يحول TensorFlow البيانات الأولية إلى المقدرات – وهي شكل من أشكال البيانات التي تفهمها الشبكات العصبية تسمح أعمدة ميزات TensorFlow بالجسر بين البيانات الأولية والمقدرات لتدريب النموذج. هذا يضيف خفة الحركة إلى النموذج للحصول على رؤى تطورية سريعة.
- التجريد: يوفر TensorFlow مستوى محددًا من التجريد عن طريق تقليل طول الكود وتقليل وقت التطوير. يحتاج المستخدم إلى التركيز على المنطق بغض النظر عن الطريقة الصحيحة لتوفير مدخلات للوظائف. يمكن للمستخدم اختيار النموذج وفقًا لمتطلبات النظام.
- المرونة:يوفر TensorFlow عملية حل الهياكل المعقدة بدعم من Keras API وخطوط إدخال البيانات. يوفر Keras نماذج أولية سهلة ويناسب بشكل أفضل الشبكات العصبية الموجهة للكائنات. يعمل TensorFlow على تسهيل آلية التعلم الآلي بمساعدة مثل هذه الخصائص. يسمح للمستخدم بإنشاء النظام ومعالجته لإنشاء أنواع مختلفة من نماذج الوقت الفعلي.
2. Keras
Keras هي المكتبة الأكثر فائدة للتعلم العميق. إنه يعمل على قمة TensorFlow و Theano. يركز على التجريب السريع وهو عبارة عن مكتبة شبكة عصبية. تستخدم Keras TensorFlow و Theano كخلفية لها. Keras هي مكتبة Python مفتوحة المصدر رائدة مكتوبة لإنشاء الشبكات العصبية ومشاريع التعلم الآلي. يمكن تشغيله على Deeplearning4j أو MXNet أو Microsoft Cognitive Toolkit (CNTK) أو Theano أو TensorFlow. يوفر جميع الوحدات المستقلة تقريبًا بما في ذلك المحسّنات والطبقات العصبية ووظائف التنشيط وخطط التهيئة ووظائف التكلفة وخطط التنظيم. يجعل من السهل إضافة وحدات جديدة تمامًا مثل إضافة وظائف وفئات جديدة. نظرًا لأن النموذج محدد بالفعل في الكود ، فلن تحتاج إلى أن يكون لديك ملف تكوين نموذج منفصل.
يجعل Keras من السهل على المبتدئين في التعلم الآلي تصميم وتطوير شبكة عصبية. تتعامل Keras Python أيضًا مع الشبكات العصبية الالتفافية. يتضمن خوارزميات للتطبيع ، والمحسن ، وطبقات التنشيط. بدلاً من أن تكون مكتبة تعلم الآلة بلغة Python من طرف إلى طرف ، تعمل Keras كواجهة سهلة الاستخدام وقابلة للتوسيع تعمل على تحسين الوحدات النمطية
فيما يلي السمات البارزة لـ Keras:
- نمطية: Keras معيارية. يعتبر نموذجًا في شكل رسم بياني أو تسلسل. يسمح لك Keras بحفظ النموذج الذي تعمل عليه. يوفر Keras طريقة save () لحفظ النموذج الحالي. يمكنك حتى استخدام النموذج في المستقبل.
- مجموعة بيانات كبيرة: تحتوي Keras على مجموعة بيانات كبيرة محددة مسبقًا. يوفر لك مجموعة متنوعة من مجموعات البيانات. يمكنك استخدام مجموعة البيانات هذه لاستيرادها وتحميلها مباشرة. لنفترض ، IMDB DATA. يحتوي على حوالي 25 ألف مراجعة للأفلام. تحتوي مجموعة البيانات هذه على أرقام ثنائية (0 يمثل 0 المشاعر السلبية ويمثل الرقم 1 المشاعر الإيجابية.
- تدريب من NumPy Data: يستخدم Keras مصفوفة NumPy لتدريب النموذج وتقييمه. تستخدم طرfit() الملائمة. تناسب fit() النموذج مع بيانات التدريب. قد تستغرق هذه العملية التدريبية بعض الوقت. تحتوي طريقة fit () على ثلاث وسائط حجم_الجمعة وبيانات_التحقق من الصحة والعهود
- التقييم والتنبؤ: قامت Keras بتقييم () وتوقع () الأساليب. يمكن أن تستخدم هذه الطرق مجموعة بيانات NumPy. بعد اختبار البيانات ، يتم تقييم النتيجة. تستخدم هذه الأساليب لتقييم نماذجنا.
- نماذج مدربة مسبقًا في Keras: تحتوي Keras على عدد من النماذج المدربة مسبقًا. يمكن استيراد هذه النماذج من keras.applications. هذه النماذج مفيدة لاستخراج الميزات وضبطها. تطبيق Keras هو وحدة تحتوي على أوزان لتصنيف الصور مثل VGG16 و VGG19 و Xception وما إلى ذلك.
- التشفير في Keras:Karas يسمح لك بترميز الميزات. توجد وظيفة one_hot () في Keras تتيح التشفير. يساعدك على ترميز الأعداد الصحيحة في خطوة واحدة. كما أنه يمكّنك من ترميز البيانات. تقوم هذه الوظيفة بتصفية المسافات البيضاء ، وجعل النص بأحرف صغيرة ، وتصفية علامات الترقيم.
- الطبقات في Keras: هناك العديد من الطبقات والمعلمات في Keras. تحتوي جميع طبقات Keras على عدد من الطرق فيها. هذه الطبقات مفيدة لبناء ، تدريب ، تكوين البيانات. الطبقة الكثيفة مفيدة لتنفيذ العمليات. يتم استخدام Flatten لتسطيح المدخلات. التسرب يسمح بالتسرب إلى المدخلات. تساعد إعادة الشكل في إعادة تشكيل الإخراج في شكل معين. يستخدم الإدخال لبدء موتر Keras.
- يمكنك الحصول على مخرجات الطبقة المتوسطة: Keras هي مكتبة سهلة للغاية. يمكّنك من الحصول على الإخراج في وسيط الطبقة. للحصول على مخرجات في المستوى المتوسط ، يمكنك ببساطة إنشاء طبقة جديدة تساعدك في الحصول على المخرجات. وإلا ، يمكنك إنشاء وظيفة Keras التي ستساعدك على إرجاع إخراج طبقة معينة باستخدام مدخلات معينة. ومن ثم ، فإن Keras تجعل من السهل عليك العمل معها.
- Keras هي مكتبة Python-Native:Keras هي مكتبة Python كاملة. يستخدم كل المفاهيم المعروفة لبايثون. إنها مكتبة مكتوبة بلغة بايثون. نظرًا لأن Keras موجهة نحو Python ، فإنها توفر لك بيئة سهلة الاستخدام. يمكنك تطبيق Keras بمعرفة أساسيات Python. لذلك ، من السهل جدًا العمل مع Keras.
- المعالجة المسبقة للبيانات: يوفر لك Keras العديد من الوظائف للمعالجة المسبقة للبيانات. ImageDataGenerator هي إحدى هذه الطرق. يساعدك على تغيير حجم الصورة وتغيير درجتها وقلب الصورة وتغيير ارتفاع الصورة وعرضها وما إلى ذلك.
3. Theano
Theano هي مكتبة Python تُستخدم بشكل رئيسي للحساب الرقمي السريع ويمكن تشغيلها على كل من GPU و CPU. نظرًا لأنه مبني على NumPy ، فإن Theano مدمج بإحكام مع NumPy وله واجهة مماثلة أيضًا. المكتبة مثالية لمعالجة وتقييم التعبيرات الرياضية وكذلك حسابات المصفوفة. باستخدام Theano ، يمكنك إجراء عمليات حسابية كثيفة البيانات تصل إلى 140 مرة أسرع. كما أن لديها أدوات مدمجة للتحقق من الصحة واختبار الوحدة ، مما يسهل تجنب أي مشاكل أو أخطاء.
في جوهرها ، هي مكتبة حوسبة علمية معروفة تسمح لك بتعريف وتحسين وتقييم التعبيرات الرياضية ، التي تتعامل مع المصفوفات متعددة الأبعاد. إن أساس العديد من تطبيقات ML و AI هو الحساب المتكرر لتعبير رياضي صعب. يتيح لك Theano إجراء عمليات حسابية كثيفة البيانات تصل إلى مائة مرة أسرع مما يحدث عند التنفيذ على وحدة المعالجة المركزية الخاصة بك وحدها. بالإضافة إلى ذلك ، فهي مُحسّنة جيدًا لوحدات معالجة الرسومات ، والتي توفر تمايزًا رمزيًا فعالًا وتتضمن إمكانات اختبار التعليمات البرمجية الشاملة.
عندما يتعلق الأمر بالأداء ، فإن Theano هي مكتبة رائعة للتعلم الآلي في Python لأنها تتضمن القدرة على التعامل مع العمليات الحسابية في الشبكات العصبية الكبيرة. يهدف إلى تعزيز وقت التطوير ووقت التنفيذ لتطبيقات ML ، لا سيما في خوارزميات التعلم العميق. عيب واحد فقط من Theano أمام TensorFlow هو أن تركيبه صعب للغاية بالنسبة للمبتدئين.
فيما يلي السمات البارزة لـ Theano:
- التمايز التلقائي: ما عليك سوى تنفيذ الجزء الأمامي (التنبؤ) من النموذج ، وسيقوم Theano تلقائيًا بمعرفة كيفية حساب التدرجات اللونية في نقاط مختلفة ، مما يسمح لك بأداء نزول التدرج لتدريب النموذج.
- استخدام شفاف لوحدة معالجة الرسومات: يمكنك كتابة نفس الرمز وتشغيله إما على وحدة المعالجة المركزية أو وحدة معالجة الرسومات. وبشكل أكثر تحديدًا ، سوف يكتشف Theano أي أجزاء من الحساب يجب نقلها إلى وحدة معالجة الرسومات.
- تحسينات السرعة والاستقرار: سيعيد Theano تنظيم حساباتك داخليًا وتحسينها ، من أجل جعلها تعمل بشكل أسرع وتكون أكثر استقرارًا عدديًا. سيحاول أيضًا تجميع بعض العمليات في كود C ، من أجل تسريع الحساب.
4. PyTorch
PyTorch هي مكتبة تعليمية عميقة تستخدمها تطبيقات مثل معالجة اللغة الطبيعية ورؤية الكمبيوتر. تم تطويره بواسطة Facebook ، وهو مفتوح المصدر ومجاني وتم إصداره بموجب ترخيص BSD المعدل. تعتمد مكتبة Python للذكاء الاصطناعي والتعلم الآلي على مكتبة Torch ، وهذه هي الطريقة التي تحصل بها على اسمها. يمكن دمج PyTorch بسهولة مع مكدسات علوم بيانات Python الأخرى ، كما أنها تساعد المطورين في إجراء عمليات حسابية على أجهزة التوتر.
PyTorch عبارة عن مكتبة للتعلم الآلي من Python جاهزة للإنتاج مع أمثلة وتطبيقات وحالات استخدام ممتازة يدعمها مجتمع قوي. تمتص هذه المكتبة تسريع GPU القوي وتمكنك من تطبيقه من تطبيقات مثل NLP. نظرًا لأنه يدعم حسابات GPU و CPU ، فإنه يوفر لك تحسين الأداء والتدريب الموزع القابل للتطوير في البحث والإنتاج. الشبكات العصبية العميقة وحساب Tensor مع تسريع GPU هما ميزتان متطورتان في PyTorch. يتضمن مترجمًا للتعلم الآلي يسمى Glow يعزز أداء أطر التعلم العميق.
يمكن لإطار PyTorch القوي والسلس إنشاء رسوم بيانية حسابية دقيقة يمكن تغييرها حتى أثناء وقت التشغيل. تقدم المكتبة أيضًا دعمًا للمعالجات الأولية المبسطة والعديد من وحدات معالجة الرسومات ومحمل البيانات المخصصة.
اتباع ميزات PyTorch:
- PyTorch سريع: تقدم PyTorch تجربة سريعة ومرنة بالإضافة إلى إنتاج منظم جيدًا من خلال تدريب متقاطع متقاطع ونظام أدوات إلى جانب المكتبات. تمتلك معظم مكتبات Python المتقدمة نطاق تغيير مجال التعلم العميق.
- إنه مفتوح المصدر: PyTorch هي من بنات أفكار مجموعة أبحاث الذكاء الاصطناعي في Facebook. إنها حزمة مفتوحة المصدر لـ Python ، والتي تخول تبادل الشبكة العصبية مع التركيز بشكل أساسي على التعلم الآلي العميق. قبل التعمق في طريقة البرمجة ، اسمحوا لي أن أوضح الميزات الخاصة لـ Pytorch. ها نحن ذا
- المرونة: PyTorch عبارة عن مكتبة آلية ، مخطط لها لدمجها في كود Python. يستخدم وحدة معالجة الرياضيات بأقصى حد ممكن ، جنبًا إلى جنب مع وحدة المعالجة الرسومية.
- الاستخدام الأمثل للذاكرة: مع الاستخدام الأمثل للذاكرة المدمجة ، تعمل Pytorch بأقل قدر ممكن من الموارد. كونه برنامج شبكة عصبية ، فإنه يتمتع بميزة على العديد من برامج التعلم الآلي. أجرى الباحثون تعديلات دقيقة على نظام الشبكة العصبية لتسهيل استخدامه. يدعم Pytorch أنواعًا مختلفة من Tensors التي تشبه مصفوفات Numpy مع التركيز الرئيسي على وحدات المعالجة الرسومية.
- إنه يوفر منصة للتعلم العميق: PyTorch هي مكتبة قائمة على Python تم تطويرها لتقديم المرونة كمنصة تطوير للتعلم العميق. تعمل أطر التعلم العميق السائدة الإضافية على الرسوم البيانية حيث يجب إنشاء المخططات الحسابية مسبقًا.
- الرسوم البيانية الديناميكية: توفر الرسوم البيانية الديناميكية الوضوح لعلماء البيانات والمطورين. يوفر PyTorch نهجًا أسهل من TensorFlow. يأتي PyTorch مع العديد من الميزات المفيدة. إحدى هذه الميزات هي استخدام هذه الميزة ، حيث يمكنك بسهولة إجراء ربط أي وحدة.
- بسيط ودقيق: PyTorch دقيق وسهل الاستخدام ويوفر لك فرصة لنشر الرسوم البيانية الحسابية وقتما تشاء.
5. SciKit-Learn
Scikit-Learn هي مكتبة أخرى بارزة لتعلم آلة Python مفتوحة المصدر مع مجموعة واسعة من خوارزميات التجميع والانحدار والتصنيف. DBSCAN ، وتعزيز التدرج ، والغابات العشوائية ، وآلات المتجهات ، والوسائل k هي بعض الأمثلة.
إنه يتميز بمجموعة واسعة من خوارزميات التعلم غير الخاضعة للإشراف والإشراف. إنه مبني على اثنين من مكتبات Python الأساسية – SciPy و NumPy. يحتوي على العديد من خوارزميات التصنيف والتجميع والانحدار المتوفرة فيه مثل الغابات العشوائية والوسائل k وتعزيز التدرج. يمكن أن تساعد المكتبة أيضًا في تقليل الأبعاد والمعالجة المسبقة واختيار النموذج. ينشر المطورون مكتبة Scikit-Learn بشكل أساسي لاستخراج البيانات وتحليلها.
إنها مكتبة ذكاء اصطناعي قابلة للاستخدام تجاريًا. تدعم مكتبة Python هذه كلاً من ML الخاضع للإشراف وغير الخاضع للإشراف. فيما يلي قائمة بالمزايا الرئيسية لـ Scikit-Learn Python التي تجعلها واحدة من مكتبات Python المفضلة للتعلم الآلي:
- التجميع: لتجميع البيانات غير المسماة مثل KMeans.
- التحقق المتبادل: لتقدير أداء النماذج الخاضعة للإشراف على البيانات غير المرئية.
- مجموعات البيانات: لمجموعات بيانات الاختبار ولإنشاء مجموعات بيانات بخصائص محددة للتحقق من سلوك النموذج.
- تقليل الأبعاد: لتقليل عدد السمات في البيانات للتلخيص والتصور واختيار الميزة مثل تحليل المكون الرئيسي.
- طرق التجميع: للجمع بين تنبؤات النماذج المتعددة الخاضعة للإشراف.
- استخراج الميزة: لتحديد السمات في بيانات الصورة والنص.
- اختيار الميزة: لتحديد سمات ذات مغزى يمكن من خلالها إنشاء نماذج خاضعة للإشراف.
- ضبط المعلمة: لتحقيق أقصى استفادة من النماذج الخاضعة للإشراف.
- التعلم المتنوع: لتلخيص وتصوير البيانات المعقدة متعددة الأبعاد.
- النماذج الخاضعة للإشراف: مجموعة واسعة لا تقتصر على النماذج الخطية المعممة ، والتحليل المميز ، والخلايا الساذجة ، والطرق الكسولة ، والشبكات العصبية ، وآلات ناقلات الدعم ، وأشجار القرار.
6. Pandas
في مشاريع التعلم الآلي ، يتم إنفاق قدر كبير من الوقت في إعداد البيانات وكذلك تحليل الاتجاهات الأساسية هذا هو المكان الذي تحظى فيه Python Pandas باهتمام خبراء التعلم الآلي. Python Pandas هي مكتبة مفتوحة المصدر تقدم مجموعة واسعة من الأدوات لمعالجة البيانات باستخدام هذه المكتبة ، يمكنك قراءة البيانات من مجموعة واسعة من المصادر مثل CSV وقواعد بيانات SQL وملفات JSON و Excel.
يمكّنك من إدارة عمليات البيانات المعقدة بأمر واحد أو أمرين فقط. يأتي Python Pandas مع العديد من الأساليب المدمجة لدمج البيانات والتجميع بشكل عام ، لا تقتصر Pandas فقط على التعامل مع المهام المتعلقة بالبيانات ؛ إنه بمثابة أفضل نقطة انطلاق لإنشاء أدوات بيانات أكثر تركيزًا وقوة.
فيما يلي السمات البارزة للباندا:
- معالجة البيانات: توفر مكتبة Pandas طريقة سريعة وفعالة حقًا لإدارة البيانات واستكشافها. يقوم بذلك من خلال تزويدنا بالسلسلة وإطارات البيانات ، والتي تساعدنا ليس فقط في تمثيل البيانات بكفاءة ولكن أيضًا في معالجتها بطرق مختلفة. هذه الميزات الخاصة بـ Pandas هي بالضبط ما يجعلها مكتبة جذابة لعلماء البيانات.
- المحاذاة والفهرسة: يكون الحصول على البيانات عديم الفائدة إذا كنت لا تعرف مكانها وما تخبرنا عنه. لذلك ، فإن تصنيف البيانات له أهمية قصوى. لذلك ، فإن تصنيف البيانات له أهمية قصوى. هاتان الحاجتان: تنظيم البيانات ووسمها يتم الاعتناء بهما تمامًا من خلال الأساليب الذكية للمحاذاة والفهرسة ، والتي يمكن العثور عليها داخل Pandas.
- معالجة البيانات المفقودة: كما نوقش أعلاه ، يمكن أن تكون قراءة البيانات مربكة للغاية. لكن هذه ليست حتى واحدة من المشاكل الرئيسية. البيانات بدائية للغاية في طبيعتها وإحدى المشاكل العديدة المرتبطة بالبيانات هي حدوث بيانات أو قيمة مفقودة. لذلك ، من المناسب التعامل مع القيم المفقودة بشكل صحيح حتى لا تغش في نتائج دراستنا. لقد قمت بتغطية بعض ميزات Pandas في هذا الصدد لأن التعامل مع القيم المفقودة مدمج داخل المكتبة.
- تنقية البيانات: كما قلنا للتو ،يمكن أن تكون البيانات خام للغاية. لذلك فهي فوضوية حقًا ، لدرجة أن إجراء أي تحليل على هذه البيانات سيؤدي إلى نتائج خاطئة بشدة. وبالتالي ، من الأهمية بمكان أن نقوم بتنظيف بياناتنا ، ويتم توفير ميزة Pandas هذه بسهولة. إنها تساعد كثيرًا ليس فقط في جعل الكود نظيفًا ولكن أيضًا تنظم البيانات بحيث يمكن للعين العادية حتى فك تشفير أجزاء من البيانات. كلما كانت البيانات أكثر نظافة ، كانت النتيجة أفضل.
- أدوات الإدخال والإخراج: توفر Pandas مجموعة واسعة من الأدوات المدمجة لغرض قراءة البيانات وكتابتها. أثناء التحليل ، من الواضح أنك ستحتاج إلى قراءة البيانات وكتابتها في هياكل البيانات وخدمة الويب وقواعد البيانات وما إلى ذلك. لقد أصبح هذا الأمر بسيطًا للغاية بمساعدة أدوات Pandas المدمجة. في لغات أخرى ، من المحتمل أن يتطلب الأمر الكثير من التعليمات البرمجية لتوليد نفس النتائج ، والتي لن تؤدي إلا إلى إبطاء عملية التحليل.
- دعم تنسيقات الملفات المتعددة: يمكن العثور على البيانات هذه الأيام في العديد من تنسيقات الملفات المختلفة ، بحيث يصبح من الضروري أن تتمكن المكتبات المستخدمة لتحليل البيانات من قراءة تنسيقات ملفات مختلفة. Pandas يأسر هذا القطاع بنطاق كبير من تنسيقات الملفات المدعومة. سواء كان JSON أو CSV ، يمكن لـ Pandas دعم كل شيء ، بما في ذلك Excel و HDF5. يمكن اعتبار هذا أحد أكثر ميزات Python Pandas جاذبية.
- دمج مجموعات البيانات والانضمام إليها: أثناء تحليل البيانات ، نحتاج باستمرار إلى دمج مجموعات بيانات متعددة والانضمام إليها لإنشاء مجموعة بيانات نهائية حتى نتمكن من تحليلها بشكل صحيح. هذا مهم لأنه إذا لم يتم دمج مجموعات البيانات أو ضمها بشكل صحيح ، فسيؤثر ذلك بشكل عكسي على النتائج ونحن لا نريد ذلك. يمكن أن تساعد Pandas في دمج مجموعات البيانات المختلفة بكفاءة عالية حتى لا نواجه أي مشاكل أثناء تحليل البيانات.
- الكثير من السلاسل الزمنية: لن تكون ميزات Pandas هذه منطقية للمبتدئين على الفور ، ولكنها ستكون ذات فائدة كبيرة في المستقبل. تتضمن هذه الميزات أمثال إحصاءات النافذة المتحركة وتحويل التردد. لذا ، كلما تعمقنا في تعلم الباندا ، سنرى مدى أهمية هذه الميزات وفائدتها لعالم البيانات.
- أداء مُحسَّن: يُقال إن Pandas تتمتع بأداء مُحسَّن حقًا ، مما يجعلها حقًا سريعة ومناسبة لعلوم البيانات. تمت كتابة الكود المهم لـ Pandas بلغة C أو Cython ، مما يجعلها سريعة الاستجابة وسريعة للغاية.
- دعم Python: هذه الميزة في Pandas هي الصفقة الأقرب. مع وجود قدر مجنون من المكتبات المفيدة تحت تصرفك ، أصبحت Python واحدة من أكثر لغات البرمجة المرغوبة لتحليل البيانات. وبالتالي فإن Pandas جزء من Python ويسمح لنا بالوصول إلى المكتبات الأخرى مثل NumPy و MatPlotLib.
- تصور: يعد تصور البيانات جزءًا مهمًا من علم البيانات. وهو ما يجعل نتائج الدراسة مفهومة بالعين البشرية. تتمتع Pandas بقدرة مضمنة على مساعدتك في رسم بياناتك ورؤية الأنواع المختلفة من الرسوم البيانية التي تم تشكيلها. بدون التصور ، لن يكون تحليل البيانات منطقيًا لمعظم السكان.
- التجميع: يعد امتلاك القدرة على فصل بياناتك وتجميعها وفقًا للمعايير التي تريدها أمرًا ضروريًا للغاية. بمساعدة ميزات Pandas مثل GroupBy ، يمكنك تقسيم البيانات إلى فئات من اختيارك ، وفقًا للمعايير التي تحددها. تقوم وظيفة GroupBy بتقسيم البيانات وتنفيذ وظيفة ثم دمج النتائج.
- بيانات القناع: في بعض الأحيان ، لا تكون هناك حاجة إلى بيانات معينة لتحليل البيانات ، وبالتالي من المهم أن تقوم بتصفية بياناتك وفقًا للأشياء التي تريدها منها. يتيح لك استخدام وظيفة القناع في Pandas القيام بذلك بالضبط. إنه مفيد للغاية لأنه كلما وجد بيانات تفي بالمعايير التي حددتها للحذف ، فإنه يحول البيانات إلى قيمة مفقودة.
- البيانات الفريدة: تحتوي البيانات دائمًا على الكثير من التكرار ، لذلك من المهم أن تكون قادرًا على تحليل البيانات التي لها قيم فريدة فقط. هذا موجود في ميزات Python Pandas ويسمح للمستخدم بمشاهدة القيم الفريدة في مجموعة البيانات باستخدام مجموعة البيانات الوظيفية.column.unique (). حيث تمثل “مجموعة البيانات” و “العمود” أسماء مجموعة البيانات والعمود ، على التوالي.
- قم بإجراء عمليات حسابية على البيانات: تتيح لك وظيفة التطبيق في Pandas تنفيذ عملية حسابية على البيانات. يساعد هذا بشكل كبير ، لأن مجموعة البيانات التي لديك في بعض الأحيان ليست بالترتيب الصحيح. سيكون هذا صحيحًا بمجرد استخدام عملية حسابية على مجموعة البيانات. هذه واحدة من أكثر ميزات الباندا جاذبية.
7. Numpy
NumPy أو Numerical Python عبارة عن جبر خطي تم تطويره في Python. تعتمد جميع حزم التعلم الآلي في Python تقريبًا مثل Mat-plotlib و SciPy و Scikit-Learn وغيرها على هذه المكتبة إلى حد معقول. يأتي مع وظائف للتعامل مع العمليات الرياضية المعقدة مثل الجبر الخطي وتحويل فورييه والأرقام العشوائية والميزات التي تعمل مع المصفوفات و n-arrays في بايثون. تقوم حزمة NumPy Python أيضًا بإجراء عمليات حسابية علمية. يستخدم على نطاق واسع في التعامل مع الموجات الصوتية والصور والوظائف الثنائية الأخرى.
فيما يلي ميزات خصائص NumPy:
- كائن مصفوفة ذات أبعاد N عالية الأداء: هذه هي الميزة الأكثر أهمية في مكتبة NumPy. إنه كائن مصفوفة متجانسة. نقوم بتنفيذ جميع العمليات على عناصر المصفوفة. يمكن أن تكون المصفوفات في NumPy ذات بعد واحد أو متعدد الأبعاد.
- مصفوفة ذات بعد واحد: الصفيف أحادي البعد هو صفيف يتكون من صف أو عمود واحد. عناصر المصفوفة ذات طبيعة متجانسة.
- مصفوفة متعددة الأبعاد: في هذه الحالة ، لدينا صفوف وأعمدة مختلفة. نحن نعتبر كل عمود بُعدًا. الهيكل مشابه لصحيفة إكسل. العناصر متجانسة.
- يحتوي على أدوات لدمج التعليمات البرمجية من C++ / C و Fortran: يمكننا استخدام الوظائف في NumPy للعمل مع التعليمات البرمجية المكتوبة بلغات أخرى. يمكننا بالتالي دمج الوظائف المتاحة في لغات البرمجة المختلفة. هذا يساعد على تنفيذ وظائف بين الأنظمة الأساسية.
- يحتوي على حاوية متعددة الأبعاد للبيانات العامة: هنا تشير البيانات العامة إلى نوع البيانات ذات المعلمات من المصفوفات. يمكنه أداء وظائف على أنواع البيانات العامة. المصفوفات في NumPy ذات طبيعة متجانسة. يتم تعيين معلمات لعناصر الصفيف هذه. تساعد المعلمات على زيادة تنوع المصفوفات.
- الجبر الخطي الإضافي ، وتحويل فورييه ، وقدرات الرقم العشوائي: لديه القدرة على إجراء عمليات معقدة للعناصر مثل الجبر الخطي ، وتحويل فورييه ، إلخ. لدينا وحدات منفصلة لكل من الوظائف المعقدة. لدينا وحدة linalg لوظائف الجبر الخطي. وبالمثل ، لدينا وظائف fft لتحويل فورييه في NumPy. لدينا وحدة مصفوفة لتطبيق الوظائف على المصفوفات. لدينا أيضًا وظائف خاصة لرسم الرسوم البيانية في وحدة matplotlib في NumPy. ومن ثم ، فهي مكتبة متنوعة للغاية للعمل مع المصفوفات.
- تتكون من وظائف البث: يعد بث المصفوفات مفهومًا مفيدًا للغاية عندما نعمل مع مصفوفات ذات أشكال غير متساوية. يبث شكل المصفوفات الأصغر وفقًا للمصفوفات الأكبر حجمًا. بث المصفوفات له بعض القواعد والقيود في تنفيذه. للبث ، يجب أن تكون إحدى المصفوفات ذات بعد واحد أو من المفترض أن تكون كلتا المصفوفتين من نفس الشكل. هناك أيضًا بعض القيود الأخرى على شكل المصفوفات.
- كان لديها القدرة على تعريف نوع البيانات للعمل مع قواعد البيانات المتنوعة: يمكننا العمل مع مصفوفات من أنواع بيانات مختلفة. يمكننا استخدام وظيفة dtype لتحديد نوع البيانات ومن ثم الحصول على فكرة واضحة عن مجموعة البيانات المتاحة. باستخدام تعريف المصفوفة ، لدينا وسيطة dtype إضافية لأداء وظائف المصفوفة. تعتبر معرفة نوع بيانات المصفوفة مهمة للغاية بسبب القيود المفروضة على عمليات NumPy.
8. Seaborn
أخيرًا ، المكتبة الأخيرة في قائمة مكتبات Python للتعلم الآلي والذكاء الاصطناعي هي Seaborn – وهي مكتبة تصور لا مثيل لها ، استنادًا إلى أسس Matplotlib. يعد كل من سرد القصص وتصور البيانات مهمًا لمشاريع التعلم الآلي ، حيث تتطلب غالبًا تحليلًا استكشافيًا لمجموعات البيانات لتحديد نوع خوارزمية التعلم الآلي التي سيتم تطبيقها. تقدم Seaborn واجهة عالية المستوى قائمة على مجموعة البيانات لعمل رسومات إحصائية مذهلة.
باستخدام مكتبة تعلم الآلة في Python ، من السهل إنشاء أنواع معينة من المؤامرات مثل السلاسل الزمنية والخرائط الحرارية ومخططات الكمان. تتجاوز وظائف Seaborn Python Pandas و matplotlib مع ميزات لإجراء تقدير إحصائي في وقت دمج البيانات عبر الملاحظات والتخطيط وتصور مدى ملاءمة النماذج الإحصائية لتعزيز أنماط مجموعة البيانات.
تم إنشاء Seaborn في أعلى مكتبة Matplotlib الأساسية لمكتبة Python. من المفترض أن تكون بمثابة مجاملة وليس بديلاً. ومع ذلك ، يأتي Seaborn مع بعض الميزات المهمة جدًا. دعونا نرى القليل منهم هنا. تساعد الميزات في:
- السمات المضمنة لتصميم رسومات matplotlib
- تصور البيانات أحادية المتغير وثنائية المتغير
- تركيب وتصور نماذج الانحدار الخطي
- رسم بيانات السلاسل الزمنية الإحصائية
- يعمل Seaborn بشكل جيد مع هياكل بيانات NumPy و Pandas
- يأتي مع سمات مدمجة لتصميم رسومات Matplotlib
تعتبر هذه المكتبات ذات قيمة كبيرة عندما تعمل في مشروعات التعلم الآلي لأنها توفر الوقت وتوفر المزيد من الوظائف الواضحة التي يمكن للمرء البناء عليها. من بين المجموعة المتميزة من مكتبات Python للتعلم الآلي ، هذه هي أفضل المكتبات التي تستحق الدراسة. بمساعدة مكتبات تعلم الآلة في Python ، يمكنك تقديم وظائف تحليلية عالية المستوى ، حتى مع الحد الأدنى من المعرفة بالخوارزميات الأساسية التي تعمل بها.