تصميم نظارة تساعد المكفوفين على الرؤية

Designing Glasses that Help Blind People to See

جدول المصطلحات

الشرحالاختصار
Artificial Intelligence: تقنية تصميم نظم حاسوبية قادرة على التعلم واتخاذ القرارات.AI
Machine Learning: فرع من الذكاء الصنعي يركز على تطوير خوارزميات تتعلم من البيانات.ML
You Only Look Once: خوارزمية تستخدم في التعرف على الأجسام وتحديدها في الصور.YOLO
ESP32 Camera: وحدة كاميرا متقدمة تستخدم في التقاط الصور.ESP CAM 32
Arduino: منصة إلكترونية مفتوحة المصدر تستخدم للتحكم في الأجهزة.Arduino
MP3 Mini Module: وحدة لتشغيل الملفات الصوتية المسجلة مسبقاً.MP3 mini
Secure Digital Card: بطاقة تُستخدم لتخزين البيانات كالملفات الصوتية.SD Card

ملخص

يهدف هذا المشروع إلى تصميم وتنفيذ نظام نظارة ذكية لمساعدة الأشخاص المكفوفين على التنقل والتفاعل مع البيئة المحيطة بهم بشكل أكثر فعالية واستقلالية. تعتمد النظارة الذكية على تقنيات الذكاء الصنعي المتقدمة لتحليل البيانات البصرية الملتقطة بوساطة كاميرا ESP CAM 32 وتحويل هذه البيانات إلى إشارات صوتية مفهومة. يتم توصيل هذه الإشارات الصوتية للمستخدمين، مما يمكنهم من فهم البيئة المحيطة بهم والاستجابة لها. يتكون النظام من عدة مكونات رئيسة: كاميرا ESP CAM 32 لالتقاط البيانات البصرية في الوقت الفعلي، خادم يقوم بتشغيل خوارزمية YOLO (You Only Look Once) باستخدام لغة البرمجة بايثون لتحليل وتحديد الأجسام، وحدة تحكم Arduino للإدارة والتحكم في تدفق البيانات بين المكونات المختلفة، وحدة MP3 mini لتشغيل الملفات الصوتية المسجلة مسبقاً، ومكبر صوت لتوصيل المعلومات السمعية إلى المستخدم. يتم تخزين الملفات الصوتية على بطاقة SD وتحتوي على وصف تفصيلي للأجسام والمعالم التي تم تحديدها. تبدأ العملية بالتقاط كاميرا ESP CAM 32 للبيانات البصرية وإرسالها إلى الخادم عبر عنوان IP. يقوم الخادم بمعالجة هذه البيانات باستخدام خوارزمية YOLO لتحديد وتصنيف الأجسام في محيط المستخدم. ثم تُرسل النتائج إلى وحدة التحكم Arduino، التي تقوم بتشغيل وحدة MP3 mini لتشغيل الملفات الصوتية المناسبة من بطاقة SD. يقوم مكبر الصوت بإخراج هذه الإشارات السمعية، مما يساعد المستخدم على التنقل والتفاعل مع البيئة المحيطة بشكل فعال ومستقل.

كلمات مفتاحية: نظارة ذكية، المكفوفين، الذكاء الصنعي، التعلم الآلي، الشبكات العصبونية، كاميرا ESP CAM 32، خوارزمية YOLO، الأردوينو.

Abstract

This project aims to design and implement a smart glasses system to aid visually impaired individuals in navigating and interacting with their surroundings more effectively and independently. The smart glasses leverage advanced artificial intelligence (AI) techniques to analyze visual data captured by an ESP CAM 32 camera and convert this data into comprehensible auditory signals. These auditory cues are then conveyed to the users, enabling them to understand and respond to their environment. The system comprises several key components: an ESP CAM 32 for real-time visual data capture, a server running YOLO (You Only Look Once) algorithm in Python for object detection and analysis, an Arduino microcontroller for managing data flow between components, an MP3 mini module for playing pre-recorded audio files, and a speaker to deliver auditory information to the user. The audio files, stored on an SD card, provide detailed descriptions of the detected objects and landmarks. The process begins with the ESP CAM 32 capturing visual data and transmitting it to the server via an IP address. The server processes this data using the YOLO algorithm to identify and classify objects in the user’s vicinity. The results are then sent to the Arduino microcontroller, which triggers the MP3 mini module to play the corresponding audio files from the SD card. The speaker outputs these auditory signals, guiding the user through their environment. The primary objective of this project is to create an innovative technological tool that enhances the independence and quality of life for visually impaired individuals.

Keywords: Smart Glasses, Visually Impaired, Artificial Intelligence, Machine Learning, Neural Networks, ESP CAM 32 Camera, YOLO Algorithm, Arduino, MP3 mini, SD Card

الهدف من المشروع

هو تطوير نظارة ذكية مزودة بتقنيات متقدمة لمساعدة الأشخاص المكفوفين على التنقل والتفاعل مع البيئة المحيطة بشكل أكثر فاعلية واستقلالية.

يهدف هذا المشروع إلى استخدام الذكاء الصنعي لتحليل البيانات البصرية الملتقطة عن طريق كاميرا ESP CAM 32، ومن ثم تحويل هذه البيانات إلى إشارات صوتية مفهومة يمكن للمستخدمين المكفوفين استيعابها واستخدامها لتوجيه تحركاتهم وتفاعلاتهم.

من خلال هذا المشروع، سيتم توفير أداة تكنولوجية تساهم في تعزيز قدرات الأشخاص المكفوفين على الاعتماد على أنفسهم وتحسين جودة حياتهم.

مشكلة البحث

يواجه الأشخاص المكفوفون تحديات كبيرة في التنقل والتفاعل مع البيئة المحيطة بهم نظرًا لعدم قدرتهم على رؤية المعالم البصرية التي يعتمد عليها معظم الأفراد في حياتهم اليومية.

على الرغم من توفر بعض الأدوات المساعدة مثل العصي البيضاء والكلاب المرشدة، فإن هذه الحلول لا توفر دائمًا الدعم الكافي لتحقيق استقلالية كاملة لهؤلاء الأفراد.

التكنولوجيا الحديثة، وخاصة الذكاء الصنعي، تقدم فرصًا جديدة لتحسين حياة المكفوفين من خلال توفير أدوات أكثر تطورًا ودقة.

ومع ذلك، فإن تطوير جهاز يمكنه تحليل البيانات البصرية وتحويلها إلى إشارات صوتية مفهومة لا يزال يمثل تحديًا كبيرًا.

تكمن مشكلة البحث في كيفية تصميم وتنفيذ نظارة ذكية مزودة بكاميرا ESP CAM 32 وتقنيات الذكاء الصنعي لتحليل البيانات البصرية في الوقت الفعلي، ومن ثم تحويل هذه البيانات إلى إشارات صوتية تساعد المكفوفين على التنقل والتفاعل مع بيئتهم بشكل فعال ومستقل.

يتطلب هذا إيجاد حلول تقنية للتعرف على الأجسام والمعالم المختلفة بدقة عالية، وتقديم المعلومات الصوتية بطريقة سريعة ومفهومة للمستخدمين، بالإضافة إلى ضمان سهولة استخدام الجهاز وملاءمته لاحتياجات المكفوفين.

1.1 مقدمة

تطبيق الذكاء الصنعي يلعب دورًا حاسمًا في مساعدة الأشخاص المكفوفين على الوصول إلى المحتوى البصري وتسهيل حياتهم اليومية.

تقدر منظمة الصحة العالمية أن عدد الأشخاص الذين لديهم ضعف في البصر يبلغ 285 مليون شخص (65% منهم أعمارهم تزيد عن 50 عاماً)، مستعينة بذلك بأحدث الدراسات في هذا المجال. وتقول المنظمة أن 246 مليون من هؤلاء يعانون من ضعف في الرؤية (63% منهم أعمارهم تزيد عن 50 عاما) و39 مليون يقدر إصابتهم بالعمى (82% منهم أعمارهم تزيد عن 50 عاما).

 يواجه الأشخاص المكفوفون صعوبات في الوصول إلى المعلومات المتاحة في المدارس والجامعات والعمل وحتى في المنزل، وبالتالي يحتاجون إلى مساعدة لتحويل المحتوى البصري إلى نص قابل للقراءة باللغة العربية.

تطبيقات الذكاء الصنعي مثل تطبيقات النصوص إلى كلام وتطبيقات التعرف على الصوت يمكن أن تساعد على تحويل المحتوى البصري إلى نصوص قابلة للقراءة باللغة العربية.

كما يمكن لتطبيقات الذكاء الصنعي أن تحسن جودة حياة الأشخاص المكفوفين عن طريق تحسين الدقة والسرعة في الكشف عن الصور وتحويلها إلى نصوص قابلة للقراءة باللغة العربية. وبالتالي، فإن تطبيق الذكاء الصنعي يمكن أن يساعد على توفير مساعدة فعالة للأشخاص المكفوفين وتحسين جودة حياتهم اليومية.

كما يظهر الشكل (‏1.1) تصميم تم إنشاؤه باستخدام الذكاء الصنعي لتصور المشروع.

1.1 التعلم الآلي والذكاء الصنعي

يعد التعلم الآلي والذكاء الصنعي من أكثر المفاهيم انتشارًا في الوقت الحالي، إذ أنهما يشكلان عصب حيوي في تقنيات الحوسبة الحديثة. يقوم التعلم الآلي على تصميم نظم حاسوبية قادرة على التعلم من البيانات بشكل مستقل، وتحسين أدائها بشكل تلقائي عندما يتلقى النظام مزيدًا من البيانات، وتستخدم هذه التقنية في مجالات مثل التوقعات والتصنيف والتحليل والتعرف.

بالمثل، يستخدم الذكاء الصنعي لتطوير النظم الحاسوبية التي تستطيع التفكير والتعرف على الأنماط والمعالجة الذاتية واتخاذ القرارات. ويمكن استخدام الذكاء الصنعي في مجالات مختلفة مثل الصحة والتجارة الإلكترونية والترفيه والتعليم.

1.1.1 أنواع التعلم الآلي وفوائده

تعتبر التكنولوجيا المتقدمة من أهم العوامل التي تدعم التقدم الاقتصادي والاجتماعي، ومن أهم هذه التقنيات هو التعلم الآلي والذكاء الصنعي. ويمكن تقسيم التعلم الآلي إلى عدة أنواع رئيسية، والتي تشمل:

1- التعلم الآلي الضعيف: وهو نوع من التعلم يتم فيه تدريب النظام على مجموعة محددة من البيانات، ويستطيع بعد ذلك التنبؤ بقيمة جديدة استناداً إلى القواعد المستخلصة من تلك البيانات.

2- التعلم الآلي العميق: وهو تعلم يستخدم شبكات عصبونية لتحليل وفهم البيانات، ويعتبر أكثر تعقيداً وأكثر فعالية من التعلم الآلي الضعيف، ويستخدم بشكل واسع في مجالات مثل التصنيع والطب والروبوتات والتعليم.

وتعتبر فوائد التعلم الآلي كثيرة، فهو يمكن أن يحل مشاكل عديدة في مجالات مختلفة، منها:

1- الكشف المبكر عن الأمراض: حيث يمكن استخدام التعلم الآلي لتحليل البيانات الطبية وتشخيص الأمراض في مراحل مبكرة.

2- التنبؤ بالمخاطر: حيث يمكن استخدام التعلم الآلي لتحليل البيانات والتنبؤ بالمخاطر في مجالات مثل التمويل والتأمين.

3- تحسين تجربة المستخدم: حيث يمكن استخدام التعلم الآلي في تحليل سلوك المستخدمين وتحسين تجربتهم في المواقع الإلكترونية والتطبيقات.

1.2 الشبكات العصبونية

تُعد الشبكات العصبونية نموذجًا للتعلم الآلي يستوحي فكرته من الدماغ البشري، حيث تتألف الشبكات العصبونية من عدة طبقات متصلة بعضها ببعض، وتستخدم الشبكات العصبونية لمعالجة البيانات واستخراج المعلومات منها. يتم تدريب الشبكات العصبونية على البيانات المتاحة، وبعد ذلك يتم استخدامها لإجراء التنبؤات والتصنيفات والتعرف على الأشياء والأنماط.

تتميز الشبكات العصبونية بالقدرة على التعلم الذاتي، والتكيف مع التغييرات في البيانات المتاحة، كما أنها تتميز بالقدرة على استخلاص الأنماط المعقدة والعلاقات غير الخطية بين البيانات، وتتميز أيضًا بالقدرة على التعامل مع الضوضاء والأخطاء في البيانات.

تستخدم الشبكات العصبونية الشكل (2.1) في مجالات عديدة مثل التعرف على الكلام والنصوص والصور، والتحكم في الروبوتات والمركبات، والتنبؤ بالأحداث المستقبلية والتحليل الإحصائي، وأيضًا في تصميم الألعاب والتفاعل الإنسان-الحاسوب.

الشكل (‏2.1): الشبكة العصبونية العميقة DNN.

يمكن استخدام تقنيات الرؤية الحاسوبية في العديد من المجالات، مثل التعرف على الصور والأشخاص والأشياء، والتحقق من الهوية، والأمن، والطب، وتحسين تجربة المستخدم، والتصوير الفوتوغرافي، والتحكم في الروبوتات. ويعد تطبيق التعرف على الصور والأشخاص من أكثر الاستخدامات الشائعة لتقنيات الرؤية الحاسوبية، حيث يتم استخدامه في التعرف على الوجوه وتصنيفها وتتبعها وتحديدها.

تتطلب تقنيات الرؤية الحاسوبية العمل بشكل متزامن بين عدة تقنيات مختلفة، مثل الشبكات العصبونية العميقة والتعلم الآلي ومعالجة الصور. ويمكن استخدامها لتحليل الصور والفيديوهات بشكل دقيق وفعال، وهي تقنية حيوية في عالم التصوير والمعالجة الرقمية.

1.3 تقنيات التعلم العميق

تقنيات التعلم العميق هي فرع من فروع الذكاء الصنعي يستخدم الشبكات العصبونية العميقة لتدريب النظم على استخراج المعلومات من البيانات الكبيرة والمتنوعة. ويعد هذا النوع من التعلم أكثر تطورًا وتعقيدًا من التعلم الآلي ، حيث يمكن للشبكات العصبونية العميقة تعلم التمثيلات المستوحاة من البيانات واستخدامها لإنشاء نماذج تنبؤية ومتقدمة.

يتم تدريب الشبكات العصبونية العميقة على البيانات باستخدام خوارزميات التعلم الآلي مثل الشبكات العصبونية الصنعية والشبكات العصبونية التكرارية والشبكات العصبونية المتعددة الطبقات. ويمكن استخدام هذه التقنيات في مجالات مختلفة مثل التعلم الآلي، والمعالجة اللغوية الطبيعية، وتحليل الصور والفيديو، وتحليل الصوت والنص.

تتميز تقنيات التعلم العميق بفوائد عدة، من بينها قدرتها على التعامل مع البيانات الكبيرة والمتنوعة، وتحسين دقة النماذج التنبؤية والتصنيفية، وتحسين الأداء في المهام الروتينية والمعقدة. كما يمكن استخدام تقنيات التعلم العميق في تطوير التطبيقات والأنظمة الذكية المتقدمة في مجالات مختلفة مثل الروبوتات والمركبات الذاتية القيادة والرعاية الصحية.

1.4 تدريب المودل باستخدام الذكاء الصنعي

تدريب المودل باستخدام الذكاء الصنعي هو عملية تعليم الحاسوب على التعرف على الأنماط الموجودة في البيانات باستخدام مجموعة من الخوارزميات والتقنيات المختلفة التي تمكنه من الاستدلال والتنبؤ والتصنيف. يتم تعليم الحاسوب عن طريق تغذية النظام بمجموعة كبيرة من البيانات المسماة بالبيانات التدريبية، ومن خلال معالجة هذه البيانات يتم بناء نموذج للتعرف على الأنماط الجديدة التي يتم تقديمها للنظام.

يعتمد تدريب المودل باستخدام الذكاء الصنعي على الشبكات العصبونية الصنعية والتي تعد أحد أشهر تقنيات التعلم العميق. يتم بناء هذه الشبكات بشكل مشابه لعملية بناء الجهاز العصبي البشري، حيث تتكون من طبقات من العقد الصغيرة المرتبطة ببعضها البعض والتي تعمل على معالجة البيانات بشكل موازٍ. يتم تدريب هذه الشبكات عن طريق إدخال مجموعة من البيانات التدريبية ومقارنة نتائج النظام مع النتائج المعروفة سلفاً، وعلى أساس هذه المقارنة يقوم النظام بتعديل معاملات شبكاته لتحسين أداء النظام في المرات اللاحقة.

1.5 الرؤية الحاسوبية

يبين الشكل (2.2) مبدأ الرؤية الحاسوبية هي حقل متقدم من مجالات الذكاء الصنعي وعلوم الحاسب، يهدف إلى تمكين الآلات من فهم وتحليل الصور والفيديوهات بنفس الطريقة التي يقوم بها البشر. تعتبر الرؤية الحاسوبية واحدة من أكثر المجالات تطورًا وإثارة في العصر الرقمي الحديث، حيث تساهم في تحسين وتطوير العديد من التطبيقات العملية والصنعية.

الشكل (‏2.2): الرؤية الحاسوبية.

المفاهيم الأساسية:

الرؤية الحاسوبية تعتمد على مجموعة متنوعة من المفاهيم الأساسية مثل معالجة الصور، وتحليل الأنماط، والتعرف على الأجسام، وتقدير الحركة، وإعادة بناء المشاهد ثلاثية الأبعاد. تتضمن معالجة الصور تقنيات لتحسين جودة الصورة، واستخراج المعلومات المهمة منها، مثل الكشف عن الحواف والتعرّف على الأشكال. أما تحليل الأنماط فيركز على تصنيف العناصر واكتشاف الأنماط المتكررة داخل الصور.

التطبيقات العملية:

التطبيقات العملية للرؤية الحاسوبية واسعة ومتنوعة، وتشمل مجالات مثل:

الطب: حيث تُستخدم في تحليل الصور الطبية مثل الأشعة السينية والتصوير بالرنين المغناطيسي لاكتشاف الأمراض ومتابعة تطور العلاج.

السيارات ذاتية القيادة: تعتمد هذه السيارات على الرؤية الحاسوبية لفهم البيئة المحيطة، التعرف على العوائق، قراءة إشارات المرور، وتحديد المسارات الآمنة.

الأمن والمراقبة: تُستخدم الرؤية الحاسوبية في أنظمة المراقبة الذكية لتحليل الفيديوهات واكتشاف السلوكيات المشتبه بها، والتعرف على الوجوه في الأماكن العامة.

التجارة الإلكترونية: تمكن تقنيات الرؤية الحاسوبية من تحسين تجربة المستخدم من خلال تطبيقات مثل التعرف على المنتجات، وتقديم توصيات مخصصة بناءً على تحليل الصور.

الشكل (‏2.3): تطبيقات الرؤية الحاسوبية.

التقنيات الحديثة:

يتقدم مجال الرؤية الحاسوبية بسرعة بفضل التطورات في تقنيات التعلم العميق والشبكات العصبونية الصنعية. تعتبر خوارزميات التعلم العميق، مثل الشبكات العصبونية التلافيفية (CNNs)، أدوات قوية لتحليل الصور والتعرف على الأنماط المعقدة. هذه الخوارزميات قادرة على التعلم من كميات كبيرة من البيانات وتحسين دقتها باستمرار.

التحديات والآفاق المستقبلية:

على الرغم من التطورات الكبيرة، هناك تحديات مستمرة تواجه الرؤية الحاسوبية، منها التعامل مع الصور في بيئات معقدة أو ظروف إضاءة سيئة، والتعرف على الأجسام في زوايا مختلفة أو حالات تشويش. كما أن الحاجة إلى كميات هائلة من البيانات لتدريب النماذج يمكن أن تكون عائقًا.

من ناحية أخرى، الآفاق المستقبلية للرؤية الحاسوبية مشرقة، حيث يمكن توقع المزيد من التطورات التي ستزيد من دقة وكفاءة الأنظمة. من المتوقع أن تندمج الرؤية الحاسوبية بشكل أكبر مع تقنيات أخرى مثل الواقع المعزز والواقع الافتراضي، مما يفتح آفاقًا جديدة في مجالات الترفيه والتعليم والصناعة.

الخلاصة:

الرؤية الحاسوبية تمثل مجالًا حيويًا ومتطورًا يساهم في تحويل الطريقة التي نفهم بها العالم من حولنا ونتفاعل معه. بفضل الابتكارات المستمرة والتطورات التكنولوجية، يُتوقع أن تظل الرؤية الحاسوبية في طليعة الابتكار، مقدمةً حلولًا ذكية ومستدامة لتحديات متعددة في حياتنا اليومية.

1.1 الأردوينو أونو

الأردوينو أونو هو لوح تطوير مفتوح المصدر يُستخدم على نطاق واسع في مشاريع الأتمتة والروبوتات نظرًا لسهولة استخدامه ومرونته. يتميز بمعالج ATmega328، ويوفر 14 مدخل/مخرج رقمي و6 مداخل للتناظرية، مما يجعله مناسبًا لجمع البيانات والتحكم في المحركات والمستشعرات. يتميز أيضًا بوجود مبرمج USB مدمج، مما يسهل برمجته من خلال الكمبيوتر بلغة ArduinoC مع توفير مكتبة واسعة لدعم الأجهزة المتنوعة.

يُستخدم الأردوينو أونو بشكل فعال في التعليم والبحوث نظرًا لقدرته على تسهيل عملية تعلم أساسيات البرمجة والإلكترونيات. يمكن للمستخدمين تطوير أنظمة معقدة من خلال توصيل الأردوينو بمجموعة متنوعة من الأجهزة الإلكترونية مثل الحساسات، المحركات، ووحدات العرض، مما يوفر منصة مثالية لتطوير مشاريع التحكم والأتمتة بكفاءة واقتصادية.

الدوائر الكهربائية المستخدمة مع الأردوينو تعتمد عادةً على توصيلات بسيطة وأكواد برمجية يمكن تعديلها بسهولة لتلبية الحاجات المختلفة للمشروع، وهذه المرونة تجعل الأردوينو خيارًا ممتازًا لمشاريع متعددة الأغراض في مجالات الروبوتات والتحكم الآلي.

الشكل ( ‏3.1 ) مخطط تفصيلي لشريحة الأردوينو أونو.

1.2 البلوتوث HC-05

الوحدة HC-05 هي واحدة من الأجهزة الشائعة المستخدمة لتوفير الاتصالات اللاسلكية بتقنية البلوتوث في مشاريع التحكم الآلي والأتمتة. تتميز بسهولة الاستخدام والتكامل مع الأردوينو وأنظمة المتحكمات الأخرى.

الشكل (‏3.2): مخطط لشريحة HC-05.

نلاحظ أن الجدول (1-3) يوضح المواصفات الفنية الرئيسة لوحدة البلوتوث HC-05.

الجدول (‏31): المواصفات الفنية للشريحة HC-05.

القيمةالمواصفة
30mA  نموذجيتيار العمل
2.4 GHz إلى  GHz2.48تردد العمل
v2.0+EDR بلوتوثالبروتوكول المستخدم
تقنية إدارة الطاقة المتقدمةوضع الطاقة

وحدة HC-05 كما موضح ضمن الشكل (3.2) تدعم بروتوكول بلوتوث الإصدار 2.0+EDR (Enhanced Data Rate)، مما يسمح بنقل البيانات بسرعات أعلى تصل إلى 3 ميجابت في الثانية. كما أنها مزودة بميزات متقدمة لإدارة الطاقة، مما يجعلها خيارًا اقتصاديًا وفعالًا من حيث الطاقة للتطبيقات التي تتطلب اتصالاً لاسلكياً مستمراً أو متكرراً.

1.3 الشريحة DFRobot DFPlayer Mini – MP3 Module

تُعتبر شريحة DFRobot DFPlayer Mini – MP3 Module ضمن الشكل (3.2) واحدة من الحلول المتقدمة والصغيرة لتشغيل الملفات الصوتية MP3 بشكل مستقل أو من خلال التحكم عبر ميكروكنترولر مثل Arduino. تتميز هذه الشريحة بالعديد من الخصائص التي تجعلها مثالية للاستخدام في المشاريع المدمجة والتفاعلية.

الشكل (‏3.3): شريحة DFPlayer Mini.

الميزات:

تشغيل مستقل أو عن طريق ميكروكنترولر: يمكن للشريحة تشغيل الملفات الصوتية بشكل مستقل من خلال وحدة التحكم المدمجة، أو يمكن التحكم بها باستخدام أوامر تسلسلية من ميكروكنترولر مثل Arduino.

دعم أنواع ملفات متعددة: تدعم تشغيل ملفات بصيغتي MP3 وWAV.

تخزين الملفات: يمكنها قراءة الملفات الصوتية المخزنة على بطاقات الذاكرة MicroSD أو TF Card تصل سعتها إلى 32 جيجابايت.

مستوى إخراج الصوت: توفر مخرج صوتي عالي الجودة يمكن توصيله مباشرة بسماعات صغيرة.

التحكم في مستوى الصوت: يمكن التحكم بمستوى الصوت برمجياً من خلال الأوامر التسلسلية.

المزايا التفاعلية: تدعم أوامر مثل تشغيل، إيقاف، إيقاف مؤقت، تشغيل الملف التالي أو السابق، وتكرار التشغيل.

الخصائص التقنية:

الجهد التشغيلي: تتطلب الشريحة جهد تشغيل من 3.2 إلى 5 فولت.

تيار التشغيل: يبلغ تيار التشغيل النمطي حوالي 20 ميلي أمبير.

مكبرات الصوت: تحتوي الشريحة على مكبرين صوتيين داخليين يمكنهما توفير خرج صوتي بقدرة تصل إلى 3 وات، مما يجعلها قادرة على تشغيل سماعات خارجية مباشرة بدون الحاجة إلى مكبرات صوت إضافية.

الشكل (‏3.4): اتصال شريحة DFPlayer Mini مع الأردوينو نانو.

واجهات الاتصال: تدعم الشريحة واجهة UART للتواصل التسلسلي مع الميكروكنترولر، بالإضافة إلى وجود دبابيس GPIO يمكن استخدامها لتشغيل ملفات صوتية معينة عند توصيلها بمفاتيح أو أزرار.

حجم الشريحة: تتميز بحجم صغير يجعلها مناسبة للتطبيقات المدمجة، حيث يبلغ أبعادها حوالي 22 مم × 22 مم.

بفضل هذه الميزات، تعتبر شريحة DFRobot DFPlayer Mini – MP3 Module خياراً ممتازاً لتطبيقات الصوت في المشاريع الإلكترونية، مما يسهل على المطورين إضافة وظيفة تشغيل الصوت إلى مشاريعهم بسهولة وفعالية.

1.4 الشريحة ESP32-CAM

تُعد الشريحة ESP32-CAM من الحلول المدمجة والمتميزة لتطبيقات الرؤية الحاسوبية والاتصال اللاسلكي. تتميز هذه الشريحة بقدرتها على التقاط الصور والفيديوهات بالإضافة إلى إمكانيات معالجة البيانات البصرية والاتصال بشبكات Wi-Fi وبلوتوث، مما يجعلها مناسبة لتطبيقات متنوعة في مجالات المراقبة والأتمتة المنزلية والمشاريع التفاعلية تظهر ضمن الشكل (3.5).

الميزات:

معالج قوي: تعتمد الشريحة على معالج ESP32 من عائلة Xtensa® 32-bit LX6،

الذي يحتوي على نواتين بتردد يصل إلى 240 ميجاهرتز، مما يوفر قدرة معالجة عالية لتطبيقات الذكاء الصنعي ومعالجة الصور.

كاميرا مدمجة: تأتي الشريحة مع كاميرا OV2640 بدقة تصل إلى 2 ميجابكسل، وتدعم دقة تصوير تصل إلى 1600×1200 بكسل، مما يتيح التقاط صور وفيديوهات عالية الجودة.

اتصال لاسلكي: تدعم الشريحة الاتصال بشبكات Wi-Fi بمعيار 802.11 b/g/n وبلوتوث 4.2، مما يسمح بنقل البيانات اللاسلكية والتحكم عن بعد.

دعم بطاقة الذاكرة: تحتوي الشريحة على فتحة لبطاقة MicroSD يمكن استخدامها لتخزين الصور والفيديوهات مباشرة على الشريحة.

واجهات متعددة: تدعم الشريحة العديد من الواجهات مثل UART، SPI، I2C، PWM، مما يتيح ربطها بسهولة مع أجهزة استشعار ومكونات أخرى.

الشكل (‏3.5): شريحة ESP32 CAM.

الخصائص التقنية:

الجهد التشغيلي: تتطلب الشريحة جهد تشغيل من 3.3 فولت إلى 5 فولت.

تيار التشغيل: يبلغ تيار التشغيل النمطي حوالي 160 ميلي أمبير، ويمكن أن يصل إلى 310 ميلي أمبير عند استخدام الاتصال اللاسلكي بشكل مكثف.

ذاكرة فلاش وRAM: تحتوي الشريحة على 4 ميجابايت من ذاكرة الفلاش و520 كيلوبايت من SRAM، مما يوفر مساحة كافية لتخزين البرامج والبيانات.

دبابيس GPIO: تحتوي الشريحة على 9 دبابيس GPIO يمكن استخدامها لتوصيل المكونات الخارجية والتحكم بها.

حجم الشريحة: تتميز الشريحة بحجم صغير يبلغ حوالي 27 مم × 40.5 مم، مما يجعلها مناسبة للتطبيقات المدمجة.

الكاميرا المدمجة:

نوع الكاميرا: OV2640

الدقة: تصل إلى 2 ميجابكسل (1600×1200 بكسل)

دعم الدقة المتعددة: QCIF، CIF، VGA، SVGA، XGA، SXGA، UXGA

استهلاك الطاقة: تستهلك الكاميرا تياراً منخفضاً، مما يساهم في تقليل إجمالي استهلاك الطاقة للشريحة.

بفضل هذه الميزات، تُعد الشريحة ESP32-CAM خياراً ممتازاً لمشاريع الرؤية الحاسوبية، وإنترنت الأشياء (IoT)، والتطبيقات التي تتطلب اتصالاً لاسلكياً وقدرات معالجة متقدمة في حزمة صغيرة ومتكاملة.

1.1 YOLOv3 (You Only Look Once, Version 3)

هو نموذج شبكة عصبونية تلافيفية (CNN) يستخدم في التعرف على الأشياء واكتشافها في الصور والفيديوهات. يتميز YOLOv3 بسرعته ودقته مقارنة بالنماذج الأخرى، مما يجعله مناسبًا للتطبيقات في الزمن الحقيقي. فيما يلي شرح لخصائص ومواصفات YOLOv3:

الشكل (‏3.7): YOLOv3.

1.1 المخطط الصندوقي

يوضح الشكل (‏4.1) المخطط الصندوقي لكيفية تكامل المكونات المختلفة لنظام النظارة الذكية، بدءًا من التقاط البيانات البصرية وحتى تقديم الإرشادات الصوتية للمستخدم المكفوف. يتم تحقيق ذلك من خلال التفاعل المنسق بين الكاميرا، معالجة الصور، وحدة التحكم Arduino، وشريحة MP3 Mini لإخراج الصوت.

الشكل (‏4.1): المخطط الصندوقي.

1.1 المقارنة مع المشاريع المشابهة:

الجدول (‏4‑1): مقارنة مشروعنا مع الدراسات السابقة

وجه المقارنةالمشروع الحاليتطبيق Seeing AIتطبيق Be My Eyesتطبيق Lazarilloتطبيق Signily
لغة البرمجة المستخدمةبايثون (Python)سي شارب (C#)جافا (Java)جافا (Java)جافا سكريبت (JavaScript)
الأجهزة المستخدمةESP32-CAM، Arduino، DFPlayer Miniكاميرا الهاتف الذكيكاميرا الهاتف الذكيالهاتف الذكيالهاتف الذكي
الخوارزميات المستخدمةYOLOv3 للتعرف على الأجسامخوارزميات التعرف على الصور والنصوصخوارزميات الفيديو والتعرف على الألوانخوارزميات الملاحة والتوجيهخوارزميات التعرف على الإشارات
الهدفمساعدة المكفوفين على التنقل باستخدام النظارات الذكيةمساعدة المكفوفين في التعرف على الأشياء والأماكنمساعدة المكفوفين من خلال المتطوعينمساعدة المكفوفين في التعرف على الأماكن والمواقعمساعدة الصم في التواصل باستخدام الإشارة
طريقة تقديم المساعدةتحويل البيانات البصرية إلى إشارات صوتيةتحويل النصوص المكتوبة إلى كلام مسموعالاتصال المرئي بين المكفوفين والمتطوعينتوجيه المستخدمين بإشارات صوتيةتحويل الكلمات إلى إشارات مرئية
المتطلبات (الموارد)كاميرا، خادم، وحدة تحكم، وحدة صوت، بطاقة SDهاتف ذكيهاتف ذكيهاتف ذكيهاتف ذكي

يوضح الجدول (‏4‑1): مقارنة مشروعنا مع الدراسات السابقة وأوجه التشابه والاختلاف بينهم.

1.1      الشكل النهائي للمشروع:

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *