توفر التكنولوجيا الحديثة أدوات تحسين الوصولية للأشخاص ذوي الإعاقة البصرية. من بين هذه الأدوات، يعتبر تطبيق مساعدة المكفوفين باستخدام الرؤية الحاسوبية حلاً ثوريًا لمشكلات الوصول إلى المحتوى البصري.
هذا التطبيق الذي تم تطويره باستخدام لغة البرمجة كوتلن ومنصة أندرويد ستوديو، يتيح للمستخدمين المكفوفين التعرف على العناصر الموجودة في الصور من خلال FirebaseVisionImageLabeler، وكذلك إنشاء الصور باستخدام CameraX API. وبالإضافة إلى ذلك، يمكن للتطبيق التحكم في الصوت من خلال AudioManager وتحويل النص إلى كلام باستخدام TextToSpeech.
يأتي الذكاء الصنعي كعنصر حاسم في تقنية التعرف على الصور، حيث يتم استخدام مكتبات تعلم الآلة لتمكين التطبيق من التعرف على العناصر الموجودة في الصورة وتسميتها بشكل دقيق. هذا يساعد المستخدمين المكفوفين على التفاعل مع العالم البصري بشكل أكبر وأكثر ثقة.
تعد لغة البرمجة كوتلن خيارًا مناسبًا لبناء تطبيقات الهاتف المحمول، بفضل سهولة استخدامها وقدرتها على التعامل مع العديد من الوظائف الحاسوبية. كما توفر اللغة أدوات قوية لتحليل الأخطاء وتصحيحها، مما يجعل من السهل على المطورين إنشاء تطبيقات ذات جودة عالية وتطويرها بشكل مستمر.
بالإضافة إلى ذلك، يساعد استخدام الذكاء الصنعي في التطبيقات القائمة على كوتلن في توفير تجربة مستخدم محسنة وأكثر دقة للمستخدمين المكفوفين. يمكن تحسين قدرات التطبيق مع تحسين جودة التعرف على الصور والصوت، مما يعزز القيمة العملية للتطبيق.
باستخدام هذا التطبيق، يمكن للأشخاص ذوي الإعاقات البصرية الاستفادة من التقدم التكنولوجي لتحقيق استقلالية أكبر وتحسين جودة الحياة.
Abstract
Our project aims to develop an Android Studio-based application using the Kotlin programming language, which focuses on providing practical assistance to visually impaired individuals through the use of modern technology. This application enables them to access visual content more easily and efficiently. It allows image recognition through FirebaseVisionImageLabeler, image creation using CameraX API, sound control via AudioManager, and text-to-speech conversion using TextToSpeech. Artificial intelligence plays a critical role in image recognition technology, as machine learning libraries are utilized to enable the application to accurately recognize and label elements within an image. This assists visually impaired users in interacting with the visual world with greater confidence. Regarding the Kotlin programming language, it is user-friendly and capable of handling many computer functions, making it a suitable option for building mobile phone applications. The language offers powerful tools for error analysis and correction, making it easy for developers to create high-quality applications and continuously improve them. In addition, the use of artificial intelligence in Kotlin-based applications helps to provide an enhanced and more accurate user experience for visually impaired users, by improving the quality of image and voice recognition, which enhances the practical value of the application.
تم استعمال TextToSpeech
TextToSpeech هو واجهة برمجة تطبيقات (API) في نظام الأندرويد تسمح لتطبيقك بتحويل النص إلى كلام مسموع بشكل آلي. يتم استخدام هذه الواجهة بشكل رئيسي في تطبيقات الصوت والمراسلة والقراءة الصوتية والإعلانات الصوتية والألعاب والتعليم عن بعد والعديد من التطبيقات الأخرى.
تعتمد TextToSpeech على تقنيات الترجمة النصية إلى كلام مسموع باستخدام أنظمة ترجمة النص إلى كلام المدمجة في نظام الأندرويد. وتم تصميم وتطوير TextToSpeech لتوفير تجربة مستخدم متعددة اللغات ويدعم العديد من اللغات المختلفة ويوفر العديد من الخصائص التي تسمح للمطورين بتخصيص تجربة الصوت لتناسب احتياجات تطبيقهم.
يمكن للمطورين استخدام TextToSpeech بسهولة في تطبيقاتهم عن طريق تعريف مثيل من واجهة TextToSpeech في الشفرة وتهيئتها واستخدامها لتحويل النص إلى كلام مسموع. يمكن تخصيص خصائص TextToSpeech لتحسين جودة الصوت وتحديد اللغة والنطق والأسلوب ومعدل الكلام والصوت وغيرها من الخصائص.
يمكن أيضًا استخدام TextToSpeech في تطبيقات الواقع المعزز والواقع الافتراضي لتوفير تجربة صوتية أكثر واقعية وتفاعلية للمستخدم. يمكن استخدام TextToSpeech لتحويل النص إلى كلام مسموع في الوقت الحقيقي بشكل مستمر وتوفير تجربة صوتية ديناميكية وواقعية للمستخدمين.
تم استعمال تقنيات لتحليل الصورة:
التطويرات والآفاق المستقبلية:
يمكن تطوير التطبيق لإضافة المزيد من الميزات والتحسينات المستقبلية، بما في ذلك:
1- تحسين الدقة: يمكن تطوير خوارزميات التعرف على الصورة لتحسين الدقة وتعرف أكثر الأشياء بدقة أفضل.
2- دعم اللغات المتعددة: يمكن إضافة دعم للغات المتعددة، حتى يتمكن المستخدمون من التفاعل بلغاتهم الأم.
3- تحسين تجربة المستخدم: يمكن تحسين واجهة المستخدم وتصميمها بشكل أفضل لتحسين تجربة المستخدم.
4- تطوير ميزات إضافية: يمكن إضافة ميزات جديدة مثل التعرف على الألوان، وتحويل النص المكتوب إلى كلام، والتعرف على الأشخاص.
5- دمج تقنيات جديدة: يمكن دمج تقنيات جديدة مثل الذكاء الاصطناعي وتعلم الآلة لتحسين الأداء والدقة.
6- تطوير نسخة لمستخدمي الهواتف الذكية الأخرى: يمكن تطوير نسخة من التطبيق للهواتف الذكية التي تعمل بأنظمة تشغيل أخرى.
7- توفير دعم فني وصيانة للتطبيق: يمكن توفير دعم فني وصيانة للتطبيق لضمان استمرارية عمله وتلبية احتياجات المستخدمين.
المراجع:
1- Seeing AI. (n.d.). Microsoft. https://www.microsoft.com/en-us/ai/seeing-ai
2- Be My Eyes. (n.d.). Be My Eyes. https://www.bemyeyes.com/
3- Lazarillo. (n.d.). Lazarillo. https://www.lazarillo.cl/
4- Signily. (n.d.). Signily. https://www.signily.com/
6- Firebase ML Kit Documentation: https://firebase.google.com/docs/ml-kit
7- Building an Object Detection App Using Firebase ML Kit on Medium: https://medium.com/firebase-developers/building-an-object-detection-app-using-firebase-ml-kit-c87626a181f2