7 أمثلة تطبيقية مذهلة على الرؤية الآلية
لم يكن حلم البشر في ابتكار حواسيب ذكية جدًا ذات قدرات متطورة شيئًا حديثًا، بل يعود عهد ذلك إلى الخمسينيات من القرن الماضي، لتستخدم آنذاك ولأول مرة تجاريًا تطبيقات مخصصة للتمييز بين النص المطبوع والنص المكتوب بخط اليد بحلول سبعينات القرن الماضي.
إلا أن هذه التطبيقات شهدت قفزات مذهلة خلال القرن الحالي وهي على وشك النمو بشكل كبير بحلول العام 2022، حيث من المتوقع أن تبلغ قيمة هذه التطبيقات في سوق الأجهزة حوالي 48.6 مليار دولار. فقد أصبحت جزءًا أساسيًا من حياتنا اليومية، ونحن نتعرض لها بشكل منتظم حتى لو لم نكن نعرف توقيت وكيفية تطبيق هذه التقنيات.
في مقالنا هذا سوف نتحدث عن القدرات البصرية للحواسيب Computer Vision وكيفية عملها من خلال سبعة أمثلة تطبيقية يتم العمل عليها في وقتنا الحالي.
ماذا نعني بالقدرات البصرية للحواسيب؟
البصيرة الحاسوبية هي شكل من أشكال الذكاء الاصطناعي التي تمكّن الحواسيب من "رؤية" العالم بطريقة مختلفة وتحليل البيانات المرئية ثم اتخاذ القرارات منها أو فهم البيئة والوضع المحيط بها. أحد العوامل الدافعة لتطور البصيرة الحاسوبية هي كمية البيانات التي يتم انتاجها يوميًا واستخدامها فيما بعد لتحسين القدرات البصرية للآلات. يحتوي عالمنا على عدد لا يحصى من الصور التي يتم تجميعها بواسطة الكاميرات المدمجة في أجهزتنا المحمولة أو كاميرات المراقبة. ونعني بالصور هنا كل ما تشمله البيانات الرقمية من صور ومقاطع الفيديو إلى البيانات التي يتم تحصيلها من المستشعرات الحرارية أو الأجهزة التي تعمل بواسطة الأشعة تحت الحمراء وغيرها من مصادر التقاط البيانات سواء المرئية للعين البشرية أو غير المرئية. بالإضافة إلى الكمية الهائلة من البيانات المرئية (حيث يتم مشاركة أكثر من 3 مليار صورة عبر الإنترنت كل يوم)، فقد أصبحت القدرة الحاسوبية اللازمة لتحليل البيانات متاحة الآن وبأسعار معقولة. ونظرًا لنمو مجال البصيرة الحاسوبية باستخدام تقنيات وخوارزميات حديثة، فقد ارتفعت معدلات دقة تحديد الأجسام في أقل من عقد حتى وصلت اليوم إلى %99 مما يجعلها أكثر دقة من البشر في الاستجابة السريعة للمدخلات البصرية.
كيف تعمل البصيرة الحاسوبية؟
يكمن أحد العوامل الأساسية لتحقيق جميع قدرات الذكاء الاصطناعي في منح الآلات قدرة الرؤية. فمن أجل محاكاة الرؤية البشرية، تحتاج الآلات إلى الحصول على الصور ومعالجتها وتحليلها وفهمها. حيث يتم تحقيق النمو الهائل في هذا المجال من خلال التعلم المتكرر الذي أصبح ممكنًا بفضل الشبكات العصبية التي تبدأ بمجموعة منظمة من البيانات التي تساعد الآلة على تعلم موضوع معين. على سبيل المثال ما قامت به جوجل في عام 2012 عندما عملت على تطوير تطبيق رؤية حاسوبية قادر على تحديد مقاطع الفيديو الخاصة بالقطط، حيث قامت مجموعة البيانات المستخدمة من قبل الشبكات العصبية بتجميع صور ومقاطع فيديو تحتوي على قطط بالإضافة إلى صور بدون قطط. ثم بدأت بعملية تمييز كل صورة ومقارنتها بالبيانات الوصفية التي تشير إلى الإجابة الصحيحة. من خلال هذه التقنية تم التوصل إلى خاصية تستخدمها الشبكات العصبية وهي التعرف على الأنماط لتمييز الأجزاء المختلفة من الصورة. فبدلاً من تحديد مبرمج للسمات التي تشكّل القطط مثل وجود ذيل وشعر، بدأت الآلة بتعلم أنماط تعريف مختلفة من خلال ملايين الصور التي تم تحميلها وتحليلها.
7 أمثلة مذهلة على البصيرة الحاسوبية
لاستيعاب القدرات البصرية المذهلة التي أصبحت الحواسيب والآلات تمتاز بها، علينا أن نتأمل كل ما نمتاز به كبشر وكل ما ساعدنا على التطور بفضل ما نمتلكه من قدرات بصرية مرتبطة بشكل مباشر بقدراتنا الذهنية. فيما يلي سوف نتحدث عن أهم سبع تطبيقات عملية تعكس التطور الهائل الذي شهدته القدرات البصرية الحاسوبية خلال السنوات القليلة الماضية:
١. المركبات ذاتية الحكم
نظرًا لأهمية الرؤية الحاسوبية في تمكين السيارات ذاتية القيادة، فقد بدأت شركات تصنيع السيارات مثل تسلا وبي إم دبليو وفولفو وأودي باستخدام عدة كاميرات وأجهزة ليدار ورادار واستشعار بالموجات فوق الصوتية للحصول على صور من البيئة حتى تتمكن سياراتهم ذاتية القيادة من اكتشاف الأجسام والعلامات والخطوط وإشارات المرور لتحقيق قيادة أكثر أمنًا.
٢. تطبيق جوجل للترجمة
كل ما عليك فعله لقراءة الجمل بلغة أجنبية هو توجيه كاميرا هاتفك إلى الجمل المحددة وترك تطبيق الترجمة لكي يخبرك بما تعنيه بلغتك المفضلة وبشكل فوري، وذلك باستخدام خاصية التعرف الضوئي لرؤية صور الحروف، بالإضافة إلى تقنية الواقع المعزز لتركيب جمل جديدة بترجمة دقيقة.
٣. تقنية التعرف على الوجوه
من المؤكد أن الصين أصبحت تتصدر قائمة الدول التقنية في مجال استخدام تكنولوجيا التعرف على الوجوه، حيث يتم استخدمها في أعمال الشرطة وبوابات الدفع ونقاط التفتيش الأمنية في المطارات وحتى لتوزيع ورق التواليت ومنع سرقته في حديقة تيانتان في بكين، من بين تطبيقات كثيرة أخرى.
٤. الرعاية الصحية
أصبح لتطبيقات الرؤية الحاسوبية في المجال الطبي دورًا كبيرًا نظرًا لزيادة اعتماد جميع البيانات الطبية على الصور بنسبة 90٪. بدءًا من تمكين طرق التشخيص الطبي الجديدة لتحليل الأشعة السينية والتصوير الشعاعي للثدي وغيرها من عمليات الفحص، إلى مراقبة المرضى لتشخيص الحالات المرضية في وقت مبكر والمساعدة في الجراحة، ومن المتوقع أن تزداد استفادة مؤسساتنا الطبية والمهنيون والمرضى من الرؤية الحاسوبية اليوم وأكثر في المستقبل نظرًا لاعتمادها رسميًا في مجال الرعاية الصحية.
٥. متابعة الأنشطة الرياضية في الوقت الحقيقي
رغم أن متابعة تفاصيل الألعاب الرياضية أصبح شائعًا منذ فترة، إلا أن الرؤية الحاسوبية أصبحت تلعب دورًا رئيسيًا وكبيرًا في تحليل الإستراتيجيات المستخدمة من قبل الفرق الرياضية بالإضافة إلى تقييم أداء اللاعبين، وكذلك تتبع وتقييم مستوى العلامات التجارية الداعمة لهذه الألعاب أثناء العروض المباشرة.
٦. الزراعة
خلال معرض الإلكترونيات الاستهلاكية لعام 2019، كشفت شركة جون ديري عن أحدث آلاتها الزراعية المتطورة وهي عبارة عن حاصدة شبه مستقلة تستخدم الذكاء الاصطناعي والرؤية الحاسوبية لتحليل جودة الحبوب أثناء حصادها وإيجاد الطريق الأمثل للحركة عبر المحاصيل. هناك أيضًا تطبيقات هامة للرؤية الحاسوبية لتحديد الأعشاب الضارة بحيث يمكن رش مبيدات الأعشاب مباشرة عليها بدلاً من رشها على المحاصيل، الأمر الذي من شأنه أن يسهم في تقليل كمية مبيدات الأعشاب المستخدمة في مجال الزراعة بنسبة 90 في المئة.
٧. التصنيع
تساعد الرؤية الحاسوبية المصنّعين على العمل بأمان وذكاء وفعالية بطرق متنوعة. حيث تعد الصيانة التنبؤية مثالاً واحدًا على التطبيقات المتنوعة في هذا المجال، فمن خلالها تتم مراقبة المعدات للتدخل قبل أن تتسبب الأعطال في حدوث أنهيار كلي ومكلف للأجهزة. كما تتم بواسطة الرؤية الحاسوبية مراقبة عمليات التغليف وجودة المنتج، بالإضافة إلى متابعة المنتجات غير السليمة والتخلص منها قبل وصولها إلى المراحل الأخيرة للإنتاج مما يسهم في تقليل التكاليف.
رغم حداثة تقنية الرؤية الحاسوبية إلا أنها أصبحت بالفعل جزءًا أساسيًا وشائعاً من حياتنا اليومية. ومن المتوقع أن يزداد دورها في السنوات المقبلة نظراً لزيادة الشراكة بين البشر والآلات، هذا الأمر من شأنه أن يعمل على تحرير القوى العاملة البشرية للتركيز أكثر على المهام الأكثر تعقيداً بينما تعمل الآلات على أتمتة العمليات التي تعتمد على التعرف البصري.
من حياتنا اليومية. ومن المتوقع أن يزداد دورها في السنوات المقبلة نظراً لزيادة الشراكة بين البشر والآلات، هذا الأمر من شأنه أن يعمل على تحرير القوى العاملة البشرية للتركيز أكثر على المهام الأكثر تعقيدًا بينما تعمل الآلات على أتمتة العمليات التي تعتمد على التعرف البصري.
المصدر: برنارد مار & كو
اترك تعليقاً