مؤتة : دراسات علمية (للحسنات) تحدث اهتماماً اعلامياً واسعاً
تناولت وسائل الإعلام العالمية ووسائل التواصل الاجتماعي على مواقع الانترنت المختلفة اخبار تكنولوجية عن قراءة الشفاة الالية وتمميز الكلام دون الحاجة الى الاشارة الصوتية من خلال شكل الفم والشفاة الناتج بسبب نطق الحروف، وتم التركيز في هذه المقالات على عمل الدكتور احمد الحسنات الاستاذ المساعد والباحث في الذكاء الاصطناعي في قسم تكنولوجيا المعلومات في جامعة مؤته. ونشرت هذه المقالات تحت عناوين مختلفة مثل: “حركة الشفاه يمكن إن تكون كلمة المرور القادمة”، و”تكنولوجيا من جامعة مؤته لقراءة الشفاه من اجل زيادة امن المعلومات والدخول إلى الأنظمة”، و”انتبه لما تقول أنت مراقب”، و”التحديات والتهديدات الناتجة عن قراءة الشفاه الآلية”، و”احذر ما تقول إن الآلات أصبحت تعرف ما تقول”، و”كيف ستصبح كاميرات المراقبة قادرة على قراءة ما تقول”، وغيرها الكثير من العناوين.
تنوعت وسائل الاعلام التي تناولت الخبر من محطات التلفزة في امريكا وراديو استراليا وصحف يومية واسبوعية عالمية تعد بالالاف وبلغات عدة مثل الانجليزية والاسبانية والروسية والايطالية والالمانية والبراتغالية والصينية والهندية واليابانية والتركية وغيرها،حيث تناولت هذه الوسائل الخبر من زوايا مختلفة، مثل اثر اعمال الدكتور الحسنات على امن المعلومات، وتحسين انظمة تمييز الكلام ياستخدام الحواسيب والاجهزة الذكية وتطبيقاتها في الامن والمراقبة. وركزت بعض الصحف على الجاني السلبي لهذه التكنولوجيا وهو امكانية انتهاك الخصوصية للناس من قبل الاجهزة الامنية يحيث يمكن ان تتم معرفة فحوى الحديث من خلال قراءة الشفاه الالية باستخدام كميرات المراقبة المنتشرة في كل مكان، ويمكن تلخيص بعض هذه المقالات بأنه ومهما كانت جودة انظمة تمييز الكلام الالية الا انها ستكون دائما رهينة لبيئتها الصوتية. فعلى سبيل المثال اذا طلبت خدمة آلية عن طريق الهاتف وتم الطلب منك لنطق بعض الارقام فان النتيجة ستكون جيدة اذا كنت في مكتب هادئ، ولكن حاول مرة أخرى بالقرب من طريق مزدحم أو في حفلة صاخبة، ستكون النتيجة سلبية جدا. إلا إذا كان هاتفك يستطيع ببساطة قراءة شفاهك عندها ستكون النتيجة اقل تأثرا بالضوضاء.
الدكتور أحمد الحسنات، استاذ الذكاء الاصطناعي في جامعة مؤتة في الأردن، حاول تعليم برنامج كمبيوتر لفعل ذلك في عدد من ابحاثه في هذا المجال. وقد ركزت المحاولات السابقة للحصول على أجهزة حاسوب قادرة على قراءة الشفاة على شكل وحركة الشفاه الناتجة عن الاصوات (الفونيمات) مثل “ف”، “ي” أو “ج”. وتسمى أشكال الأصوات هذه بـ “visemes”. والمشكلة الحقيقية هنا أن هناك فقط اثني عشر visemes ل 40 إلى 50 من الفونيمات باللغة الانكليزية؛ الأصوات “t” و “d” على سبيل المثال، تبدو متشابهة بشكل ملحوظ لقارئ الشفاه. وهذا يجعل الأمر صعبا من حيث الاعتماد على ال visemes لوحدها لتمييز الكلمات. بدلا من ذلك، قام الدكتور الحسنات بمحاولات عدة على مدى السنوات القليلة الماضية للكشف عن توقيع بصري للكلمات كلها دفعة واحدة، وذلك باستخدام مظهر اللسان والأسنان بالاضافة الى الشفاه، وقد لاقت هذه الطرق بعض النجاح. في ورقة بحثية نشرت في أواخر العام الماضي، درب الدكتور الحسنات نظامه من خلال تصوير 10 نساء و 15 رجلا من عرقيات مختلفة لأنها قراءة مقاطع معينة من نصوص مدروسة بعناية. في البداية يتم تعريف الحاسوب بالنصوص المقروؤة وربطها مع التسجيلات، وهذه تسمى مرحلة التدريب وتتم من خلال خوارزميات خاصة بذلك، ثم مرحلة الفحص، حيث يحاول الحاسوب التعرف على الكلام من خلال ما كان يقال يقال في التسجيلات الاخرى لنفيس الاشخاص. عندما تم تدريب نفس الشخص وتم فحصه بتسجيل أخر كانت النتائج إلى حد ما دقيقة، حوالي 75٪ لجميع الاشخاص، واحيانا تصل إلى 97٪ لبعض الاشخاص في عينة الدراسة. ولكن عندما تم التدريب على اشخاص معينين ثنم تم الفحص على اشخاص أخرين لم يتم تدريب الحاسوب على اشكال شفاههم ولا طريقة حديثهم انخفضت دقة البرنامج إلى 33٪ في المتوسط، وحيانا إلى 15٪ في بعض الحالات وعزي ذلك الى وجود بعض الشوائب في الاشارة المرئية مثل (الشوارب واللحى، بالضافة الى المظهر المختلف لافواه عينات الدراسة، وثمة مقالات اخرى ركزت على لتطبيقات هذه الابحاث وهي:
– شكل جديد لأمن المعلومات تم ايجاده باستخدام حركات واشكال الشفاه للمستخدم باعتبارها كلمة السر لفتح الأجهزة او الدخول الى الانظمة. قدمت هذه التكنولوجيا الجديدة في ورقة بحثية للدكتور أحمد الحسنات من قسم تكنولوجيا المعلومات في جامعة مؤتة الأردنية. نشرت هذه الورقة البحثية بعنوان “كلمات السر المرئية باستخدام قراءة الشفاه الآلية ” في المجلة الدولية للعلوم: البحوث الأساسية والتطبيقية.
وتعتبر بصمة الإصبع كالتي تستخدم على بعض أجهزة الهاتف الذكية من احد الأنظمة الحديثة المستخدمة في عمليات التوثق من صاحب الجهاز، أما تكنولوجيا قراءة الشفاه المقترحة من قبل الدكتور الحسنات فتعتبر شكلا أخر لتحديد هوية الشخص، وستجد طريقها لتطبيقات أمنية كثيرة على مستوى أجهزة الحاسوب والأجهزة الخلوية على حد سواء.
التكنولوجيا المقدمة من الدكتور الحسنات قادرة على قراءة الشفاه المستخدم لأغراض التوثيق، مما يتيح للمستخدم الدخول إلى الحاسوب والأنظمة المؤمنة. إن أمن الحاسوب لا يعتمد ببساطة على الكلمة المنطوقة بعينها، بل على طريقة اللفظ وشكل ومظهر الفم الذي يختلف من شخص إلى آخر، بالإضافة إلى وجود عوامل أخرى مثل كمية الأسنان و اللسان التي تظهر أثناء عملية نطق الكلمة. حيث إن دقة النظام بهذه الطريقة تصل إلى حوالي 80% .
كما وأظهرت الأوراق البحثية للحسنات أن هذا النظام يتطلب مرحلتين. المرحلة الأولى هي تسجيل وتخزين كلمة المرور المرئية، والمرحلة الثانية هي التحقق من هذه كلمة للدخول إلى النظام مستقبلا. حيث يطلب من المستخدمين إنشاء كلمة مرور مرئية من خلال التحدث لأول مرة أمام الكاميرا، والتي من خلالها يقوم النظام بالتقاط فيديو لوجه المستخدم. حيث تتم بعد ذلك تحديد منطقة الفم والشفاء واستخلاص الخصائص المميزة للحصول في النهاية على سلسلة من القيم والأرقام التي تحدد مقدار فتحة واتساع الفم وظهور الأسنان واللثة واللسان التي تنم عن الحروف والأصوات المنطوقة. وعندما يحاول المستخدم في وقت لاحق الدخول إلى النظام المؤمن، تتم العملية بنفس الخطوات السابقة للحصول على سلسلة من الخصائص المميزة للمستخدم وللكلمة المنطوقة، حيث تتم مقارنتها مع ما تم تخزينه سابقا، إذا تمت المطابق نسبة عالية يتم الدخول إلى النظام وإلا فلا.
والجدير ذكره بأنه قد تم تقييم النظام عن طريق الحسنات باستخدام قاعدة بيانات فيديو تحتوي على 20 شخصا مختلفا، من بينها 10 من الإناث و 10 من الذكور. وهناك أيضا قاعدة بيانات فيديو آخر تتألف من 15 من الذكور من طلاب جامعة مؤته.
أثبتت التجارب جدوى تكنولوجيا قراءة الشفاه التي وضعها الحسنات، بمتوسط نسبة الخطأ بين 7.63 في المائة و 20.51 في المائة. كما اظهرت الدراسة امكانية استخدام هذه التكنولوجيا في تطبيقات كثيرة ويمكن زيادة الدقة من خلال زيادة عدد كلمات المرور المرئية واستخدام كلمات سرية تقليدية وأسماء مستخدمين. والجدير بالذكر إن بعض سائل الإعلام اثارت مخاوف من إمكانية استخدام هذه التكنولوجيا من قبل كاميرات المراقبة المنتشرة للتجسس على أحاديث الناس مما يعتبر خرقا للخصوصية.