تمييز الصوت

[email protected]

"تطبيقات حديثة ومخاطر مصاحبة"

في المقالات السابقة تحدثنا باختصار عن أساسيات تقنية تمييز الصوت وشرحنا كيف تعمل وبعض تطبيقاتها، ولكننا لم نتطرق إلى آخر ما وصلت إليه هذه التقنية, وأشهر البرامج المستخدمة لتمييز الصوت, والآثار السالبة لهذه التقنية.
التحويل الآلي من صوت إلى صوت والمعروف بـ speech speech – to- من أهم التطبيقات الحديثة لتمييز الصوت، حيث إن وزارة الدفاع الأمريكية تقوم حالياً بتموين مشروع كبير عن طريق ما يعرف بـ DARBA Projects لمساعدة أفراد الجيش الأمريكي في العراق، خصوصاً في حالة الطوارئ في المستشفيات. باختصار شديد هذا النظام يُعطي العسكري الأمريكي إمكانية التحدث إلى الفرد العراقي "أنياً" ومن دون مترجم. يتحدث الفرد الأمريكي باللغة الإنجليزية ويحولها جهاز تمييز الصوت Speech Recognition إلى نص إنجليزي ومن ثم يُترجم النص إلى اللغة العربية وبعد ذلك يُحول النص العربي إلى حديث باللغة العربية يفهمها الشخص العراقي الذي لا يُجِيد اللغة الإنجليزية.
ما العوائق والمشكلات المصاحبة للغة العربية؟
تعدد معاني الكلمات, والتشكيل الذي يُغير من معنى الكلمة, وصيغ المفرد والجمع, وأل التعريف تشكل عوائق كبيرة أمام الباحثين في اللغة العربية أكثر من اللغة الإنجليزية. فعلى سبيل المثال, في اللغة الإنجليزية نستطيع أن نقول كتاب Book، الكتاب The Book، لكن في حالة اللغة العربية يوجد هناك أكثر من تصريف لكلمة كتاب مثل "كتاب، الكتاب، الكتيبان، فالكتاب، كتابي ... الخ". يمكن التَعَرُف على كلمة كتاب فقط ومن ثم يُضاف التعريف، وهذا يُضِعف عملية تمييز الصوت. اللغة العربية مشكلتها عدد الكلمات الهائل جدا مقارنة بعدد الكلمات القليل "نسبياً" في حالة اللغة الإنجليزية.
تُعتَبر شركتي IBM وشركة صخر من أشهر الشركات العالمية التي تنتج برامج تمييز الصوت, ويوجد لها منتجات أثبتت جدارتها في معظم التطبيقات, خصوصاً في مجال التحويل من حديث إلى نصSpeech to Arabic.
هل هناك مخاطر لتقنية تمييز الصوت؟
تكمن خطورة تمييز الصوت فيما يلي:
يمكننا تسجيل صوت شخص "ما" ومن ثم حفظ الفونيمة "نبرة الصوت" لكل حرف. بعد ذلك يمكننا تركيب أو تزوير حديث جديد بصوت الشخص نفسه رغم أنه لم يقله. وهذه تعتبر من الاستخدامات السيئة لهذه التقنية, التي يمكن أن تُحِدِث كوارث فيما بين أفراد المجتمع. لهذا السبب لا يمكن استخدام تسجيل الصوت في بعض المحاكم الدولية كدليل إدانة لشخص المتهم. ومن التطبيقات الحديثة إدخال برنامج تمييز الصوت ضمن برامج مايكروسوفت الجديدة باللغة الإنجليزية.
ما أشهر النماذج المستخدمة في تمييز الصوت؟
من أشهر النماذج العالمية الحالية ما يُعرف بنموذج ماركوف الخفي Markov Model Hidden ونموذج الشبكات العصبيةNeural Network. النماذج تحتاج إلى عمليات معالجة ضخمة جداً وسرعات عالية وسعة تخزين كبيرة . ولكن مع التطورات الحديثة في عالم المعالجات الحاسوبية, أصبح بالإمكان تنفيذ العمليات الرياضية المعقدة وبسرعات عالية جداً. صُممت المعادلات الرياضية للتعامل مع المعلومات المُعَرَفة مسبقاً في الحاسوب لكي يتم اختيار المعلومة المُخفاة في المكتبة الإحصائية المخزنة بداخل النظام، حيث تخضع كل فونيمة في سياق الحديث إلى فحص دقيق ومن ثم مقارنتها من خلال النموذج الإحصائي مع الفونيمات المخزنة.

مناقشة دكتوراه في التشفير وأمن المعلومات:
تم مناقشة رسالة دكتوراه في قسم الهندسة الكهربائية في جامعة الملك سعود للعقيد مهندس محمد بن إبراهيم السحيم بعنوان: "اللامتغيرات في الصور الرقمية المتعرضة لضغط JPEG والستيرمارك StirMark وتطبيقاتها في إخفاء المعلومات"، التي كانت تحت إشراف البروفيسورعبد الرحمن بن خالد الجبري، وقد شارك في عضوية اللجنة المناقشة كُلاً من: البروفسور عمرو يوسف أستاذ التشفير وأمن المعلومات في جامعة كونكورديا في كندا، البروفيسور عوض بن خزيم الأسمري، البروفيسور صالح بن عبد الله الشبيلي، والدكتور إبراهيم الشاذلي.
في هذا البحث تم دراسة بعض اللامتغيرات في الصورة المتعرضة للضغط والستيرمارك وتطوير طريقة لإخفاء المعلومات في الصور ومن ثم إمكانية استخلاصها بعد تعرضها للضغط والستيرمارك وذلك اعتمادا على هذه اللامتغيرات لتجاوز التغيرات الشاملة والموضعية، وكذلك الضوضاء العشوائية الناتجة عن السترمارك، إضافة إلى التغير في القيم النقطية للصورة المضغوطة. تضمنت الدراسة تحليلا رياضيا للامتغيرات في الصورة قبل وبعد التعرض للضغط والستيرمارك،إضافة إلى تصميم برنامج حاسوبي لمحاكاة الطريقة المقترحة لإخفاء المعلومات واستخلاصها، حيث تم تطوير وسائل مبتكرة وذات كفاءة عالية لمنع هذه الهجمات.
ويتوقع أن يكون لها تطبيقات في مجالات كثيرة، منها على سبيل المثال: حماية حقوق الملكية الفكرية وإرسال المعلومات المشفرة عبر الوسائط المختلفة.

الأكثر قراءة

المزيد من مقالات الرأي