FINANCIAL TIMES

فشل «إليكسا» و«هوم» في امتحان المحادثة الحاسم

فشل «إليكسا» و«هوم»
في امتحان المحادثة الحاسم

فشل «إليكسا» و«هوم»
في امتحان المحادثة الحاسم

التحدث إلى جهاز كمبيوتر يمكن أن يشعرك بالتحرر - كما يمكن أن يشهد أي شخص تلقى جهاز أمازون إليكسا أو جهاز جوجل هوم كهدية لعيد الميلاد – ولكنك تظل تشعر بالتحرر فحسب، إلى أن تسأل السؤال الخطأ، ويصبح عندها الجهاز أداة بكماء.
التقدم في خاصية التعرف على الكلام، التي تكمن وراء الإحساس بأنك تستمع إلى صوت طبيعي من الأجهزة التي تعمل بالصوت مثل صوت جهاز إليكسا، هي من بين أكبر الاكتشافات في الذكاء الاصطناعي، على مدى السنوات الخمس الماضية.
مثل التعرف على الصور، التي اتبعت مسارا مماثلا، هذا أعطى أجهزة الكمبيوتر قوى إدراك مماثلة للبشر. كما أنه فتح الطريق أمام تغييرات عميقة في الحياة العملية، بدءا من أتمتة مراكز الاتصال إلى الاستغناء عن علماء الأشعة.
يقول ديف فيروتشي، خبير الذكاء الاصطناعي الذي قاد تطوير نظام واتسون للذكاء الاصطناعي لدى IBM إن من بعض الجوانب: "التأثير مثير للغاية".
في حين أن القدرة على التحدث إلى الآلات جلبت "واجهات جذابة"، كما يقول، إلا أن هناك مشكلة خطيرة: "ليس هناك فهم كبير للغة".
الأنظمة التي تتقن الكلام يمكن أن تصطدم بسرعة بمشاكل أساسية: فهي غالبا ما تتوه عن موضوع المحادثة، أو تسيء فهم المعنى المعقد المشفر في اللغة، أو تفشل في الاستجابة لمعلومات ذات مغزى.
وقال فيروتشي إن بناء أجهزة كمبيوتر تفهم اللغة حقا - وهي مهمة يعتبر بعض الفلاسفة أنها مساوية لما يعني أن تكون إنسانا - سوف يستغرق "عقودا كثيرة".
هذا لم يمنع كثيرا من الخبراء من التنبؤ بأن اللغة على وشك أن تصبح الجبهة الكبيرة التالية في الذكاء الاصطناعي.
أندرو نج، أحد رواد أنظمة التعلم العميق التي تكمن في قلب الذكاء الاصطناعي الأكثر تقدما اليوم، يتوقع أن فهم اللغة هو الآن على أعتاب التحسينات من النوع الذي أحدث ثورة في التعرف على الكلام، والتعرف على الصور حتى الآن.
ولا ينبع استنتاجه من أية اكتشافات تقنية معينة، كما يقول، بل من القوة "الاجتماعية" التي تحرك الباحثين: مثل هذا التخصص كان مهملا في الدراسات الأكاديمية ثم أصبح محور تركيز الطموح والمنافسة الجدية.
في هذه الأثناء، شركة برايمر الناشئة في سان فرانسيسكو جمعت أخيرا الجولة الأولى من رأس المال المغامر للتصدي لفهم اللغة، وهي واحدة من مجموعة من الشركات التي تركز على الأهداف ذات المدى القريب.
هذه الشركات تحاول الاستفادة من القدرات الموجودة - توافر كميات كبيرة من البيانات، وانخفاض تكلفة الحوسبة، والتحسينات في خوارزميات التعلم الآلي – للتعامل مع اللغة من أجل التطبيقات العملية.
يقول شون جورلي، الرئيس التنفيذي لـ "برايمر": "أي شركة تحتاج إلى اكتشافات كبيرة هي في الواقع مجرد تجربة علمية".
على الرغم من أنه يتبين أن التقدم الكبير في فهم اللغة حتى الآن هو بعيد المنال، إلا أن هذه الشركات الناشئة تراهن على الأنظمة التي يمكنها البحث من خلال كتل كبيرة من النصوص واستخراج المعلومات المفيدة.
قال دانييل نادلر، الرئيس التنفيذي لشركة كينشو، وهي ناشئة في نيويورك تأسست قبل أربع سنوات، بهدف استخدام أجهزة الكمبيوتر لتحل محل محللي الأسهم والسندات في وول ستريت، إن قدراتها تتجاوز بكثير قدرة المحللين البشريين.
ويقول: "التغيير الكبير هو فهم السياق، وربط المدخلات بالبيانات بطرق أكثر تعقيدا وأكثر تطورا".
وهذا يعني، على سبيل المثال، معرفة المزيد عن الشخص الذي يطرح سؤالا من أجل التركيز على معناه المحتمل. كما يتضمن دمج البيانات من مصادر متعددة لتقديم إجابات مفيدة.
وكما هو الحال مع كثير من أنظمة الذكاء الاصطناعي اليوم، تعتمد شركة كينشو على التعلم التعزيزي - حيث يقوم البشر بإنشاء حلقة تغذية راجعة عن طريق تسجيل النتائج التي ينتجها النظام – لكي تتحسن بشكل مستمر.
الكمية الكبيرة من البيانات وقوة المعالجة المتاحة الآن للشركات الناشئة تجعل من الممكن بالنسبة لها تقديم تقنيات جديدة، يمكن الاستفادة منها في التغلب على مشكلة اللغة.
بعض هذه الشركات تستخدم الشبكات العصبية: نظم على غرار نظرية تفسر الكيفية التي تتم فيها الاتصالات بين الخلايا العصبية في معالجة المعلومات في الدماغ. إذا أُعطيت هذه الأنظمة التدريب بما يكفي من البيانات، فإنها يمكن أن تكون فعالة بشكل مدهش في العثور على أنماط في البيانات المعقدة - حتى لو لم تتمكن من تفسير أسباب نتائجها.
شركة برايمر، على سبيل المثال، تستخدم تقنية لتحليل الوثائق النصية وإنتاج ملخصات مكتوبة قصيرة.
مثل جميع أنظمة التعلم الآلي، تعتمد على مجموعة كبيرة من البيانات للتدرب على خوارزميتها - في هذه الحالة، 300 ألف زوج من المقالات والملخصات التي كتبها البشر العاملون في صحيفة ديلي ميل أو بثتها شبكة سي إن إن.
التقنيات التي من هذا القبيل سوف تساعد الحواسيب على معالجة المهام التي تدخل ضمن كثير من أنواع العمل المختلفة. ويشير غورلي رئيس شركة برايمر إلى أن حياة الناس العملية تنطوي على التعامل مع الكلمة المكتوبة أكثر من التعامل مع الصور المرئية.
تستهدف شركته مجالات مثل التمويل والاستخبارات التي تعتمد على أعداد كبيرة من المحللين من بني البشر لاستخلاص المعلومات المعبر عنها بلغات مختلفة. ويشمل العملاء لدى متاجر وول مارت، التي يستخدم المحللون لديها عمل برايمر لاستخلاص المعلومات بشأن كثير من السلع والمنتجات المختلفة.
هناك عميل آخر، الشركة الاستثمارية GIC، تقول إنها تجرب استخدام النظام لتحليل البيانات الرئيسية الصادرة عن البنوك المركزية، فضلا عن البحث عن التغييرات التي تطرأ على الصياغة اللغوية التي تستخدمها الشركات في بياناتها الرسمية الدورية إلى الأجهزة التنظيمية ومكالمات الأرباح، بهدف العثور على التطورات التي يمكن أن تفوت على الملاحِظ حين تأتي في طوفان من المعلومات.
على الرغم من أن هذا التعلم الآلي له فوائد عملية، يجادل فيروتشي بأن هذه التقنية، التي تعتمد على التحليل الإحصائي المكثف للكلمات، لا يمكن أن تتغلب تماما على مشكلة اللغة. وهو يقول إن السبب في ذلك هو لأن المعنى لا يكمن في الكلمات نفسها، وإنما في أذهان الناس الذين يستخدمونها؛ عندما يكون لدى شخصين رؤية مشتركة للعالم "فإن الأمر يتطلب القليل جدا من الكلمات لخلق وهم التفاهم".
يشير الخبراء إلى أن ذلك يعني أن الأمر سيتطلب مزيجا من تقنيات الذكاء الاصطناعي، بدلا من "حل فعال بسيط" واحد، لإتقان كل الصفات المعرفية المختلفة التي تدخل في فهم اللغة.
يقول كريس هاموند، أستاذ علوم الكمبيوتر في جامعة نورث وسترن، والمؤسس المشارك لشركة ناراتف ساينس، التي تختص بتوليد تقارير مكتوبة آليا: "ما نحتاج إليه هو أقل ارتباطا بالاكتشافات الكبيرة من الأبحاث، وأكثر تعلقا بدمج الأنظمة المختلفة في نموذج واحد".
فيروتشي، الذي غادر شركة IBM قبل أربع سنوات للعمل في صندوق التحوط بريدج ووتر، أسس منذ ذلك الحين شركة إليمنتال كوجنِشِن، وهي شركة ناشئة تحاول بناء مثل هذا النظام.
وهو يتصور آلة تتفاعل مع الناس بشكل أكبر عمقا بكثير من الذكاء الاصطناعي اليوم، وتطرح الأسئلة باستمرار وتصقل فهمها للعالم، تماما مثلما يفعل الطفل. ويتوقع أن يستغرق الأمر خمس سنوات للتوصل إلى إطار هيكلي لمثل هذا النظام التعليمي – وهو تقريبا الوقت نفسه الذي يتوقع السيد نج أن تستغرقه الآلة قبل أن يحقق فهم اللغة لديها تقدما كبيرا.
إذا كانا على حق، فإن المرحلة التالية من ثورة الذكاء الاصطناعي ستكون أكثر عمقا بكثير من التطورات التي أُحرزت في النصف الأخير من العقد.
حتى قبل ذلك، يمكن أن تصبح أنظمة معالجة اللغات البدائية والفعالة، حقيقة من حقائق الحياة.
إنشرها

أضف تعليق

المزيد من FINANCIAL TIMES