القوة الضخمة للبيانات وتحول الأعمال والتمويل «2 من 2»

|


تستند هذه المناهج بشدة إلى رياضيات الشبكات الاجتماعية التي تطورت في مجال علم الاجتماع، التي تطبق على الشبكات الكبيرة جدا باستخدام نماذج متقدمة لعلوم الحاسوب، وتبلغ ذروتها بالاندماج المثمر لمجالات أكاديمية عدة.
تعد تحليلات النصوص مجالا سريع النمو من مجالات علوم البيانات ومكملا مثيرا للاهتمام للبيانات الكمية في مجال التمويل وعلم الاقتصاد، فقد ظهرت أعداد كبيرة من التطبيقات التجارية التي تستند إلى التنقيب في النصوص، حيث تستنتج شركات مثل iSentium الشعور الأجل وقصير الأجل السائد في السوق من وسائط التواصل الاجتماعي باستخدام "تويتر"؛ وتقدم شبكة StockTwits مؤشرات عن الشعور السائد في السوق من خلال تطبيق على الويب يمكن استخدامه عبر الأجهزة المتنقلة.
ومن الممكن الآن تصنيف شركة ما حسب نتائج الأرباح ربع السنوية التي تعلن عنها في النموذج K-10، وهو تقرير سنوي عن الأداء المالي للشركة يقدم إلى هيئة الأوراق المالية وعمليات البورصة الأمريكية SEC ويقدم سجل الكلمات المتعلقة بالمخاطر في التقارير ربع السنوية نظام تصنيف دقيق للتنبؤ بالأرباح. فالشركات التي تمتلك تقارير ربع سنوية أصعب في القراءة تميل إلى أن تكون قد حققت أرباحا سيئة ـ ومن المرجح أن يرجع ذلك إلى محاولة هذه الشركات الإبلاغ عن أخبار سيئة باستخدام صيغة ما للتشويش وباستخدام مقياس قديم لسهولة القراءة، وهو مؤشر Gunning Fog، من السهل إعطاء درجات للتقارير المالية بشأن هذه الخاصية، وينظر المنظمون مثل مكتب الحماية المالية للمستهلكين في وضع معايير بشأن سهولة قراءة التقارير المالية.
وخلصت الدراسات إلى أن مجرد طول التقرير ربع السنوي يكفي للكشف عن الأخبار السيئة "التقارير الطويلة تشير إلى انخفاض الأرباح"، ومرة أخرى لأن التشويش يرتبط باستخدام الكلام الزائد؛ وقياسا بذلك، فإن حجم الملف وحده الخاص بتقارير الشركات التي ترفع على موقع الإنترنت الخاص بهيئة الأوراق المالية وعمليات البورصة الأمريكية يعطي مؤشرا على أداء الأرباح ربع السنوي. ومن المتوقع تحقيق مزيد من النجاح في إطار هذا المجال سريع التطور.
وينطوي مجال جديد يعرف باسم "تحليلات الأخبار" على التنقيب في الأخبار للبحث عن بيانات. وتتزايد الخدمات التي تقدمها شركات مثل Raven Pack، وتراوح ما بين إعطاء درجات للشعور السائد في السوق وتحليلات التنبؤ بالتجارة إلى التنبؤ الاقتصادي الكلي. وتنقب شركة Raven Pack في كميات ضخمة من البيانات غير المنظمة الواردة في الأخبار ووسائط التواصل الاجتماعي وتحولها إلى بيانات ومؤشرات دقيقة لدعم الشركات المالية في إدارة الأصول، وصنع السوق، وإدارة المخاطر والامتثال.
وضمن هذه الفئة، يعد تحليل تدفق الأخبار مثيرا للاهتمام بشكل خاص. فتنقب صناديق التحوط في آلاف من رسائل الأخبار يوميا بهدف تحديد أهم خمسة أو عشرة موضوعات ثم تتبع التطور في نسبة الموضوعات من يوم لآخر للكشف عن تغيرات في أوضاع السوق يمكن اتخاذ قرارات تداول على أساسها. وقد يكون التحليل المماثل لذلك مفيدا لصناع السياسات والمنظمين، مثل محافظي البنوك المركزية. وعلى سبيل المثال، قد يكون الوقت قد حان لإعادة النظر في سعر الفائدة الرسمي عندما تتغير نسبة موضوعات معينة تناقش في الأخبار "مثل التضخم، أو أسعار الصرف أو النمو" بشكل مفاجئ.
ويبدأ تحليل الموضوعات بإعداد جدول ضخم لتكرار الكلمات، يعرف باسم "مصفوفة مصطلحات الوثائق"، ويعد فهرسا لآلاف المقالات الإخبارية. وترد المصطلحات "الكلمات" في صفوف الجدول، ويمثل كل مقال أخبار عمودا في الجدول. ويمكن أن تكشف هذه المصفوفة الضخمة عن موضوعات من خلال تحليل رياضي للارتباط بين الكلمات وبين الوثائق. وتتم فهرسة مجموعات الكلمات والموضوعات المكتشفة من خلال التعلم الآلي مثل فهرسة الدلالات الكامنة وتخصيص "ديريتشليت" الكامن LDA ويسفر تحليل تخصيص "ديريتشليت" الكامن عن مجموعة من الموضوعات وقوائم الكلمات التي تظهر في هذه الموضوعات. وتعد مناهج إعداد النماذج هذه فنية للغاية لمناقشتها هنا، لكنها في الواقع مجرد تقنيات إحصائية تكشف عن مبدأ تجميع الكلمات الرئيسة الواردة في مجموعة من الوثائق "على سبيل المثال، في تدفق الأخبار" ومن المرجح أن صناع السياسات سيستخدمون هذه الأدلة اللغوية على نطاق واسع في عملية صنع القرارات السياسية، وعلى سبيل المثال في إعادة تعريف رسالة حملة سياسية.
أصبحت أجهزة الحاسوب أقوى مما كانت عليه في أي وقت مضى، وحفزت قدرتها على تجهيز كميات ضخمة من البيانات العمل في مجال الذكاء الاصطناعي. وثبت أن فئة جديدة من الخوارزميات تعرف باسم "شبكات التعلم المتعمق"، المستوحاة من الشبكات العصبية البيولوجية، لديها قوة هائلة في محاكاة الطريقة التي يعمل بها المخ البشري، وقدمت أمثلة ناجحة عديدة على الذكاء الاصطناعي. والتعلم المتعمق هو منهجية إحصائية تستخدم شبكات عصبية اصطناعية بهدف الربط بين عدد كبير من متغيرات المدخلات ومتغيرات المخرجات، أي عملية تحديد للأنماط. ويتم تحليل المعلومات من خلال شبكة من الخلايا العصبية القائمة على السيليكون والبرمجيات. وتستخدم البيانات لتعزيز الروابط بين هذه الخلايا العصبية مثلما يتعلم البشر من التجارب مع مرور الوقت. وتنقسم أسباب النجاح المذهل للتعلم المتعمق إلى شقين: توافر كميات ضخمة من البيانات لتتعلم منها الآلات والنمو المطرد في قوة الحوسبة، المدفوع بالتطور في رقاقات الحاسوب ذات الأغراض الخاصة والمتعلقة بتطبيقات التعلم المتعمق.
ويعطى التعلم المتعمق قوة دفع لجزء كبير من التكنولوجيا المعاصرة التي بدأ العالم يعدها أمرا مسلما به، مثل الترجمة الآلية، والسيارات ذاتية القيادة، والتعرف على الصور والتوسيم. ومن المرجح أن تغير هذه الفئة من التكنولوجيا علم الاقتصاد والسياسات في القريب العاجل. وتستخدمها بالفعل هيئات التصنيف الائتماني لإعداد تقارير دون تدخل بشري. وقد تقدم الشبكات العصبية الكبيرة للتعلم المتعمق قريبا تنبؤات وتحدد العلاقات بين المتغيرات الاقتصادية بطريقة أفضل من الأساليب الإحصائية القياسية.
ومن الصعب التنبؤ بمجالات العلوم غير المثيرة التي ستشهد أكبر نمو في استخدام التعلم الآلي، لكن هذا العصر الجديد قد وصل بالتأكيد. وكما أشار كاتب الخيال العلمي ويليام جيبسون، "المستقبل موجود هنا بالفعل؛ إلا أنه غير موزع توزيعا عادلا".

إنشرها