بيت سمعي كيف يمكن أن تُمكّن قدرات التعلم الآلي الجديدة من استخراج مستندات الأسهم للبيانات المالية؟

كيف يمكن أن تُمكّن قدرات التعلم الآلي الجديدة من استخراج مستندات الأسهم للبيانات المالية؟

Anonim

Q:

كيف يمكن أن تُمكّن قدرات التعلم الآلي الجديدة من استخراج مستندات الأسهم للبيانات المالية؟

أ:

واحدة من الحدود الجديدة المثيرة للتعلم الآلي و AI هي أن العلماء والمهندسين يشرعون في طرق مختلفة لاستخدام أنواع جديدة تمامًا من الموارد للتنبؤ بحركة الأسهم ونتائج الاستثمار. هذا هو المغير لعبة هائلة في العالم المالي ، وسوف تحدث ثورة في استراتيجيات الاستثمار بطريقة عميقة جدا.

واحدة من الأفكار الأساسية لتوسيع هذا النوع من أبحاث الأسهم هي اللسانيات الحاسوبية ، والتي تنطوي على نمذجة اللغة الطبيعية. يبحث الخبراء في كيفية استخدام المستندات النصية ، من ملفات SEC إلى رسائل المساهمين إلى الموارد الأخرى المستندة إلى النصوص الطرفية ، من أجل زيادة أو تحسين تحليل المخزون أو تطوير تحليلات جديدة تمامًا.

تحميل مجاني: تعلم الآلة ولماذا يهم

إن إخلاء المسئولية المهم هو أن كل هذا أصبح ممكنًا فقط من خلال التقدم الجديد في الشبكات العصبية والتعلم الآلي وتحليل اللغة الطبيعية. قبل ظهور ML / AI ، كانت معظم تقنيات الحوسبة تستخدم البرمجة الخطية "لقراءة" المدخلات. كانت المستندات النصية غير منظمة لدرجة تجعلها غير مفيدة. ولكن مع التقدم المحرز في تحليل اللغة الطبيعية خلال السنوات القليلة الماضية ، وجد العلماء أنه من الممكن "تحديد لغتي" للغة الطبيعية للحصول على نتائج قابلة للقياس الكمي ، أو بعبارة أخرى ، النتائج التي يمكن حسابها بطريقة ما.

بعض من أفضل الأدلة وأكثر الأمثلة المفيدة على ذلك تأتي من أطروحات مختلفة وأعمال الدكتوراه المتاحة على شبكة الإنترنت. في ورقة بعنوان "تطبيقات التعلم الآلي واللغويات الحاسوبية في الاقتصاد المالي" ، التي نُشرت في أبريل 2016 ، تشرح Lili Gao بفاعلية العمليات ذات الصلة الخاصة باستخراج ملفات SEC للشركات ومكالمات المساهمين ورسائل الوسائط الاجتماعية.

"إن استخراج إشارات ذات معنى من بيانات نصية غير منظمة وعالية الأبعاد ليس بالأمر السهل" ، كتب غاو. "ومع ذلك ، ومع تطور التعلم الآلي والتقنيات اللغوية الحاسوبية ، يمكن إنجاز مهام المستندات النصية وتحليلها إحصائيًا ، وقد أثبتت العديد من تطبيقات تحليل النص الإحصائي في العلوم الاجتماعية نجاحها." من مناقشة غاو للنمذجة والمعايرة في الملخص ، توضح الوثيقة المطورة بأكملها كيف يعمل هذا النوع من التحليل بالتفصيل.

تتضمن المصادر الأخرى للمشروعات النشطة صفحات مثل موجز مشروع GitHub هذا ومورد IEEE الذي يتحدث بالتحديد عن الحصول على معلومات مالية قيمة من "تحليل معنويات Twitter".

خلاصة القول هي أن استخدام نماذج البرمجة اللغوية العصبية الجديدة هذه يدفع الابتكار السريع في استخدام جميع أنواع المستندات النصية ، ليس فقط من أجل التحليل المالي ، ولكن أيضًا لأنواع أخرى من الاكتشافات المتطورة ، مما يؤدي إلى تشويش الخط الفاصل التقليدي بين "اللغة" و "البيانات."

كيف يمكن أن تُمكّن قدرات التعلم الآلي الجديدة من استخراج مستندات الأسهم للبيانات المالية؟