جدول المحتويات:
التعريف - ماذا تعني عملية اتخاذ القرار في ماركوف؟
إن عملية اتخاذ القرار في ماركوف (MDP) هي شيء يشير إليه المحترفون باسم "عملية التحكم العشوائي للوقت العشوائي". إنها تستند إلى الرياضيات التي ابتكرها الأكاديمي الروسي أندري ماركوف في أواخر القرن التاسع عشر وأوائل القرن العشرين.
تيكوبيديا توضح عملية اتخاذ القرار في ماركوف (MDP)
إحدى طرق شرح عملية اتخاذ القرار في ماركوف وسلاسل ماركوف المرتبطة بها هي أن هذه العناصر هي عناصر نظرية اللعبة الحديثة المبنية على أبحاث رياضية أبسط من قبل العالم الروسي قبل حوالي مائة عام. إن وصف عملية اتخاذ القرار في Markov هو أنه يدرس سيناريو يكون فيه نظام ما في مجموعة معينة من الحالات ، ويتحرك للأمام إلى حالة أخرى بناءً على قرارات صانع القرار.
تُظهر سلسلة Markov كنموذج سلسلة من الأحداث التي يعتمد فيها احتمال حدوث حدث معين على حالة تم تحقيقها مسبقًا. قد يتحدث المحترفون عن "مساحة حالة قابلة للعد" في وصف عملية اتخاذ القرار في ماركوف - يربط البعض فكرة نموذج قرار ماركوف بنموذج "المشي العشوائي" أو نموذج عشوائي آخر يعتمد على الاحتمالات (نموذج المشي العشوائي ، الذي يتم الاستشهاد به غالبًا على الجدار الشارع ، نماذج حركة الأسهم لأعلى أو لأسفل في سياق احتمال السوق).
بشكل عام ، غالبًا ما يتم تطبيق عمليات اتخاذ القرار في Markov على بعض من أكثر التقنيات تعقيدًا التي يعمل عليها المحترفون اليوم ، على سبيل المثال ، في نماذج الروبوتات والأتمتة والبحث.