بيت اتجاهات لماذا تشغيل التدريب ml على جهاز محلي ثم قم بتشغيل التنفيذ العادي على الخادم؟

لماذا تشغيل التدريب ml على جهاز محلي ثم قم بتشغيل التنفيذ العادي على الخادم؟

Anonim

Q:

لماذا تشغيل التدريب على التعلم الآلي (ML) على جهاز محلي ثم تشغيل التنفيذ العادي على خادم؟

أ:

إن مسألة كيفية هيكلة مشروع التعلم الآلي ومراحل التدريب والاختبار له علاقة كبيرة بالطريقة التي نتحرك بها من خلال "دورة حياة" ML وننقل البرنامج من بيئة التدريب إلى بيئة الإنتاج.

من بين أبسط الأسباب لاستخدام النموذج أعلاه المتمثل في وضع تدريب ML على جهاز محلي ومن ثم نقل التنفيذ إلى نظام قائم على الخادم هو الاستفادة من الفصل الضروري بين الواجبات. بشكل عام ، تريد عزل مجموعة التدريب ، بحيث يكون لديك صورة واضحة عن المكان الذي يبدأ فيه التدريب ويتوقف ، وأين يبدأ الاختبار. تتحدث مقالة KDNuggets هذه عن المبدأ بطريقة خفية بينما تمر أيضًا ببعض الأسباب الأخرى لعزل مجموعات التدريب على جهاز محلي. أحد الافتراضات الأخرى للقيمة الأساسية لهذا النموذج هي أنه ، مع مجموعات التدريب والاختبار على أبنية مختلفة تمامًا ، لن تشعر أبدًا بالارتباك بشأن تخصيص تدريب / اختبار مشترك!

فائدة أخرى مثيرة للاهتمام تتعلق بالأمن السيبراني. يشير الخبراء إلى أنه إذا كان لديك عمليات القطار الأولية على جهاز محلي ، فلن يكون من الضروري أن تكون متصلاً بالإنترنت! يعمل هذا على توسيع نطاق الأمان بطريقة أساسية ، "احتضان" العملية حتى تصل إلى عالم الإنتاج ، حيث يتعين عليك بناء أمان مناسب في طراز الخادم.

بالإضافة إلى ذلك ، قد تساعد بعض هذه النماذج "المنعزلة" في حل مشاكل مثل انحراف المفاهيم والسياقات الخفية - يحذر مبدأ "عدم اللزوجة" المطورين من أن البيانات "لا تبقى كما هي" بمرور الوقت (اعتمادًا على ما يتم قياسه) و قد يستغرق الأمر الكثير من القدرة على التكيف لجعل مرحلة الاختبار تتناسب مع مرحلة القطار. أو ، في بعض الحالات ، تختلط عمليات القطار والاختبار معًا ، مما يؤدي إلى إرباك.

يمكن أن يؤدي نشر مرحلة الاختبار على خادم لأول مرة إلى تسهيل نماذج "الصندوق الأسود" المختلفة حيث يمكنك حل مشكلة قابلية التكيف للبيانات. في بعض الحالات ، فإنه يلغي العملية الزائدة المتمثلة في وضع أوامر التغيير على منصات متعددة.

ثم ، أيضًا ، تخدم بيئة الخادم بشكل واضح العمليات في الوقت الفعلي أو الديناميكي الذي سيرغب المهندسون في الوصول إلى نماذج نقل البيانات والشفرات التي تعمل بشكل أفضل من أجل الإنتاج في ML. على سبيل المثال ، قد يكون AWS Lambda خيارًا جذابًا للتعامل مع الوظائف المصغرة للإنتاج (أو مزيج من تخزين كائنات Lambda و S3) وبدون اتصال (بدون خادم) يصبح ذلك مستحيلًا.

هذه هي بعض المشكلات التي قد يفكر فيها مطورو البرامج عند التفكير في كيفية تقسيم مراحل تدريب ML من الاختبار والإنتاج.

لماذا تشغيل التدريب ml على جهاز محلي ثم قم بتشغيل التنفيذ العادي على الخادم؟