سامانه پیش بینی مبتنی بر تحلیل داده

در این فرایند داده های مرتبط با حوزه مورد بررسی دریافت شده و سپس بر اساس فرایند استاندارد یادگیری ماشین مراحل زیر طی می گردد که در نهایت سیستم می تواند بر اساس تحلیل انجام گرفته در حوزه های مختلف از قبیل حوزه تقاضا، پیش بینی های مورد نیاز را بصورت هوشمند ایجاد نماید. مراحل کلی این فرایند بصورت زیر می باشد:

گام اول: تعریف مسئله

اولین قدم از یک پروژه یادگیری ماشین تعریف مسئله می باشد. در این مرحله مسئله موجود از قبیل پیش بینی قیمت یا تقاضا و یا هر نوع فعالیت مرتبط با یادگیری ماشین تعریف خواهد شد. سپس متناسب با آن، نوع روش مورد استفاده برای برخورد با مسئله از قبیل یادگیری نظارت شده (Supervised Learning) و یا یادگیری بدون نظارت (Unsupervised Learning) تعریف خواهد شد. سپس معیارها و شاخص های ارزیابی پروژه بصورت دقیق تعریف خواهند شد و در نهایت مفروضات پروژه مشخص خواهند شد.

گام دوم: دریافت داده

در این مرحله بایستی داده های مورد نیاز پروژه تعریف شده و منابع اطلاعاتی موجود به منظور دریافت این داده ها مشخص گردند. مباحث مرتبط با محرمانگی داده ها، حجم داده ها و فرمت اطلاعاتی مورد نیاز بایستی در این مرحله مورد توجه قرار بگیرند.

گام سوم: آماده سازی و تحلیل اولیه داده ها:

در این مرحله پیش پردازش های اولیه مورد نیاز بر روی داده ها از قبیل تکمیل نواقص داده، حذف داده های اضافی و تکمیل فیلدهای اطلاعاتی مورد نیاز در داده ها بایستی بصورت کامل انجام گیرند. خروجی این مرحله شامل داده هایی می باشند که آماده وارد شدن به مرحله تحلیل داده ها هستند.

در مرحله تحلیل داده ها، مواردی از قبیل ترسیم گرافیکی داده ها، تعیین همبستگی بین داده های مختلف، تبدیل های مورد نیاز بر روی داده ها و اضافه کردن داده های اضافی مورد نیاز انجام شده و در نهایت، در این فاز بایستی بینش جامعی نسبت به داده های موجود ایجاد گردد.

گام چهارم: انتخاب مدل های یادگیری ماشین

در این مرحله به دنبال این هستیم که بهترین مدل های یادگیری ماشین را با توجه به معیارهای تعریف شده در مرحله اول تعیین نماییم. بدین منظور مدل های متعدد یادگیری ماشین را با توجه به نوع یادگیری مورد نیاز از قبیل مدل های مبتنی بر رگرسیون، بیز، بردار پشتیبان، درخت تصمیم و یا شبکه عصبی بر روی داده های موجود بررسی کرده و عملکرد و خروجی آن را تست می کنیم. سپس با توجه به خطاهای مدل ها، مناسب ترین آنها انتخاب خواهد شد.

گام پنجم: تنظیم پارامترهای سیستم:

در این مرحله، پس از انتخاب مناسب ترین مدل، بایستی پارامترهای مدل تنظیم و مشخص گردند. هر مدل یادگیری ماشین دارای پارامترهای مختلفی می باشد که بر روی عملکرد آن تاثیرگذار می باشد. در این مرحله بایستی مناسب ترین مقادیر این پارامترهای ورودی را تعیین نماییم.

گام ششم: اجرا و پیاده سازی

در آخرین مرحله، مجموعه مدل و سیستم نهایی شده، بر روی سرور مشتری قرار داده شده و اتصالات مورد نیاز با بانک اطلاعاتی مشتری بر روی آن برقرار می گردد تا بتواند بصورت آنلاین و بر اساس ارتباطات مورد نیاز با سیستم مشتری، عملکرد خود را انجام داده و خروجی را بصورت اتوماتیک در اختیار سیستم مشتری قرار دهد.