نام مقاله:  پیش بینی کیفیت عظیم داده در صنعت فرآیند: یک چارچوب مدل‌سازی توزیع شده موازی

Big data quality prediction in the process industry: A distributed parallel modeling framework

 

ژورنال: Journal of Process Control

شماره : Volume 68

نویسندگان: Le Yao, Zhiqiang Ge

سال انتشار: آگوست 2018

DOI: https://doi.org/10.1016/j.jprocont.2018.04.004

 

خلاصه: با افزایش روزافزون داده‌های جمع آوری شده حاصل از فرآیند، عصر داده‌های بزرگ به صنعت فرآیند رسیده است.

بنابراین تلاش محاسباتی برای مدل‌سازی داده‌ها و تجزیه و تحلیل در حالات مستقل به ویژه برای فرآیندهای در مقیاس وسیع، به طور فزاینده‌ای مورد نیاز است.

این مقاله یک روش مدل‌سازی فرآیند توزیع شده موازی بر اساس چارچوب MapReduce را برای پیش‌بینی کیفیت عظیم‌داده (big data) ارائه نموده است. در مرحله اول به منظور مدل‌سازی داده‌های توزیع شده موازی در چارچوب MapReduce یک معماری تدوین می‌کند. در مرحله دوم، بر اساس رویکرد مدل‌سازی داده‌های توزیع شده موازی؛ یک طرح پیش‌بینی کیفیت عظیم‌داده را توسعه می‌دهد.

می‌دانیم که MapReduce، یک مدل برنامه‌نویسی ساده است که برای حل مسائل محاسباتی در مقیاس وسیع و نیز به صورت توزیعی، مورد استفاده قرار می‌گیرد. مفهوم MapReduce توسط گوگل در سال ۲۰۰۳ توسعه و ارائه گردید و یک چارچوب نرم‌افزاری است که بستری امن و مقیاس‌پذیر برای توسعه کاربردهای توزیعی فراهم می‌کند.

این مقاله در ادامه با ارائه یک مثال عددی و یک مورد صنعتی واقعی، برتری و اثربخشی روش پیشنهادی را به منظور پیش‌بینی کیفیت عظیم‌داده، نشان می‌دهد.

به طور کلی روش مدل‌سازی مبتنی بر MapReduce قابلیت‌های فوق‌العاده‌ای در پردازش و استخراج اطلاعات از مجموعه داده‌های فرآیندی با مقیاس وسیع نشان می‌دهد. ایده موجود در این مقاله می‌تواند به راحتی در بسیاری از مدل‌های پیش‌بینی کیفیت دیگر که نیازمند یادگیری با مجموعه داده‌های با مقیاس وسیع  هستند، گسترش یابد.

دریافت فایل