اصطلاح "عظیم داده" توسط متخصصان صنعت نیرو مورد استفاده قرار می‌گیرد، اما این اصطلاح واقعاً چه معنایی دارد. برای پاسخ به این پرسش  به سراغ «آکشی پاتوال»، مدیر بازرگانی استراتژیک شرکت انرژی زیمنس رفتیم که با استفاده از پلتفرم های عظیم داده  و تحلیلگری، هدایت خدمات داده محور، توسعه و تجاری سازی پروژه‌های تحول تجارت دیجیتال را عهده دار است و لذا دانش زیادی در این زمینه دارد.    

عظیم داده برای شما چه معنایی دارد؟

«عظیم داده» در تولید نیرو به مقدار عظیمی از داده بازمی‌گردد که از منابع مختلف نیروگاه‌های برق بدست می‌آید. اندازه داده‌ای که ما در اینجا بررسی می‌کنیم بر حسب ترابایت یا حتی بیشتر است. عظیم داده دارای مشخصات زیر است:

  • پیش‌بینی حجم عظیمی از داده‌ها و نیازمندی به فضای ذخیره‌سازی مورد نیاز. بنابراین زیرساخت‌های سخت افزاری و نرم افزاری باید بصورت مرتب ارتقا یابند تا با افزایش حجم مواجه شوند.
  • سرعت تولید داده‌ها از ثانیه دوم تا دقیقه متغیر بوده و رویکردهای مدیریت و دستیابی به اطلاعات در زمان واقعی باید اتخاذ شوند.
  • داده های تولید شده در قالب های مختلفی شامل متن، عکس، فیلم، صفحات گسترده و پایگاه داده است.

به طور کلی دو نوع داده داریم:

  • داده های عملیاتی. این داده‌ها از حسگرهای مختلف جاسازی شده در دارایی‌ها برای اندازه گیری معیارهای عملیاتی مختلف مانند دما، فشار، کارایی و ... دارایی یا گروهی از دارایی‌ها بدست می‌آید.
  • داده‌های سیستمی. این داده‌ها اطلاعاتی را در مورد وضعیت دارایی، سوابق نگهداری، سوابق نصب، سوابق تعمیرات، جزئیات تبادل قطعات، عکس‌ها یا فیلم‌های دارایی و غیره ارائه می‌دهند که به دلیل ماهیت غیرساختاریافته برخلاف داده‌های عملیاتی نمی‌تواند در یک صفحه گسترده قرار گیرند. برخی از این سوابق می‌توانند متن آزاد باشند و به منظور تجزیه و تحلیل آن بایستی روش‌های تحلیلی پیشرفته ای نظیر پردازش زبان طبیعی پیاده سازی شود. یکی از چالش‌ها تبدیل این داده‌های بدون ساختار به ساختار یافته برای تحلیلگری است.

چگونه عظیم داده به شرکت‌های فعال در حوزه نیرو منفعت می‌رساند؟

ارزش واقعی داده‌ها تنها زمانی امکان پذیر است که داده‌هایی با حجم، سرعت و تنوع متفاوت در یک مجموعه داده ادغام شوند که با استفاده از تحلیلگری آن بتوان تصویر کلی مربوط به رفتار دارایی، مدل‌های تجاری مشتری و پویایی بازار را درک نمود.

عظیم داده علیرغم سودمندی بسیار جهت درک رفتار دارایی، مدل‌های تجاری مشتری و پویایی بازار، چالش‌های زیادی را به وجود می‌آورد که شامل موارد زیر است:

  • افزایش داده‌ها یکی از اساسی‌ترین چالش‌های صنعت تولید برق، ذخیره سازی و تجزیه و تحلیل حجم ترابایت داده‌ها است. با توجه به تولید سریع داده، پیش بینی می‌شود که داده‌ها هر دو سال دو برابر شود. بخش بزرگی از این داده‌ها بدون ساختار هستند و برای تبدیل به قالب قابل استفاده به پردازش ویژه نیاز دارند.
  • اکتساب و ذخیره اطلاعات. به دست آوردن داده‌ها از منابع مختلف نیازمند اتصال قوی، روال‌های ممتاز ETL (استخراج ، تبدیل و بارگذاری) و پایگاه داده‌های رابطه‌ای دارد. اتصال، برای اطمینان از اختلالات محدود و تأخیر کم انتقال داده‌ها از منبع به منطقه فرود داده‌ها، «اتصال» کلید اصلی است. فرایند ETL باید بتواند در دسترس بودن داده‌ها را بررسی نموده و قالب‌های داده غیر قابل استفاده را به یک فرم قابل استفاده تبدیل و از بارگذاری داده‌ها بر این اساس اطمینان حاصل کند. پایگاه‌های داده مورد استفاده باید ماهیتی رابطه‌ای داشته باشند.
  • اعتبارسنجی داده‌ها. اعتبارسنجی داده‌های به دست آمده از منابع مختلف جنبه مهمی از مدیریت عظیم داده است. حاکمیت داده بسیاری اهمیت دارد زیرا داده‌ها باید از نظر صحت، اعتبار، قابلیت اطمینان و محتوا بررسی شوند تا اطمینان حاصل شود که می‌توانند برای تجزیه و تحلیل استفاده شوند. داده ها باید از نظر مقادیر و محتوا درست باشند. مقادیر ارائه شده باید معتبر و قابل اعتماد باشند تا کاربران بتوانند آنها را قبول نمایند. همچنین باید کمترین وقفه در جریان داده ها وجود داشته باشد تا خلاء موجود در داده‌ها به حداقل برسد. برای یک حاکمیت داده ای قوی و ساده، باید ترکیبی از سیاست ها و تغییرات فناوری از جمله یک چارچوب موثر مدیریت داده وجود داشته باشد.
  • امنیت داده‌ها. به دلیل ارزش داده ها برای سازمان، امنیت داده‌ها اهمیت دارند. جلوگیری از هک داده‌ها، حملات سایبری، بدافزارها و ویروس‌ها دارای اهمیت بسیار است زیرا تحلیلگری نادرست یا قرار گرفتن داده ها نزد اشخاص اشتباه باعث صدمات جبران ناپذیری به سازمان می‌شود. برخی از رویکردهای داده‌های امنیتی که به تازگی اتخاذ شده اند شامل کنترل هویت و دسترسی، رمزگذاری داده‌ها و تفکیک داده‌ها می باشد.
  • یکپارچه سازی داده‌ها. همانطور که قبلاً ذکر شد، حجم، تنوع و سرعت داده‌ها ادغام آنها در قالب قابل استفاده برای تحلیلگری به چالش می‌کشد. ترکیب داده‌های ساختارمند و بدون ساختار با قالب ها و واحدهای مختلف بسیار پیچیده است. ارزش واقعی داده ها تنها زمانی قابل دسترس است که متخصص داده قادر به تحلیلگری این مجموعه داده ترکیبی باشد.
  • بینش مرتبط. فهم و بصیرت به دست آمده از تحلیلگری و عظیم داده باید مرتبط و به موقع باشد. تحلیلگری داده ها به تنهایی برای کسب بینش آشکار به هیچ سازمانی کمک نمی کند بلکه باید تحلیلگری مجموعه داده در نظر گرفته شده، به صرفه جویی در هزینه، افزایش درآمد، افزایش تولید، قابلیت اطمینان بهبود یافته، تعمیر و نگهداری بهینه، ایجاد مدل کسب و کار جدید ،درک بهتر صنعت و رفتار مشتری و غیره منجر شود.
  • مدیریت استعداد عظیم داده. پرداختن به جنبه‌های مختلف مدیریت و تحلیلگری داده‌ها به استعدادها و مهارت‌های ویژه ای نیاز دارد. به دلیل اولویت‌بندی ناگهانی داده‌ها به عنوان یک دارایی در سازمان‌ها، تقاضای استعدادهای مورد نیاز در این زمینه افزایش یافته است. در میان شرکت‌ها رقابتی جهت جذب و نگهداشت کارشناسان کلیدی عظیم داده در جریان است. شرکت‌ها مجبورند بودجه و تلاش‌های خود را برای استخدام و فرصت‌های آموزشی برای توسعه استعدادهای مورد نیاز افزایش دهند. خرید استارتاپ‌ها و ابزارهای عظیم داده نیز در حال افزایش است.
  • فرهنگ سازمانی. علاوه بر چالش های فناوری و لجستیکی، چالش اصلی دیگر اتخاذ این رویکرد جدید توسط فرهنگ سازمانی بوده است. به دلایل مختلف از جمله عدم هماهنگی سازمانی کافی، عدم درک کافی در بین سطوح مختلف سازمان ها و مقاومت در برابر پذیرش توسط کاربرانی که از روش های سنتی تبعیت می کنند، رویکردهای دیجیتال در بسیاری از سازمان‌ها کاملاً یکپارچه نیستند. اگر سازمان‌ها بخواهند در اقتصاد مبتنی بر داده‌ها رقابت کنند، باید نقش جدیدی تحت عنوان «مدیر ارشد دیجیتال» تعیین نمایند تا همراه با سایر مدیران اجرایی، مدیران و کارفرمایان کل سازمان بتوانند از پس چالش‌های عظیم داده برآیند.

منبع : https://www.powermag.com/the-power-interview-what-is-big-data/

 

مصاحبه کننده : آرون لارسون سردبیر نشریه پاور