روز سه شنبه 18 ارديبهشت ماه 97 مصاحبه اي با يكي از پژوهشگران با سابقه بيش از 10 سال در حوزه داده کاوی صورت پذيرفت كه ذيلاً در اختيار علاقمندان قرار مي‌گيرد.

 

خواهشمند است در ابتدا خودتان را معرفي نموده و سوابق فعاليت تان را بفرماييد.

ونوس شکورنیاز هستم و دارای بیش از ۱۰ سال سابقه تخصصی در حوزه داده کاوی هستم. تحصيلات دانشگاهي شامل کارشناسي مهندسي کامپیوتر گرايش نرم افزار و کارشناسی ارشد مهندسی صنایع از دانشگاه صنعتی امیرکبیر و دارای مدرک MBA و دکترای تخصصی مدیریت کسب و کار گرایش برنامه ریزی راهبردی از دانشگاه Heriot-Watt University مي باشد. اينجانب مدرس بیش از 30 دوره کارگاه های آموزشی داده کاوی پیشرفته و علم داده در نرم افزار در دانشگاه صنعتی امیرکبیر و کنفرانس داده کاوی ایران هستم و  پژوهشگر فعال در حوزه هاي مختلف داده كاوي با انتشار بیش از 20 مقاله در کنفرانس ها و مجلات معتبر ملی و بین المللی و مؤلّف چندين کتاب از جمله «مفاهیم داده کاوی در اراکل 11g» و « داده کاوی در SQL Server» و «داده کاوی و OLAP» مي‌باشم

 

    در خصوص عظيم داده توضيحاتي ارائه فرماييد.

صرف نظر از تعاريف عظيم داده که همه علاقمندان اين حوزه با آن آشنايي دارند، عظيم داده يک اصطلاح نسبي است و براي توصيف وضعيتي به کار ميرود که در آن ميزان حجم سرعت و تنوع داده ها از سطح توان ذخيره و محاسبات يک سازمان براي تصميم گيري هاي به موقع آن فراتر مي رود.

سازمان هايي هستند که تمام تلاش خود را صرف جستجو و يادگيري ابزار ها و تکنولوژي هاي مرتبط با عظيم داده مي کنند.  سازمان هايي هم هستند که ساخت و راهکار مرتبط با عظيم داده را آغاز نمودند ودسته ديگر از آنها هم موفق شدند اولين راهکار خودشان را مستقر و پياده سازي کنند و دسته بعدي موفق به استقرار بازنگري ها و نگارش هاي جديد شدند که ميتوانند تحليل هاي چندگانه انجام دهند اما بالاي پنج درصد سازنده ابزار هاي عظيم داده هستند. در اين بخش ارتباط يک سري از فناوري هاي نوين با بحث عظيم داده مطرح ميشود. بطوريکه ميدانيد اينترنت اشياء يا IOT فناوري است که به عنوان محرک و پيشران در توليد داده و فناوري هاي مرتبط با عظيم داده مطرح است و سيسکو از آن به عنوان اينترنت همه چيز ياد کرده است.

اگر سيستمي مشتمل بر ويژگي هاي زير که به آن CS3 ميگويند باشد، از آن ميتوان به عنوان اينترنت اشياء ياد کرد و به عبارت ديگر جزو دسته اينترنت اشياء به شمار مي رود. اين مشخصات شامل اين است که قابليت اتصال داشته باشد، قابليت محاسبه يا همان Computing داشته باشد، قابليت تبادل اطلاعات يا به عبارت ديگر همان Communicate  داشته باشد.

همانگونه که مي دانيد امروزه بستر توليد ذخيره سازي و دسترسي به داده ها و اطلاعات متحول شده و صرفاً مختص يک سري سيستم هاي اطلاعاتي يا همان Information system ها نيست که کابران فقط در آن اقدام به ورود اطلاع کنند. داده ها توسط افراد در بسترهاي متنوع در حال توليد شدن است. بطوريکه بيشتر داده توسط کاربران توليد مي شود و عمدتاً بدون ساختار يا unstructured هستند. مثل عکس، فيلم، پيام هاي فوري، توييت ها، داده هاي شبکه هاي مجازي  و حتي ثبت اطلاعات مکان محور توسط کاربران. اين اطلاعات مي تواند از طريق همان بحث IOT و از طريق اشياء متصل به اينترنت انجام شود که همه آنها مبيّن رشد انفجاري داده ها و اطلاعات است.

اما چيزي که امروزه متفاوت شده، سرعت رشد و تنوع داده و اطلاعات است. اينکه بهره برداري موثر از داده داشته باشيم و از آن اطلاعات بتوانيم براي بهبود، سود آوري و ايجاد ارزش در کسب و کار استفاده کنيم . اين موضوع به شدت در حال حاضر مورد احتياج است و اينجاست که تعاريف و فناوري هاي نوين عظيم داده موضوعيت پيدا ميکند.

 

با توجه به فعاليت شما در صنعت بيمه و سلامت، لطفاً کاربرد هاي تحليل عظيم داده در اين صنعت را ذکر فرماييد.

روند رو به آينده و ضرورت کاربرد عظيم داده در چشم انداز سازمان هاي بيمه گر به ويژه در صنعت بيمه را ميتوان بيان کرد. همانطور که ميدانيد هر ساله يک سري روند هاي برتري از طريق موسسات تحقيقاتي نظير Accenture  و Deloitte ارائه ميشود يکي از اين روند هايي که مرتبط با بحث عظيم داده است، سازمان هوشمند - عظيم داده- سيستم هاي هوشمند - کسب و کار بهتر است. اين ها همه با هم و تواماً معني دارد. دراينجا اين موضوع مطرح ميشود که سطح بعدي مزيت عملياتي و همچنين نسل بعدي خدمات نرم افزاري از آخرين دست آوردهاي هوش نرم افزاري پديدار ميشود. تا امروز نرم افزارهايي که بطور روز افزون در حال توانمند شدن هستند براي کمک به کارکنان در تصميم گيري مناسب تر و سريعتر ايجاد شدند. ولي با گسترش عظيم داده، پيشرفت هاي قدرت پردازش و به عبارت ديگر بحث علم داده و فناوري هاي شناختي مانند cognitive technology هوش نرم افزاري به ماشين ها کمک ميکند تا تصميمات خود را ديگر بر مبناي اطلاعات کامل تر و مناسب تر اتخاذ کنند.

رهبران کسب و کار و فناوري هم بايد به هوش نرم افزاري ديگر به عنوان يک Pilot يا پروژه نگاه نکنند بلکه به عنوان يک قابليت سازماني و تاثير گذار در سطح وسيعي بنگرند به گونه اي که يک سطح جديد اکتشافي و تکاملي را براي خود و سازمان خود فراهم کنند.

پس با توجه به موضوعات مطرح شده، سازمان ها چاره اي ندارند و بايد با روند رو به رشد فناوري هاي عظيم داده همسو باشند. حال اين سوال مطرح ميشود که مثلا سازمان بيمه گر در مواجه شدن با بحث عظيم داده و فناوري هاي مرتبط با آن چه رويکردهايي را بايد اتخاذ کند؟

در پاسخ به اين سوال ضروري است که چارچوب تصميم گيري در استفاده از فناوري هاي نوين عظيم داده تعريف و در سطح راهبردي به آن پرداخته شود.  در راستاي توليد سيستم هاي متمرکز و توليد انبوهي از داده ها با چشم اندازي به رشد فناوري ها در آينده يک بهره گيري و تعريفي براي معماري عظيم داده ها داشته باشند .در اين صورت است که اين موضوع ميتواند منجر به مديريت موثر داده هاي و کسب مزيت هاي تحليلي شود و در نهايت براي آن سازمان توليد ارزش کند.

براي نمونه در سازمان بيمه گري مانند تامين اجتماعي که در حال متمرکز سازي داده هاي خود با بيش از 45 ميليون پرونده بيمه شده است که بخشي از اين پرونده ها داده هاي بدون ساختار است نيازمند طراحي معماري صحيح براي دسترس پذيري بالا و در کنار آن يکپارچه سازي با ساير سرويس هاي خود مي باشد.  

ضمن اينکه اگر اين معماري را داشته باشد و اين معماري اطلاعاتي را براي عظيم داده داشته باشد ، همانطور که ميدانيد افراد ديگر دائم در حال توليد داده هستند از انواع ابزارهايي که متصل به اينترنت هستند مانند موبايل ها و ساير گجت هايي که به اينترنت متصل هستند، يک پتانسيل ايجاد ميشود براي اينکه بتوان از اين جمعيت متصل به اينترنت و جمعيتي که در حال توليد داده هستند و ترکيب آن با روند هاي نويني مانند Crowd Sourcing و Crowd intelligence منجر به توليد جريان درآمدي جديد شود اين به شرطي است که ما تمرکزمان را روي طراحي و پياده سازي معماري عظيم داده بگذاريم.

البته بايد توجه داشت که بخش عمده اي از اين داده ها بدون ساختار هستند و ضروري است که در تحليل آنها از الگوريتم هاي يادگيري ماشين و بحث داده کاوي استفاده کنيم.

اگر بخواهيم جمع بندي کوتاهي داشته باشيم با تجميع داده ها و تحليل آن بويژه در خدمات بيمه اجتماعي ميشود بخش خدمات مستمري و مقرري هاي بيمه بيکاري را با بهره گيري موازي از Open Data  و داده هاي ساير نهادهاي مرتبط که با ترند يکپارچه سازي با ساير سرويس ها مطرح ميشود بتوان عوامل موثر بر بيکاري افراد را تعيين کرد. به اين صورت که با تعيين الگوي رشد بيکاري، سازمان بيمه گر ميتواند نسبت به گذشتغ مديريت نقدينگي و مديريت ظرفيت هاي لازم را به شکل موثر تري انجام دهد.

بعلاوه در زمينه سلامت هم ابزارهاي حوزه سلامت نظيربزارهای تله متری، Holter monitoring Pace maker و ...) ها می توانند در بستر cloud و بصورت iot  و کليه اشياء و گجت هاي متصل به اينترنت در حوزه سلامت به کار گرفته شود و از تجميع اين داده ها در تحليل ها و پيش بيني هاي روند بهبود و سلامت افراد بهره گيري مناسب نمود.

 

 نقش تحليل عظيم داده درآينده کشور را بفرماييد؟

فناوري هاي نوين ذکر شده ميتوانند مدل کسب و کار سازمان ها را متحول سازند. تغييرات چشمگيري در نظام هاي درآمدي و مالي سازمان ها ايجاد کنند و حتي منجر به کسب سودآوری در سطح ملي شوند. با استفاده از آن ميشود از منظر مديريت مالي با کاهش هزينه در تامين زير ساخت ها، سخت افزار ها، منابع ذخيره سازي و صرفاً با بهره گيري از فناوري هاي مرتبط با عظيم داده تواماً به توليد ارزش جريان درآمدي جديد براي تمامي سازمان ها ايجاد شود.

علاوه بر آن سازمان ها بايد در راستاي ايجاد دولت الکترونيک و ايجاد شهر هوشمند برنامه ريزي راهبردي و سرمايه گذاري کنند. در کنار اين سرمايه گذاري سازمان ها بايد به طراحي جعبه ابزار فناوري اطلاعات مبتني بر تحليل عظيم داده به عنوان يکي از مولفه هاي اصلي بپردازند. در جهت کسب ارزش ها و راهبردهای کسب و کاري مانند Customer experience که همان تجربه خوب براي مشتريان است و يکپارچه سازي سرويس ها مبتني بر يک اکوسيستم Open platform اين کار را انجام دهند. در همين جعبه ابزار از تحليل عظيم داده به عنوان يکي از ابزار هاي نرم افزاري خود استفاده کنند. اتصال آن را در سرويس هاي سازمان خود با ابزارهاي سخت افزاري متصل به اينترنت برقرار کنند و از  الگوهايي مثل Cloud استفاده کنند. در اينجا است که ميتوانيم يک تجربه ي مفيد ارزشمند در سطح ملي در کشورمان داشته باشيم.