📌روشهای توسعه برای سیستمهای تحلیل عظیمداده
“Development Methodologies for Big Data Analytics Systems”
📌نویسندگان:
Manuel Mora, FenWang, Jorge Marx Gomez, Hector Duran-Limon
📌این کتاب در سال 2024 توسط Springer انتشار یافته است.
📍 رشد فزایندهی حجم، تنوع و سرعت دادهها، که اغلب با عنوان «عظیمداده» شناخته میشود، رویکرد ما به تصمیمگیری در صنایع مختلف را متحول کرده است. سیستمهای تحلیل عظیمداده (BDA) راهحلهای نرمافزاری هستند که بهطور خاص برای استخراج بینشهای ارزشمند از این مجموعه دادههای عظیم طراحی شدهاند. این کتاب به دنیای سیستمهای BDA میپردازد و با بررسی روشهای توسعه، کاربردهای موفقیت آمیز آن را در حوزههای مختلف به نمایش میگذارد.
📍این کتاب، سیستمهای BDA را به عنوان سنگ بنای حوزهی نوظهور «علم داده» معرفی میکند. علم داده خود از همگرایی سه حوزهی کلیدی، آمار، علوم رایانه و تحلیل هوش تجاری، نشأت میگیرد. هدف اصلی آن استفاده از قدرت دادههای عظیم برای توسعهی مفاهیم، مدلها، روشها و ابزارهایی است که بتواند ارزش پنهان در منابع عظیم دادههای داخلی و خارجی سازمانها را آشکار سازد.
📍اگرچه بهطور سنتی به دلیل نیاز به منابع انسانی، فناوری و منابع سازمانی قابل توجه، سیستمهای BDA عمدتا توسط کسبوکارهای بزرگ به کار گرفته میشدند، اما امروزه در حال گسترش به سایر بخشها نیز میباشد. با این حال، خلأیی اساسی در توسعهی نظاممند این سیستمها وجود دارد. علیرغم بهکارگیری روشهای توسعهی آزمودهشدهای مانند CRISP-DM، SEMMA و KDD برای سیستمهای تحلیل داده، تعداد قابل توجهی از پروژههای BDA در عمل نمیتوانند به وعدههای خود وفا کنند. از دیدگاه مهندسی نرمافزار، فرآیندها و روشهای توسعهی قوی، شامل رویکردهای برنامهمحور، چابک، ترکیبی و سبکوزن، برای برآورده کردن محدودیتهای حیاتی «مثلث آهنین» پروژه (زمانبندی، بودجه و کیفیت) ضروری هستند. این امر، نیاز روزافزون به ادغام اصول مهندسی نرمافزار و سیستم در توسعهی سیستمهای BDA را برای اطمینان از نتایج موفقیتآمیز که مطابق با انتظارات کسبوکار باشد، برجسته میکند.
📍برای دستیابی به این هدف، سردبیران کتاب از پژوهشگران برجسته در هر دو حوزهی مهندسی نرمافزار و علم داده دعوت کردهاند تا در مورد طیف وسیعی از موضوعات مشارکت نمایند و خلأ موردنظر را برطرف نمایند. این کتاب شامل ۱۱ فصل میباشد و توسط پژوهشگران بینالمللی تنظیم شده تا موضوعات اساسی، روششناسیها، چارچوبها و کاربردهای دنیای واقعی را پوشش دهد. این کتاب برای پژوهشگران، دانشگاهیان، متخصصان و دانشجویان دورهی دکتری که به توسعهی نظاممند سیستمهای تحلیل عظیمداده علاقهمند هستند، در نظر گرفته شده است. کتاب به سه بخش زیر تقسیم شده است:
۱- بنیاد سیستمهای تحلیل عظیمداده: این بخش به بررسی مفاهیم اساسی زیربنای سیستمهای BDA از جمله بنیادهای تحلیل عظیمداده و علم داده، چارچوب، معماری، ابزار و پلتفرمها و فنون محاسباتی میپردازد.
۲- روشهای توسعه برای سیستمهای تحلیل عظیمداده: این بخش، با بررسی روشهای توسعه مانند CRISP-DM، SEMMA و KDD در کنار روشهای توسعهی نرمافزار عمومی مانند RUP، MBASE و MSF، به عمق روشهای توسعه میپردازد. همچنین، این بخش به بررسی روشهای خاص چابک، ترکیبی و سبکوزن مبتنی بر چارچوبهایی مانند Scrum، XP، ISO/IEC 29110 و Microsoft TDSP میپردازد.
۳- کاربرد، چالش و مسیرهای آیندهی سیستمهای تحلیل عظیمداده: این بخش به بررسی کاربردهای واقعی سیستمهای BDA در حوزههای مختلفی مانند مراقبتهای بهداشتی، بازاریابی، امور مالی، آموزش، ورزش، خرده فروشی، لجستیک و تولید و همچنین چالشها، محدودیتها و روندهای فعلی در این زمینه میپردازد.