کتاب "خبرگی در مجموعه‌ داده‌های بزرگ توسط Python"

“Mastering Large Datasets with Python"

نویسندگان: John T. Wolohan

سال انتشار: 2020

انتشارات:  Manning Publications

 

راهکارهای مبتنی بر علم داده نیاز به مقیاس‌پذیری دارند. کتاب "خبرگی در مجموعه‌ داده‌های بزرگ توسط Python" به خواننده می‌آموزد تا چگونه یک پروژه کوچک را به گونه‌ای پیاده‌سازی کند تا امکان مقیاس‌پذیری آن میسر شود.

چالش‌های مرتبط با مجموعه‌ داده‌های بزرگ در سه سطح تقسیم‌بندی می‌شوند:

  • ذخیره، پردازش و مدل‌سازی داده بر روی یک سیستم و به صورت متمرکز قابل انجام است.
  • پردازش و مدل‌سازی داده به صورت متمرکز قابل انجام است اما حجم داده امکان ذخیره‌سازی آن را سلب می‌کند.
  • ذخیره‌سازی و پردازش داده به صورت متمرکز میسر نیست.

این کتاب روشی از برنامه‌نویسی را معرفی می‎کند که در تمامی سطوح مسائل علوم داده قابلیت استفاده از آن وجود داشته باشد.

 نحوه استفاده از ابزارهای زبان برنامه‌نویسی python برای مدیریت مجموعه داده‌های بزرگ، معرفی روش‌های پردازش موازی (Parallelism) با عملکرد بالا، آموزش فناوری‌های توزیع شده (Distributed) نظیر Hadoop و SPARK جهت به کارگیری عظیم‌داده و بررسی رایانش ابری و مدیریت عظیم‌داده توسط AWS و سرویس ذخیره‌سازی S3 بخش‌های اصلی کتاب را تشکیل می‌دهند.

این کتاب برای افرادی که مراحل تحلیل‌داده و مدل‌سازی داده را با ابزارهای برنامه‌نویسی انجام‌ می‌دهند و به دنبال تغییر مقیاس عمودی (Scale Up) راهکارهای خود هستند مناسب است.

دریافت فایل