- خانه
- نوشتارهای علمی
- کتاب "خبرگی در مجموعه دادههای بزرگ توسط Python"
کتاب "خبرگی در مجموعه دادههای بزرگ توسط Python"
کتاب "خبرگی در مجموعه دادههای بزرگ توسط Python"
“Mastering Large Datasets with Python"
نویسندگان: John T. Wolohan
سال انتشار: 2020
انتشارات: Manning Publications
راهکارهای مبتنی بر علم داده نیاز به مقیاسپذیری دارند. کتاب "خبرگی در مجموعه دادههای بزرگ توسط Python" به خواننده میآموزد تا چگونه یک پروژه کوچک را به گونهای پیادهسازی کند تا امکان مقیاسپذیری آن میسر شود.
چالشهای مرتبط با مجموعه دادههای بزرگ در سه سطح تقسیمبندی میشوند:
- ذخیره، پردازش و مدلسازی داده بر روی یک سیستم و به صورت متمرکز قابل انجام است.
- پردازش و مدلسازی داده به صورت متمرکز قابل انجام است اما حجم داده امکان ذخیرهسازی آن را سلب میکند.
- ذخیرهسازی و پردازش داده به صورت متمرکز میسر نیست.
این کتاب روشی از برنامهنویسی را معرفی میکند که در تمامی سطوح مسائل علوم داده قابلیت استفاده از آن وجود داشته باشد.
نحوه استفاده از ابزارهای زبان برنامهنویسی python برای مدیریت مجموعه دادههای بزرگ، معرفی روشهای پردازش موازی (Parallelism) با عملکرد بالا، آموزش فناوریهای توزیع شده (Distributed) نظیر Hadoop و SPARK جهت به کارگیری عظیمداده و بررسی رایانش ابری و مدیریت عظیمداده توسط AWS و سرویس ذخیرهسازی S3 بخشهای اصلی کتاب را تشکیل میدهند.
این کتاب برای افرادی که مراحل تحلیلداده و مدلسازی داده را با ابزارهای برنامهنویسی انجام میدهند و به دنبال تغییر مقیاس عمودی (Scale Up) راهکارهای خود هستند مناسب است.
دسته بندی
- معرفی ابزار 28
- مطالعه موردی 27
- کتاب بخوانیم 52
- معرفی کتاب 32
- مرور منابع علمی 36
- اینفوگرافیک 7
- تجربه داخلی 4
- مصاحبه 22
- معرفی کسب و کار داده محور 10
- معرفی سرویس 7