“یادگیری اسپارک: تحلیل عظیم داده با سرعت نور (چاپ دوم)"

“Learning Spark: Lightning-Fast Big Data Analysis 2nd Edition”

اولین نسخه این کتاب توسط توسعه دهندگان اسپارک در سال 2015 و نسخه دوم آن که اسکالا و پایتون را شامل می‌شود در سال 2020 و توسط انتشارات O'Reilly منتشر شده است.

داده‌ها بزرگ‌تر، سریع‌تر و متنوع تر شده‌اند و نیاز به پردازش مقیاس‌پذیر برای تحلیل و یادگیری ماشین دارند. اما چگونه چنین حجم داده‌ای را به صورت کارآمد پردازش کنیم؟ وارد آپاچی اسپارک شوید.

با به‌روزرسانی اسپارک 3.0، نسخه دوم این کتاب برای مهندسین داده و دانشمندان داده نشان می‌دهد که چگونه ساختار و یکپارچه‌سازی در اسپارک اهمیت میابد. به ویژه، این کتاب توضیح می‌دهد که چگونه تحلیل‌های داده‌های ساده و پیچیده را انجام دهیم و الگوریتم‌های یادگیری ماشین را به کار ببریم.

از طریق آموزش گام به گام و با استفاده از کد اسنیپت‌ها و یادداشت‌های این کتاب شما قادر خواهید بود:-

- رابط‌های اپلیکیشنی (API) های سطح بالای پایتون، اسکیوال ، اسکالا و جاوا را بیاموزید

- اپریشن‌های اسپارک و موتور اسکیوال را فرا بگیرید

- اپریشن‌های اسپارک را با استفاده از تنظیمات اسپارک و رابط گرافیکی اسپارک، تیون و بهینه‌سازی کنید

- به منابع داده متصل شوید: JSON و پارکت و CSV و Avro و ORC و هایو و S3 و یا کافکا

- روی داده‌های انباشته و یا جریانی تحلیل انجام دهید

- از طریق Delta lake و اسپارک که متن باز هستند دیتاپایپ‌لاین‌های قابل اتکا و استیبل بسازید

- از طریق MLib و Mflow پایپ‌لاین‌های یادگیری ماشین را توسعه داده و مدل‌های عملیاتی بسازید

دریافت فایل