- خانه
- نوشتارهای علمی
- معرفی کتاب یادگیری اسپارک: تحلیل عظیم داده با سرعت نور (چاپ دوم)
معرفی کتاب یادگیری اسپارک: تحلیل عظیم داده با سرعت نور (چاپ دوم)
“یادگیری اسپارک: تحلیل عظیم داده با سرعت نور (چاپ دوم)"
“Learning Spark: Lightning-Fast Big Data Analysis 2nd Edition”
اولین نسخه این کتاب توسط توسعه دهندگان اسپارک در سال 2015 و نسخه دوم آن که اسکالا و پایتون را شامل میشود در سال 2020 و توسط انتشارات O'Reilly منتشر شده است.
دادهها بزرگتر، سریعتر و متنوع تر شدهاند و نیاز به پردازش مقیاسپذیر برای تحلیل و یادگیری ماشین دارند. اما چگونه چنین حجم دادهای را به صورت کارآمد پردازش کنیم؟ وارد آپاچی اسپارک شوید.
با بهروزرسانی اسپارک 3.0، نسخه دوم این کتاب برای مهندسین داده و دانشمندان داده نشان میدهد که چگونه ساختار و یکپارچهسازی در اسپارک اهمیت میابد. به ویژه، این کتاب توضیح میدهد که چگونه تحلیلهای دادههای ساده و پیچیده را انجام دهیم و الگوریتمهای یادگیری ماشین را به کار ببریم.
از طریق آموزش گام به گام و با استفاده از کد اسنیپتها و یادداشتهای این کتاب شما قادر خواهید بود:-
- رابطهای اپلیکیشنی (API) های سطح بالای پایتون، اسکیوال ، اسکالا و جاوا را بیاموزید
- اپریشنهای اسپارک و موتور اسکیوال را فرا بگیرید
- اپریشنهای اسپارک را با استفاده از تنظیمات اسپارک و رابط گرافیکی اسپارک، تیون و بهینهسازی کنید
- به منابع داده متصل شوید: JSON و پارکت و CSV و Avro و ORC و هایو و S3 و یا کافکا
- روی دادههای انباشته و یا جریانی تحلیل انجام دهید
- از طریق Delta lake و اسپارک که متن باز هستند دیتاپایپلاینهای قابل اتکا و استیبل بسازید
- از طریق MLib و Mflow پایپلاینهای یادگیری ماشین را توسعه داده و مدلهای عملیاتی بسازید
دسته بندی
- معرفی ابزار 32
- مطالعه موردی 31
- کتاب بخوانیم 61
- معرفی کتاب 39
- مرور منابع علمی 43
- اینفوگرافیک 11
- تجربه داخلی 4
- مصاحبه 23
- معرفی کسب و کار داده محور 12
- معرفی سرویس 7