معرفی کتاب عظیم‌داده‌های تلفن همراه(Moblie Big Data)

موبایل عظیم داده: نقشه راهی از مدل ها تا فناوری ها مشخصات: این کتاب در سال 2017 توسط انتشارات اسپرینگر از مجموعه سخنرانی های مهندسی داده و فناوری های ارتباطی تهیه و منتشر شده است. مشتمل بر 350 صفحه در قالب 13 فصل که پیشرفت های اخیر فناوری های موبایلی برای جمع آوری، ذخیره سازی و پردازش عظیم‌داده‌های تلفن همراه در ارتباط با مخابرات بی سیم را ارائه میکند.

معرفی ابزار: Apache HCatalog

ابزار HCatalog یک لایه مدیریت جداول و ذخیره‌سازی برای هدوپ است که برای کاربران با ابزارهای پردازش داده‌های مختلف مانند Pig و MapReduce امکان خواندن و نوشتن راحت‌تر داده‌ها در شبکه را فراهم می‌کند. توانایی استخراج و تلخیص جداول در HCatalog دیدی رابطه‌ای از داده‌ها را در سیستم فایل توزیع شده هدوپ (HDFS) به کاربران ارائه می‌کند و به مسائل ونگرانی کاربران درباره اینکه داده‌ها از کجا یا در چه قالبی ذخیره می‌شوند - قالب RCFile، فایل‌های متنی، SequenceFiles یا فایل‌های ORC – پاسخ می‌دهد.

مصاحبه ترجمه شده با دکتر اریک شات بنیان گذار شرکت Icahn فعال در سیستم سلامت

بیشتر شرکت‌ها تصمیمی ‌آگاهانه و سنجیده برای پذیرش جهت تحول دیجیتال و انقلاب اطلاعاتی می‌گیرند. به نظر می‌رسد که تاثیر عظیم داده در پزشکی سازمان‌ها را مجبور به درگیر شدن با این موضوع می‌کند.  این مصاحبه با دکتر اریک شات، مدیر بنیانگذار انستیتوی Icahn نیویورک  صورت گرفته است.

کاربرد عظیم داده ها در بازاریابی: مطالعه شرکت Acxiom

شرکت Acxiom گاهی به عنوان "بزرگترین شرکتی که هیچوقت اسمش را نشنیده‌اید" شناخته می‌شود. این شرکت در دهه 1980 پیش از آنکه واژه عظیم داده (Big Data) مطرح شود، داده های بسیار بزرگی را مدیریت کرده و تحلیلهای پیشرفته ارائه می‌دادند.

کاربرد تحلیل عظیم داده در حوزه نفت و گاز (مطالعه موردی: شرکت Shell)

شرکت شل (Shell) چهارمین شرکت بزرگ از نظر درآمد در حوزه نفت و گاز می‌باشد که به فرآیند تبدیل سوخت‌های فسیلی به انرژي مورد نیاز خانه‌ها، وسایل‌نقلیه و کسب‌وکارها مشغول بوده است و در سال‌های اخیر به توسعه مفهوم میدان نفتی داده‌محور پرداخته است تا بتواند هزینه خود را کاهش و کارایی و ایمنی را ارتقا بخشد.

سایت Kaggle، جمع‌سپاری برای دانشمندان علم داده

سایت Kaggle یک پلتفرم جمع‌سپاری برای رقابت تحلیلگران داده است. کسب‌وکارها مشکلات داده‌ای خود را می‌آورند و تحلیلگران داده برای ارائه بهترین راه‌حل با یکدیگر رقابت می‌کنند. هر فردی می‌تواند در Kaggle ثبت‌نام کند و در رقابت‌ها شرکت کند و برنده جوایز شود.

بررسی بر روی عقیده‌کاوی و تحلیل احساسات: عملیات، رویکردها و کاربردها

این مقاله به بررسی دقیقی بر روی ادبیات پژوهشی منتشر شده در سال‌های 2002 تا 2015 در خصوص تحلیل احساسات پرداخته است. هر مقاله‌ی مورد بررسی در 4 جنبه خلاصه شده است که عبارتند از مسئله مورد بررسی در مقاله، جزئیات دیتاست به کار گرفته شده در مقاله، ارائه ویژگی‌ها و در نهایت تکنیک‌ها، نتایج و مسیرهای آینده ذکر شده در مقاله موردنظر

"ذخیره‌سازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"(بخش دوم)

در فصل دوم کتاب مفهوم MapReduce تشریح می گردد که یک مدل برنامه نویسی ساده بوده و برای حل مسائل محاسباتی در مقیاس وسیع و نیز به صورت توزیعی، مورد استفاده قرار می‌گیرد. MapReduce، به زبان‌های مختلف پیاده‌سازی شده است.

"ذخیره‌سازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ" (بخش نوزدهم)

Apache Spark یک چارچوب محاسباتی خوشه‌ای برای پردازش داده در مقیاس بزرگ است. برخلاف بسیاری از چارچوب‌های پردازش دیگر که در این کتاب مورد بحث قرار گرفته است، Spark از MapReduce به عنوان موتور اجرا استفاده نمی‌کند. در عوض، برای اجرای کار روی یک خوشه از زمان اجرای توزیع شده خود استفاده می‌کند. Spark  طوری با Hadoop یکپارچه شده است که می‌تواند YARN را اجرا کند و با فرمت‌های فایل Hadoop و پشتیبان‌های ذخیره‌سازی مانند HDFS کار کند.

معرفی کتاب "Big Data Analytics in Healthcare"

با توجه به رشد حجم داده‌های تولید شده در صنعت سلامت و کاربرد داده‌های غیرساختار یافته؛ تحلیل عظیم‌داده در بخش سلامت، اطلاعات سودمندی را جهت تصمیم‌گیری‌های مبتنی بر داده فراهم می‌آورد. کتاب تحلیل عظیم داده در سلامت در نه فصل و دو بخش اصلی و با رویکردی کاملا کاربردی، توسط جمعی از متخصصان این حوزه نگارش شده است.

پیش بینی کیفیت عظیم داده در صنعت فرآیند: یک چارچوب مدل‌سازی توزیع شده موازی

این مقاله یک روش مدل‌سازی فرآیند توزیع شده موازی بر اساس چارچوب MapReduce را برای پیش بینی کیفیت عظیم‌داده ارائه نموده است. در مرحله اول به منظور مدل‌سازی داده‌های توزیع شده موازی در چارچوب MapReduce یک معماری تدوین می‌کند. در مرحله دوم، بر اساس رویکرد مدل‌سازی داده‌های توزیع شده موازی؛ یک طرح پیش‌بینی کیفیت عظیم‌داده را توسعه می‌دهد.

"ذخیره‌سازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"(بخش اول)

 در بخش اول آن به نام "Data" به مشكلات حجم داده‌هايي كه امروزه با آن مواجه هستيم، اشاره شده است. در اين بخش نويسنده بيان كرده است که "ما در عصر داده‌ها زندگی می‌کنیم. انداز‌ه‌گیری حجم کل داده‌ها که به صورت الکترونیکی ذخیره می‌شود آسان نیست، اما برآورد IDC اندازه "جهان دیجیتال" را در 4/4 zettabytes در سال 2013 به ارمغان می‌آورد و پیش‌بینی ده برابر رشد (44 zettabytes) را تا سال 2020 می‌کند."

طراحی توسط ب.علی‌میرزایی