کتاب "تحلیل عظیم‌داده، سیستم‌ها، الگوریتم‌ها و کاربردها" (بخش سوم)

فصل سوم کتاب تحلیل عظیم داده، سیستم‌ها، الگوریتم‌ها و کاربردها، به بررسی دقیق‌ مدل‌های تحلیلی برای جریان‌ داده می‌پردازد و مدل‌های تحلیلی، محاسباتی و برنامه‌نویسی که قابلیت کاربرد در تحلیل عظیم داده را دارد مورد بحث قرار می‌دهد. تحلیل عظیم داده می‌تواند پیچیدگی‌های درون یک مجموعه داده را به هوش تجاری قابل استفاده تبدیل کند و تصمیم‌گیری‌های دقیق‌تری را موجب شود.

تحلیل تکنیک‌های کاهش ابعاد در عظیم‌داده‌ها

در این مقاله، به مقایسه دو روش مطرح در زمینه کاهش ابعاد ( PCA و LDA ) بر روی چهار الگوریتم یادگیری ماشین (درخت تصمیم، ماشین بردار پشتیبان، نایو بیز و جنگل تصادفی) پرداخته شده است. با اعمال روش (PCA)، 95درصد از ویژگی‌ها حفظ شدند و تعداد متغیرهای وابسته به ۲۶ کاهش یافت. در حالی که در روش LDA متغیرهای وابسته را به 1 کاهش می‌دهد.

معرفی ابزار داده کاوی وکا (WEKA)

«وکا» را می‌توان یک ابزار پیشرفته «یادگیری ماشین» و «داده‌کاوی» برشمرد. این نرم‌افزار رایگان تحت مجوز عمومی «گنو» قابل استفاده است. این نرم‌افزار شامل مجموعه‌ای از ابزار‌های «بصری سازی»، روش‌های تحلیل داده‌ها و مدل‌های پیش‌بینی است که در یک رابط گرافیکی گرد هم آمده‌اند تا کاربر بهترین شیوه اجرای دستورات را در اختیار داشته باشد.

‍ مطالعه موردی کاربرد عظیم‌داده(Big Data) در صنعت مخابرات: شرکت هوآوی

هوآوی شرکتی چندملیتی با بیش از 30 سال تجربه در زمینه شبکه های کامپیوتری و ارتباطات و یکی از بزرگترین ارائه دهندگان سرویس های ارتباطی در جهان است. در این مورد به مطالعه استفاده هوآوی از تحلیل عظیم‌داده(Big Data Analytics) و روش های پیاده سازی آن می پردازیم.

عظيم داده، چگونه داده ها، كسب و كارهاي بزرگ را قدرت مي بخشند(بخش دهم)

مهندسی راه‌کار این چنین تعریف می‌شود: “فرایند شناسایی و طبقه‌بندی تواناییهای بالقوه یک سازمان و تبدیل آنها به قابلیت‌های کسب‌و کار و و مولفه‌های پشتیبانی از فناوری تا بتوان با استفاده از آنها از تصمیم‌گیری های درون سازمانی و فعالیت‌های پول ساز داده ها حمایت کرد.”

معرفی ابزار Apache Solr

 Apache Solr یک پلتفرم جستجوی منبع باز است که بر روی یک کتابخانه جاوا به نام Lucene ساخته شده است.  Solr  یک بستر جستجوی محبوب برای وب‌سایت‌ها است زیرا می‌تواند چندین سایت را فهرست‌بندی و جستجو کند و توصیه‌های مربوط به مطالب مرتبط را بر اساس طبقه‌بندی جستجو بازگرداند. این ابزار همچنین یک بستر جستجوی محبوب برای سازمان‌ها است زیرا می‌توان از آن برای فهرست و جستجوی اسناد و پیوست‌های ایمیل استفاده کرد.

"ذخیره‌سازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ" (بخش پانزدهم)

آپاچی اسکوپ یک ابزار متن باز است که به کاربران اجازه استخراج داده‌ها از منبع داده ساختاریافته و وارد کردن آن به هدوپ جهت پردازش‌های بیشتر را می‌دهد. این پردازش می‌تواند توسط MapReduce یا ابزارهای سطح بالاتر دیگر نظیر Hive انجام بگیرد.

کاربرد تحلیل عظیم‌داده در صنعت نرم‌افزار (مطالعه موردی: Autodesk)

شرکت Autodesk یک شرکت نرم‌افزاری در کالیفرنیا است که کسب و کار اصلی آن توسعه نرم‌افزار تجاری طراحی به کمک رایانه (CAD) می‌باشد. در سال‌های اخیر این شرکت هم‌راستا با بسیاری از تولیدکنندگان بزرگ نرم‌افزار در ارائه محصولات خود از طریق مدل نرم‌افزار به عنوان سرویس (SaaS) رشد قابل توجهی داشته است. این بدان معناست که اکنون آنها به حجم بسیار بیشتر و تنوع غنی‌تری از داده‌ها در خصوص چگونگی استفاده مشتریان از محصولاتشان دسترسی دارند.

معرفی سرویس: راه‌حل داده به عنوان سرویس شرکت ATTOM در حوزه املاک

راه‌حل داده به عنوان سرویس (DaaS) شرکت ATTOM یک پلتفرم داده‌های املاک مبتنی بر ابر است که مدیریت داده‌ها را میسر می‌سازد. این راه‌حل به عنوان یکی از اولین ارائه دهندگان داده‌ها در این حوزه محسوب می‌شود و شامل داده‌هایی نظیر شناسایی املاک، مالکیت، آدرس، شرح حقوقی، ارزش‌ها، مالیات‌ها و خصوصیات املاک، ژئوکد، وام‌ها، تاریخچه فروش و اجازه ساخت می‌باشد. استفاده از این داده‌ها می‌تواند در کسب‌وکارهای مرتبط با این حوزه منجر به شفافیت، نوآوری و کارایی گردد.

(sentiment analysis)سیر تکاملی تحلیل احساسات

نام مقاله: سیر تکاملی تحلیل احساسات – مروری بر موضوعات پژوهشی، محل انتشار و پر ارجاع‌ترین مقالات (The evolution of sentiment analysis – A review of research topics, venues, and top cited papers) نویسندگان: Mika V. Mäntylä, Daniel Graziotin, Miikka Kuutila ژورنال: Computer Science Review شماره: VOL. 27 تعداد ارجاعات: 11

"ذخیره‌سازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ" (بخش شانزدهم)

Apache Pig سطح کیفیت پردازش مجموعه عظیم‌داده‌ها را افزایش می دهد. در مورد Pig، ساختار داده‌ها بسیار غنی‌تر است و به طور معمول به صورت چند منظوره و تو در تو قرار دارند و تغییراتی که می‌توانید بر روی داده‌ها اعمال کنید بسیار قدرتمندتر هستند.

معرفی کتاب «طراحی و پیاده‌سازی داشبوردهای سازمانی»

هدف ‌كتاب ‌پیش‌رو،‌ مرور ‌مبانی ‌نظری ‌و‌ حرفه‌ای ‌داشبوردهای ‌اطلاعاتی ‌در ‌سازمان،‌ ارائۀ ‌يک ‌نقشۀ‌ راه ‌طراحی ‌و ‌پیاده‌سازی ‌اين ‌داشبوردها ‌شامل: پیش نیازها، ‌زيرساخت‌ها، ‌متدولوژی، ‌اصول ‌معماری، ‌نحوه انتخاب ‌ابزار ‌و ‌درنهايت، ‌تشريح ‌نمونه‌های‌ كاربردی ‌است. ‌

معرفی مقاله: "Exploring the relationship between big data analytics capability and competitive performance: The mediating roles of dynamic and operational capabilities"

یکی از سوالات اساسی برای محققان و شاغلان حوزه سیستم‌های اطلاعاتی این است که عظیم‌داده چگونه می‌تواند برای سازمان‌ها مزیت رقابتی ایجاد کند. مقاله برای پاسخ دادن به این سوال با ایجاد ارتباط بین دیدگاه مبتنی بر منابع، توانایی‌های پویا و تحقیقات در حوزه عظیم داده، تاثیر غیرمستقیم توانمندی تحلیل عظیم داده (BDAC) بر عملکرد رقابتی را مورد سنجش قرار می‌دهد.

تحلیل عظیم‌داده(Big Data Analytics) در صنعت سلامت و پزشکی (نمونه موردی مرکز تحلیل داده دانشگاه پنسیلوانیا)

پزشکی و سلامت دیرتر از ساير صنايع پذیرای عظیم‌داده(Big Data) بوده است.  بخشی از این مسئله به دلیل نگرانی در مورد محرمانه بودن داده‌های بیماران و ترس از نقض‌های امنیتی در سیستم‌های مبتنی بر منبع باز مانند هدوپ می‌باشد. نشان دادن میزان بازده سرمایه‌گذاری عظیم‌داده برای بیمارستان‌ها و ارائه‌دهندگان خدمات بهداشتی نیز می‌تواند یک چالش جدی باشد تا آنها را متقاعد به استفاده از ظرفیت‌های تحلیل عظیم‌داده نمود.

طراحی توسط ب.علی‌میرزایی