"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"(بخش یازدهم)
در این فصل به دنبال روشی برای اجرای درست کلاستر هستیم و ساختار دایرکتوری namenode و سایر زیرقسمتهای آن را بررسی خواهیم کرد.
اقتصاد در عصر عظیمداده
کیفیت و کمیت دادههای مربوط به فعالیتهای اقتصادی، با سرعت در حال رشد هستند. تحقیقات تجربی به شکل فزایندهای، متکی بر دادههای حجیم سازمانی یا دادههای بخش خصوصی هستند. در این مقاله تعدادی از چالشهای دسترسی به این دادهها و استفاده از آنها بررسی میشود. همچنین در این مقاله، روشهای آماری و نوع سوالاتی که اقتصاددانان جایگزین روشهای قدیمی باید بکنند معرفی میشوند.
"دادهکاوی با عظیمداده" "Data Mining with Big Data"
مقاله داده کاوری با عظیم داده تئوری HACE را ارائه میدهد که ویژگیهای انقلاب عظیم دادهها را مشخص میکند و یک مدل پردازش عظیم دادهها را از دیدگاه داده کاوی ارائه میکند. این مدل داده محور شامل جمعآوری تقاضا محور منابع اطلاعاتی، داده کاوی و تجزیهوتحلیل، مدلسازی مورد علاقه کاربران و ملاحظات امنیتی و حفظ حریم خصوصی است. در این مقاله تئوری مسائل چالش برانگیز در مدل داده محور و همچنین در انقلاب عظیم دادهها تجزیهوتحلیل شده است.
"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"(بخش دوازدهم)
آورو (AVRO) آورو (AVRO) یک استاندارد به منظور سریال سازی داده است که توسط doug cotting داگ کاتینگ (Doug Cotting) و به منظور فائق آمدن بر مشکل portable نبودن Writable های هدوپ در زبان های مختلف ، معرفی شد. با در اختیار داشتن چنین استانداردی در تولید فایل، امکان استفاده از آن داده ها در زبان های مختلف (C, C++, C#, Java, JavaScript, Perl, PHP, Python, و Ruby) فراهم میگردد.
کتاب "عظیمداده و عظیمنوآوری: تواناسازی تمایزهای رقابتی از طریق تجزیه تحلیل کسبوکار "
کتاب "عظیمداده و عظیمنوآوری: تواناسازی تمایزهای رقابتی از طریق تجزیه تحلیل کسبوکار " “Big Data, Big Innovation: Enabling Competitive Differentiation Through Business Analytics”
کاربرد عظیم داده و اینترنت اشیا در کشاورزی(نمونه مطالعه: شرکت جان دیر(John Deere) )
کاربرد تحلیل عظیم داده و اینترنت اشیا(Big data Analytics) در صنعت کشاورزی و و شرکت جان دیر (johnderre)
کاربردهای تحلیل عظیم(Big Data Analytics) داده در صنعت خرده فروشی
تحلیل عظیم داده(big data analytics)فوایدی از جمله شخصی سازی خرید، دسته بندی مناسب محصولات، مدیریت زنجیره تامین، تحلیل داده های شبکه اجتماعی برای شرکتهای درون صنعت خرده فورشی دارد.
"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"(بخش نهم)
در این فصل به برخی قابلیتهای پیشرفتهتر MapReduce شامل شمارندهها و مرتبسازی (sorting) و به هم پیوستن (joining) دیتاستها پرداخته شده است. همچنین توزیع دادههای جانبی و کلاسهای کتابخانه MapReduce معرفی شدهاند که در ادامه به طور خلاصه به هر یک از آنها میپردازیم.
طراحی و آزمایش داشبورد بلادرنگ تحلیل متن شبکۀ اجتماعی توییتر
در این مقاله انواع ابزارها و زیرساختهای دادههای جریانی عظیم داده در حوزههای متفاوت بررسی شده و بر مبنای بررسیهای انجام شده، یک داشبورد بلادرنگ بر مبنای دادههای جریانی شبکههای اجتماعی توییتر طراحی شده است.
معرفی ابزار آپاچی کاساندرا (Apache Cassandra)
آپاچی کاساندرا یک پایگاه داده برای مدیریت عظیم داده(Big Data) می باشد.
معرفی مقاله تحلیل شبکههای اجتماعی
در این مقاله به موضوع نشر پیامها و الگوی آنها در شبکههای اجتماعی پرداخته میشود. موضوع اثرگذاری در شبکههای اجتماعی (Social Influence) در سالهای اخیر با رشد قابلیتهای تحلیل داده و استفاده روزافزون کاربران از شبکههای اجتماعی اهمیت بسزایی پیدا کرده است.
معرفی ابزار Apache zookeeper
آپاچی زوکیپر از ابزارهای عظیم داده(Big Data) برای ذخیره سازی می باشد.ZooKeeper توسط شرکتهایی مانند Rackspace ،Yahoo، Odnoklassniki، Reddit، NetApp SolidFire و eBay و همچنین سیستمهای جستجوی سازمانی منبع باز مانند Solr استفاده میشود.
معرفی ابزار آپاچی ساموا(Apache Samoa)
ساموا ، پلتفرمی جهت استخراج جریان عظیمداده است و مجموعه ای از الگوریتمهای جریان توزیع شده را برای مرسومترین شیوههای دادهکاوی و وظایف یادگیری ماشین مانند طبقهبندی، خوشهبندی و رگرسیون، و همچنین مفاهیم برنامهنویسی برای توسعه الگوریتمهای جدید، را فراهم میکند.
"عظیمداده، چگونه دادهها، کسبوکارهای بزرگ را قدرت میبخشند"(بخش دوم)
در بخش دوم کتاب "عظیمداده، چگونه دادهها، کسبوکارهای بزرگ را قدرت میبخشند"به بررسی تاریخچه عظیم داده میپردازیم .
مديريت فناوري اطلاعات از مباني زير ساخت تا فناوري ديجيتال
هدف اصلی این کتاب افزایش دانش در مورد مدیریت فناوری اطلاعات میباشد تا بهعنوان یک مدیر بتوانید بهطور مؤثر در فناوری¬های اطلاعات جدید سرمایهگذاری کرده و از اطلاعات حاضر استفاده نمایید.
معرفی تجربه داخلی در زمينه هوش تجاری و دادهكاوی در صنعت بانكداری
هوشمندسازی، نیاز به دادههای پالایش شده، متمرکز و پردازش شده دارد که مبتنی بر کسب و کار بوده و تاریخي نیز باشند. در این راستا داده کاوان، به ایجاد و توسعه انبارداده بانکی اقدام نموده است. با ایجاد این زیرساخت امکان ارائه بیش از 15 محصول مبتنی بر هوش تجاری مانند داشبوردهای کسب و کاری ، کشف تقلب، بازاریابی هوشمند و ... به شبکی بانکی ايجاد گرديده است.
معرفی کتاب عظیم داده درعمل(Big Data in Practice)
کتاب عظیم داده(Big Data) در عمل به 45 نمونه موفق در تحلیل عظیم داده اشاره دارد.
معرفی تجربه داخلی در زمینه تحلیل داده: پایشگر هشتگ
هشتگ به عنوان اولین سامانه پایش فضای مجازی و شبکههای اجتماعی فارسی زبان، اخبار، نظرات و مطالب منتشر شده در خبرگزاریهای داخلی و خارجی، روزنامهها، وبسایتهای خبری مهم و کاربران شبکههای اجتماعی توئیتر و اینستاگرام و تلگرام را تحلیل نموده و به صورت لحظهای در قالب داشبوردی اختصاصی گزارش میدهد.
"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"(بخش دهم)
این بخش به توضیح چگونگی تنظیم هدوپ روی کلاستر ماشینها میپردازد. اجرای فایلسیستم توزیعیافته هدوپ، نگاشت کاهشی و یارن بر روی یک ماشین برای یادگیری این سیستمها بسیار عالی است اما برای سودمند بودن، لازم است که بر روی نودهای چدگانه اجرا شوند.
دسته بندی
- معرفی ابزار 28
- مطالعه موردی 27
- کتاب بخوانیم 52
- معرفی کتاب 32
- مرور منابع علمی 36
- اینفوگرافیک 7
- تجربه داخلی 4
- مصاحبه 22
- معرفی کسب و کار داده محور 10
- معرفی سرویس 7