اقتصاد در عصر عظیم‌داده

کیفیت و کمیت داده‌های مربوط به فعالیت‌های اقتصادی، با سرعت در حال رشد هستند. تحقیقات تجربی به شکل فزاینده‌ای، متکی بر داده‌های حجیم سازمانی یا داده‌های بخش خصوصی هستند. در این مقاله تعدادی از چالش‌های دسترسی به این داده‌ها و استفاده از آنها بررسی می‌شود. همچنین در این مقاله، روش‌های آماری و نوع سوالاتی که اقتصاددانان جایگزین روشهای قدیمی باید بکنند معرفی می‌شوند.

"داده‌کاوی با عظیم‌داده" "Data Mining with Big Data"

مقاله داده کاوری با عظیم داده تئوری HACE را ارائه می‌دهد که ویژگی‌های انقلاب عظیم داده‌ها را مشخص می‌کند و یک مدل پردازش عظیم داده‌ها را از دیدگاه داده کاوی ارائه می‌کند. این مدل داده‌ محور شامل جمع‌آوری تقاضا محور منابع اطلاعاتی، داده کاوی و تجزیه‌و‌تحلیل، مدل‌سازی مورد علاقه کاربران و ملاحظات امنیتی و حفظ حریم خصوصی است. در این مقاله تئوری مسائل چالش برانگیز در مدل داده محور و همچنین در انقلاب عظیم داده‌ها تجزیه‌و‌تحلیل شده است.

"ذخیره‌سازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"(بخش دوازدهم)

آورو (AVRO) آورو (AVRO) یک استاندارد به منظور سریال سازی  داده است که توسط doug cotting  داگ کاتینگ (Doug Cotting) و به منظور فائق آمدن بر مشکل portable نبودن Writable های هدوپ در زبان های مختلف ، معرفی شد. با در اختیار داشتن چنین استانداردی در تولید فایل، امکان استفاده از آن داده ها در زبان های مختلف (C, C++, C#, Java, JavaScript, Perl, PHP, Python,  و Ruby) فراهم می­گردد.

"ذخیره‌سازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"(بخش نهم)

در این فصل به برخی قابلیت‌های پیشرفته‌تر MapReduce شامل شمارنده‌ها و مرتب‌سازی (sorting) و به هم پیوستن (joining) دیتاست‌ها پرداخته شده است. همچنین توزیع داده‌های جانبی و کلاس‌های کتابخانه MapReduce معرفی شده‌اند که در ادامه به طور خلاصه به هر یک از آنها می‌پردازیم.

طراحی و آزمایش داشبورد بلادرنگ تحلیل متن شبکۀ اجتماعی توییتر

در این مقاله انواع ابزارها و زیرساخت‌های داده‌های جریانی عظیم داده در حوزه‌های متفاوت بررسی شده و بر مبنای بررسی‌های انجام شده، یک داشبورد بلادرنگ بر مبنای داده‌های جریانی شبکه‌های اجتماعی توییتر طراحی شده است.

معرفی مقاله تحلیل شبکه‌های اجتماعی

در این مقاله به موضوع نشر پیام‌ها و الگوی آنها در شبکه‌های اجتماعی پرداخته می‌شود. موضوع اثرگذاری در شبکه‌های اجتماعی (Social Influence) در سال‌های اخیر با رشد قابلیت‌های تحلیل داده و استفاده روزافزون کاربران از شبکه‌های اجتماعی اهمیت بسزایی پیدا کرده است.

معرفی ابزار Apache zookeeper

آپاچی زوکیپر از ابزارهای عظیم داده(Big Data) برای ذخیره سازی می باشد.‏ZooKeeper توسط شرکت‌هایی مانند Rackspace ،Yahoo، Odnoklassniki، Reddit، NetApp SolidFire و eBay و همچنین سیستم‌های جستجوی سازمانی منبع باز مانند Solr استفاده می‌شود.

معرفی ابزار آپاچی ساموا(Apache Samoa)

ساموا ، پلتفرمی جهت استخراج جریان عظیم‌داده است و مجموعه ای از الگوریتم‌های جریان توزیع شده را برای مرسوم‌ترین شیوه‌های داده‌کاوی و وظایف یادگیری ماشین مانند طبقه‌بندی، خوشه‌بندی و رگرسیون، و همچنین مفاهیم برنامه‌نویسی برای توسعه الگوریتم‌های جدید، را فراهم می‌کند.

مديريت فناوري اطلاعات از مباني زير ساخت تا فناوري ديجيتال

هدف اصلی این کتاب افزایش دانش در مورد مدیریت فناوری اطلاعات می‌باشد تا به‌عنوان یک مدیر بتوانید به‌طور مؤثر در فناوری¬های اطلاعات جدید سرمایه‌گذاری کرده و از اطلاعات حاضر استفاده نمایید.

معرفی تجربه داخلی در زمينه هوش تجاری و داده‌كاوی در صنعت بانكداری

هوشمندسازی، نیاز به داده‌های پالایش شده، متمرکز و پردازش شده دارد که مبتنی بر کسب و کار بوده و تاریخي نیز باشند. در این راستا داده کاوان، به ایجاد و توسعه انبارداده بانکی اقدام نموده است. با ایجاد این زیرساخت امکان ارائه بیش از 15 محصول مبتنی بر هوش تجاری مانند داشبوردهای کسب و کاری ، کشف تقلب، بازاریابی هوشمند و ... به شبکی بانکی ايجاد گرديده است.

معرفی تجربه داخلی در زمینه تحلیل داده: پایشگر هشتگ

هشتگ به عنوان اولین سامانه پایش فضای مجازی و شبکه‌های اجتماعی فارسی زبان، اخبار، نظرات و مطالب منتشر شده در خبرگزاری‌های داخلی و خارجی، روزنامه‌ها، وب‌سایت‌های خبری مهم و کاربران شبکه‌های اجتماعی توئیتر و اینستاگرام و تلگرام را تحلیل نموده و به صورت لحظه‌ای در قالب داشبوردی اختصاصی گزارش می‌دهد.

"ذخیره‌سازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"(بخش دهم)

این بخش به توضیح چگونگی تنظیم هدوپ روی کلاستر ماشین‌ها می‌پردازد. اجرای فایل‌سیستم توزیع‌یافته هدوپ، نگاشت کاهشی و یارن بر روی یک ماشین برای یادگیری این سیستم‌ها بسیار عالی است اما برای سودمند بودن، لازم است که بر روی نودهای چدگانه اجرا شوند.

طراحی توسط ب.علی‌میرزایی