شرکت Airbnb در واقع وبسایتی است که در سال 2008 ایجاد شده است و مسافران را به محل‌های اقامت وصل می‌کند. این شرکت داده‌های زیادی از عادت‌های تعطیلاتی مردم تا ترجیحات اقامتی آنها را جمع‌آوری می‌کند.

عظیم‌داده به حل چه مشکلی کمک کرده است؟

به علت وجود 1.5 میلیون لیست در 34000 شهر و 50 میلیون مهمان، بزرگترین چالش این شرکت وصل کردن حجم زیادی از مهمانان با افرادی است که اطاق یا خانه خود را اجاره می‌دهند. انجام موفقیت‌آمیز این کار مستلزم درک درستی از اولویت‌های میزبان‌ها و مهمان‌ها است تا پیشنهادات مناسب را همراه با قیمت مناسب ارائه دهد.

چگونه از عظیم‌داده در عمل استفاده شده است؟

به گفته ریلی نیومن، مدیر قسمت تحلیل داده Airbnb، داده یک رکورد از یک عمل یا اتفاق است که در بیشتر موارد منعکس کننده تصمیمات گرفته شده توسط فرد است و شما با تکرار دوباره توالی اتفاقاتی که منجر به تصمیم‌گیری شده است، می‌توانید از آن یاد بگیرید که این راه غیرمستقیمی است که افراد به شما بگویند که از چه چیزی خوششان می‌آید. این نوع فیدبک می‌تواند مانند طلا برای تصمیم‌گیری در مورد رشد جامعه مشتریان شما، توسعه محصولات و اولویت‌بندی محصولات باشد. در واقع این صدای مشتریان به زبانی مناسب برای تصمیم‌گیری تبدیل می‌شود.

بینش بدست آمده از این بازخورد، Airbnb را قادر می‌سازد تا اطمینان حاصل كند که قیمت بهینه برای مقاصد محبوب در زمان‌های شلوغ ارائه داده است. به عنوان مثال، از داده برای قیمت‌گذاری مناسب برای یک اطاق یا آپارتمان براساس چند متغیر مثل موقعیت مکانی، زمان مسافرت، نوع محل اقامت، دسترسی به وسایل نقلیه و ... استفاده می‌شود. Airbnb از یک الگوریتم برای کمک به میزبان در تعیین قیمت مناسب برای پیشنهادات خود استفاده می‌کند و برای این کار از یک پلتفرم یادگیری ماشین به اسم Aerosolve استفاده می‌کند که قیمت‌گذاری پویا را ارائه می‌دهد. این پلتفرم تصاویر گرفته شده توسط میزبان را تحلیل می‌کند و به طور خودکار شهر را به چند منطقه تقسیم می‌کند.

Airbnb همچنین به تازگی از Airpal پرده برداشته است که پلتفرمی است که به تمام کارکنان اجازه می‌دهد که به تمام اطلاعات شرکت دسترسی داشته باشند و برای کوئری گرفتن از آن استفاده کنند.

علاوه بر این‌ موارد، یک الگوریتم برای پیش‌بینی تراکنش‌های کلاهبردارانه و یک سیستم توصیه قوی برای امتیاز دادن مهمانان و میزبانان به یکدیگر نیز مورد استفاده قرار گرفته است.

نتیجه چه بود؟

به گفته نیومن اندازه‌گیری تاثیر تیم علم داده کار سختی است اما یک نشانه مفید بودن داده این است که هم تیم فنی و هم تیم غیرفنی دوست دارند برای تصمیم‌گیری از داده استفاده کنند و این موضوع در استفاده از Airpal نشان داده شده است و بیشتر از یک سوم کارکنان Airbnb از این سیستم استفاده می‌کنند. رشد Airbnb هم نشانه دیگری از استفاده هوشمندانه از داده‌ها می‎باشد.

چه داده‌هایی مورد استفاده قرار گرفته است؟

داده‌های ساختاریافته و بدون ساختاری مانند تصاویر میزبان، داده‌های مکانی، ویژگی‌های محل اقامت مانند تعداد اطاق‌ها و تخت‌ها، وجود اینترنت و ... ، رتبه‌بندی و فیدبک توسط مشتریان و داده‌های تراکنش‌ها.

جزئیات فنی چه بود؟

Airbnb حدودا 1.5 پتابایت داده را در جداول Hive در خوشه سیستم توزیع شده هدوپ که در وب‌سرویس ابری Elastic Compute آمازون قرار دارد، نگهداری می‌کند. برای کوئری داده‌ها Airbnb ابتدا از Redshift آمازون استفاده می‌کرد و سپس این کار به پایگاه‌داده Presto فیسبوک انتقال پیدا کرد.

Airbnb امیدوار است که از پردازش دسته‌ای به سمت پردازش بلادرنگ برود که این کار سبب بهبود تشخیص ناهنجاری‌ها در پرداخت‌ها و افزایش در زمینه مطابقت و شخصی‌سازی خواهد شد.