پیش‌زمینه:

TfL (Transport for London)  ناظر بر شبکه‌ای از اتوبوس‌ها و قطارها، تاکسی‌ها، راه‌ها، مسیرهای مربوط به دوچرخه، پیاده‌روها و حتی کشتی‌ها که روزانه توسط میلیون‌ها نفر مورد استفاده قرار می‌گیرند، می‌باشد. اداره این شبکه وسیع، که در زندگی بسیاری از افراد در یکی از شلوغ‌ترین شهرهای دنیا حیاتی می‌باشد، دسترسی TfL به حجم بالایی از داده‌ها را امکان‌پذیر ساخته است و این شرکت اکنون تجزیه و تحلیل عظیم‌داده (Big Data analytics) را به طور گسترده‌ای به کار می‌گیرد.

چگونگی استفاده از عظیم‌داده:

طبق گفته Lauren Sager Weinstein، رئیس بخش تحلیل در TfL، لندن دارای رشد فوق‌العاده‌ای است و دارای جمعیتی بالغ بر 10 میلیون نفر که لازم است چگونگی رفتار مشتریان و نیازهای حمل و نقلی آنها شناخته شود. با داشتن این ذهنیت، TfL دو اولویت را برای جمع‌آوری و تحلیل داده‌ها در نظر گرفته است: برنامه‌ریزی خدمات و ارائه اطلاعات به مشتریان. Sager Weinstein توضیح می‌دهد: "مسافران در ازای پولی که به ما می‌دهند خدمات خوب و خلق ارزش را می‌خواهند و در واقع می‌خواهند که ما دارای روشی مبتکرانه و مترقی در برآورده ساختن نیازهایشان باشیم." TfL  از تجزیه و تحلیل عظیم‌داده به سه روش اصلی استفاده می‌کند: ترسیم سفرهای مشتری، مدیریت رویدادهای غیرمنتظره و ارائه اطلاعات سفر به صورت شخصی‌سازی شده.

معرفی سیستم بلیت Oyster به عنوان کارت‌های هوشمند در سال 2003  منجر به جمع‌آوری داده‌های بسیار زیاد و دقیقی در خصوص سفرها شده است. در سال 2014، TfL به عنوان اولین ارائه‌دهنده خدمات حمل و نقل عمومی، از کارت‌های پرداخت بدون تماس (contactless) برای سفر استفاده نمود و اکنون مشتریان می‌توانند به راحتی با استفاده کارت‌های بانکی سفر نمایند. این سیستم‌ها روزانه 19 میلیون مورد استفاده از این کارت‌ها را تولید می‌کنند که می‌تواند جهت تحلیل مورد استفاده قرار گیرد.

این داده‌ها به صورت ناشناس است و برای درک اینکه مردم به کجا و در چه زمانی سفر می‌کنند مورد استفاده قرار می‌گیرد. این موضوع به TfL تصویر کلی بسیار دقیق‌تری نسبت به آنچه تا قبل از این میسر بود، در سطح سفرهای شخصی ارائه می‌دهد. از آنجا که نسبت بزرگی از سفرهای درون شهری لندن شامل بیش از یک روش حمل و نقل است، این سطح از تحلیل در زمانی که بلیت‌ها از سرویس‌های مختلف خریداری می‌شدند، با بلیت‌های کاغذی، امکان‌پذیر نبود. تحلیل عظیم‌داده (Big Data analysis) همچنین به TfL هنگام وقوع اختلال کمک می‌نماید.

هنگامی که رخدادی غیرمنتظره رخ می دهد، شرکت می‌تواند تعداد افرادی که با تأخیر مواجه شده‌اند را محاسبه نماید و مشتریان می‌توانند درخواست خسارت کنند. در صورت شدت اختلال، همچنین می‌تواند به صورت خودکار بازپرداخت را انجام دهد. مشتریانی که با پرداخت بدون تماس سفر می‌کنند، به صورت خودکار در اکانت خود اعتبار دریافت می‌کنند و برای مشتریان سیستم Oyster ،TfL می‌تواند با پیش‌بینی مقصد بعدی مشتری، بازپرداخت را در ایستگاه مورد نظر در کارت مشتری اختصاص دهد. 

این رویکرد شخصی‌سازی شده نسبت به اطلاعات سفر، از نکات مورد تأکید توسط شرکت می‌باشد. داده‌های سفر همچنین برای شناسایی مشتریانی که به طور منظم مسیرهای مشخصی را استفاده می‌کنند به کار می‌رود و برای آنها بروزرسانی‌های متناسب با مسیر را ارسال می‌نماید. به گفته Sager، اگر شرکت بداند که یک مشتری اغلب از یک ایستگاه مشخص استفاده می‌کند، می‌توان اطلاعاتی در خصوص تغییرات خدمات در ایستگاه مورد نظر به صورت آپدیت شده برای وی ارسال نمود. با توجه به حجم ایمیل‌هایی که افراد روزانه دریافت می‌کنند، تلاش می‌شود تا اطلاعات مشخص و مرتبطی برای او ارسال شود.

نتایج و داده‌های مورد استفاده:

TfL اکنون تصویری شفاف‌تر از هر زمان دیگر از چگونگی حرکت مردم در سیستم حمل و نقل لندن تا سطح سفرهای شخصی در اختیار دارد. این داده‌ها به شناخت بسیاری از موارد به طور مثال شلوغی اتوبوس‌ها یا تعداد اتوبوس‌ها در یک زمان مشخص و موارد دیگری در ارائه خدمات به مشتریان در ایستگاه‌ها کمک می‌نماید. به طور خلاصه، داده‌ها به TfL کمک می‌نماید تا خدمات بهتری را به مشتریان ارائه دهد. در خصوص ایمیل‌های شخصی‌سازی شده، 83% از مسافران این خدمت را مفید یا بسیار مفید ارزیابی نموده‌اند که بد به نظر نمی‌رسد.

شرکت، گستره‌ای از داده‌هایی که از طریق سیستم‌های بلیت (ticketing) جمع‌آوری می‌شوند، سنسورهایی که به وسائط حمل و نقل متصل هستند و سیگنال‌های ترافیکی، پیمایش‌ها و گروه‌های هدف، و البته رسانه‌های اجتماعی را مورد استفاده قرار می‌دهد. همچنین از اطلاعات مربوط به رویدادهای خاص مانند جام جهانی راگبی و رویدادهای دوچرخه سواری مانند تور فرانسه هنگامی که از لندن عبور می‌کند، استفاده می‌کند تا بتوانند افرادی که این رویدادها بر آنها اثر می‌گذارد شناسایی و به آنها اطلاع دهند.

جزئیات فنی:

سیستم‌های TfL بر روی انواع مختلفی از پلتفرم‌های تراکنشی قدیمی اجرا می‌شوند و همچنین سیستم‌های با فناوری جدید نیز پیاده‌سازی شده‌اند. در واقع یکپارچه‌سازی استراتژی‌های جدید جمع‌آوری داده با سیستم‌های قدیمی در شهری که سیستم حمل و نقل عمومی آن از سال 1829 شروع به کار کرده است، کار راحتی نیست. بنابراین TfL باید به دقت بررسی نماید که چگونه به بهترین شکل می‌تواند منابع داده را با یکدیگر یکپارچه نماید و همواره ریسک اختلال و شکست در این پروژه‌ها وجود دارد. بنابراین TfL رویکردی بسیار عملی برای ایجاد انبارداده مشتریان اتخاذ نموده است.

آنها مزایای کسب و کاری رویکرد عظیم‌داده را پیش از ایجاد سیستم نرم‌افزاری و ابزار جدید مورد تست قرار دادند و شروع به تحلیل SQL بر روی محیط کوچکی از گزارش‌دهی سیستم تراکنشی برای جمع‌آوری درآمد نمودند. با امکان‌پذیر شدن چنین تحلیل سودمندی، زمینه برای تحلیل‌های بیشتر فراهم گردید و TfL تصمیم به سرمایه‌گذاری بر روی ابزار انبارداده موازی که همچنین امکان سرویس‌های تحلیلی جدید و متن‌باز را فراهم می‌نمود، گرفت. پلتفرم تحلیلی 150 ترابایت فضا برای گزارش‌دهی تحلیل کسب و کار و همچنین تست ابزارهای جدید داده و الگوریتم‌ها از طریق تست‌های POC (proof of concept) که با فرآیند توسعه چابک (agile) ارائه می‌شوند، در اختیار TfL قرار می‌دهد. هنگامی که این POCها مورد ارزیابی قرار بگیرند، اگر منافع کسب و کاری دربرداشته باشند، به صورت صنعتی در انبارداده مرکزی مورد پشتیبانی عملیاتی قرار می‌گیرند. برنامه‌های توسعه آتی شامل افزایش ظرفیت تحلیل بلادرنگ و کار بر روی یکپارچه‌سازی گستره وسیع‌تری از منابع داده‌ای جهت برنامه‌ریزی بهتر خدمات و اطلاع‌رسانی به مشتریان می‌باشد.

چالش‌های موجود:

یکی از چالش‌های مطرح شده، در خصوص ردیابی سفرهای افراد می‌باشد. هر چند در سیستم متروی لندن (Tube) به علت اینکه هزینه وابسته به مسافت طی شده می‌باشد، ورود و خروج مسافران هر در ابتدا و هم انتها در سیستم ثبت می‌شود اما در سیستم اتوبوسرانی به علت ثابت بودن کرایه، صرفاً در ابتدا از بلیت استفاده می‌شود و به این ترتیب اینکه مسافر در کجا از اتوبوس پیاده شده است نامشخص است. برای حل این چالش با استفاده از راه‌حل عظیم‌داده، TfL با کمک MIT که از شرکای تحقیقاتی این شرکت می‌باشد، به استفاده از عظیم‌داده در این راستا می‌پردازد. در واقع با استفاده از داده‌های مکانی و داده‌های سیستم بلیت (Oyster) می‌توان نقطه تماس بعدی را به دست آورد و به طور مثال اگر نقطه تماس بعدی در زمان کوتاهی و در ورودی ایستگاه مترو باشد، با یک سفر چند حالته (مترو و اتوبوس) مواجه هستند.

آموخته‌ها و نکات کلیدی:

عظیم‌داده به وضوح نقش مهمی  در شبکه جدید حمل و نقل لندن ایفا نموده است. اما این نکته حائز اهمیت است که استفاده از عظیم‌داده به طور هوشمندانه‌ای پیاده‌سازی شده است. از نقطه نظر رئیس بخش تحلیل TfL، این نکته بسیار مهم است که ما درک کنیم گاهی بینش‌هایی از تحلیل عظیم‌داده حاصل می‌شود که "صرفاً دانستن آنها جالب است" و در واقع آنچه مهم است آن است که یک مورد کسب و کاری پیدا کنیم. آنچه ضروری است بازگشت به سؤالات مهم و اصلی است که عبارتست از چگونگی پاسخگویی به تقاضا در شهر رو به رشد لندن و این مهم با مدیریت کارآمد شبکه و زیرساخت میسر می‌گردد. درک آنچه می‌خواهید به آن دست یابید، کلید به کارگیری موفق داده‌ها می‌باشد. گیج شدن با تعداد زیاد احتمالات که توسط عظیم‌داده ارائه می‌شود کاملاً متحمل است، بنابراین باید تمرکز شدید بر روی اهداف و چالش‌های مورد نظر و دسترسی بر روی داده‌هایی که آنها را برآورده می‌سازد داشت.