نام مقاله: عظیم‌داده: یادگیری عمیق برای تحلیل احساسات در حوزه‌ی مالی

Big Data: Deep Learning for financial sentiment analysis

ژورنال: Journal of Big Data

شماره: Volume 5, Issue 1

نویسندگان: Sahar Sohangir, Dingding Wang, Anna Pomeranets and Taghi M. Khoshgoftaar

سال انتشار: 2018

تعداد ارجاعات: 35

خلاصه: یادگیری عمیق و عظیم‌داده به عنوان دو حوزه مهم در علم داده مورد توجه هستند. یادگیری عمیق نتایج قابل توجهی در حوزه‌هایی چون پردازش زبان طبیعی، بینایی ماشین و تشخیص گفتار حاصل نموده است و از سوی دیگر عظیم‌داده نیز برای سازمان‌هایی که نیازمند جمع‌آوری حجم زیادی از داده‌هایی نظیر داده‌های شبکه اجتماعی هستند حائز اهمیت می‌باشد و یکی از دارایی‌های مهم برای به کارگیری یادگیری عمیق، تجزیه و تحلیل حجم زیادی از داده می‌باشد. این مزیت یادگیری عمیق را به عنوان ابزاری ارزشمند برای بیگ دیتا مطرح ساخته است و می‌تواند اطلاعات پنهان در عظیم‌داده را استخراج نماید. در واقع در حوزه عظیم‌داده ویژگی‌ها و چالش‌های متعددی مطرح است از جمله تنوع، حجم، سرعت در کنار چالش‌هایی نظیر مهندسی ویژگی، ابعاد بالا، پاکسازی داده‌ها و افزونگی داده‌ها و همچنین در این حوزه نیازمند تجزیه و تحلیل، تصمیم‌گیری و اقدام سریع می‌باشیم. فناوری مرتبط با عظیم‌داده نیز هنوز جوان بوده و با مسائلی در حوزه محاسبات جریانی، محاسبات موازی، معماری و مدل بیگ دیتا و سیستم‌های نرم‌افزاری پشتیبان مواجهیم. روش‌های یادگیری عمیق می‌تواند قدرت پیش‌بینی‌کنندگی عظیم‌داده را در حوزه‌های مختلف افزایش دهد.

در حوزه پردازش زبان طبیعی، فرآیند یادگیری سلسله‌مراتبی در یادگیری عمیق به یافتن معانی و ارتباط کلمات کمک می‌کند و از این رو آنرا به یکی از مدل‌های مطلوب برای تحلیل احساسات تبدیل می‌نماید. در رویکرد داده‌کاوی استاندارد برای دسته‌بندی متن، متون به عنوان بردارهایی از bag-of-word هستند. این بردارها نشان می‌دهد کدام کلمات در متن هستند اما ترتیب کلمات در جمله را در نظر نمی‌گیرند. حال آنکه ترتیب کلمات در جمله می‌تواند احساس مربوط به آن جمله را تغییر دهد. یک راه‌حل موجود استفاده از n-gram می‌باشد که استفاده از CNN فرصتی جهت به کارگیری n-gram برای استخراج احساسات متن به شیوه‌ای مؤثر ارائه می‌دهد که با بهره‌گیری از ساختار درونی داده که در متن وجود دارد از طریق لایه‌های کانولوشن انجام می‌گیرد.

می‌توان گفت بازار بورس مدرن مثالی از شبکه‌های اجتماعی است. مسائلی که در این حوزه مطرح می‌شود، زمان خرید و فروش سهام و همچنین اینکه چه سهامی خریداری شود می‌باشد. آنچه در میان سرمایه‌گذاران مرسوم است استفاده از مشاوران مالی حرفه‌ای است اما بهترین منبع برای پشتیبانی از تصمیمات این افراد چیست؟ بانک‌های سرمایه‌گذاری معروف بیش از یک دهه در عرصه مشاوره مالی غالب بوده‌اند با این حال با گسترش اینترنت و شبکه‌های اجتماعی مالی نظیر StockTwits و SeekingAlpha، سرمایه‌گذاران در سرتاسر دنیا فرصت جدیدی برای جمع‌آوری و به اشتراک‌گذاری تجربیاتشان دارند. متخصصان می‌توانند حرکت بازار بورس را در شبکه‌های اجتماعی مالی با دقت قابل قبولی پیش‌بینی نمایند. آنچه در این مقاله به آن پرداخته شده است پاسخ به این سؤال است که احساسات یا نظر گروه وسیعی از این مختصصان در خصوص سهام‌های مختلف چه می‌باشد؟ و تعیین اینکه آیا مدل‌های یادگیری عمیق می‌تواند جهت بهبود عملکرد تحلیل احساسات بر روی StockTwits پذیرفته شوند؟

در ابتدا نویسندگان به بررسی ارتباط میان قیمت آتی سهام و احساسات کاربران با استفاده از ضریب همبستگی پیرسون پرداخته‌اند و از یادگیری عمیق برای تحلیل احساسات نویسندگان برتر در این شبکه اجتماعی استفاده شده است. مدل‌های شبکه عصبی نظیر LSTM، Doc2vec، CNN بر روی مجموعه داده‌های StockTwits اعمال شده است و با الگوریتم LR مقایسه شده‌اند. مجموعه داده‌های StockTwits به عنوان یک شبکه اجتماعی مالی در سال 2009 ایجاد شده است و شامل اطلاعاتی از بازار بورس نظیر آخرین قیمت‌ها، تغییرات قیمت، تاریخچه مبادلات بورس، توصیه‌های مبتنی بر خرید یا فروش و ... می‌باشد. علاوه بر این به عنوان یک شبکه اجتماعی امکان تبادل تجربیات میان معامله‌کنندگان در بازار بورس را شامل می‌شود.

 نتایج به دست آمده در این مقاله نشان می‌دهد مدل یادگیری عمیق می‌تواند به نحو مؤثری برای تحلیل احساسات در حوزه مالی استفاده شوند و CNN در مقایسه با سایر الگوریتم‌های به کار گرفته شده به عنوان بهترین مدل برای پیش‌بینی احساسات بر روی مجموعه داده‌های StockTwits معرفی شده است و عملکرد بهتری نسبت به LR نشان داده است و استفاده از CNN برای پیش‌بینی احساس افراد در شبکه اجتماعی مذکور توانسته است حرکت‌های آتی بازار را پیش‌بینی نماید.

بخش‌های مختلف این مقاله شامل مرور کارهای انجام شده در حوزه تحلیل احساسات داده‌های صنعت مالی و روش‌های به کار گرفته شده در آن، مروری بر تحلیل بیگ دیتا، بحث بر روی روش‌های تحلیل احساسات و مزایای به کارگیری یادگیری عمیق برای تحلیل احساسات و همچنین بررسی روش‌های مختلف داده‌کاوی جهت انجام تحلیل احساسات بر روی دیتاست StockTwits می‌باشد و در نهایت استفاده از یادگیری عمیق برای تحلیل عظیم‌داده مورد بررسی قرار گرفته است و چالش‌های پیش رو در تحلیل‌های حوزه عظیم‌داده مطرح گردیده است.

 

دریافت فایل