📌 “Artificial Intelligence For Business Analytics: Algorithms, Platforms, and Applications Scenarios”
کتاب: هوش مصنوعی برای تحلیل کسب و کار: الگوریتمها، پلتفرمها و سناریوهای کاربردی
فصل دوم: هوش مصنوعی
در فصل دوم کتاب به بررسی مفاهیم اولیه و کاربرد هوش مصنوعی در تحلیل کسب و کار پرداخته می شود. به طور کلی هوش مصنوعی شامل شاخه های متنوعی همچون پردازش زبان طبیعی، رباتیک، سیستم های خبره، روش های فرا ابتکاری حل مساله و یادگیری ماشین می باشد. آن ساحت از هوش مصنوعی که در موضوعات تحلیلگری کسب و کار مورد توجه قرار می گیرد روش های یادگیری ماشین هست که در این فصل به آن پرداخته می شود.
یادگیری ماشین در هوش مصنوعی به روشها و الگوریتمهای آماری اشاره دارد که با هدف استخراج الگوهای پنهان از مجموعه داده ها به کار گرفته می شوند. به طور کلی الگوریتم های یاد گیری ماشین را در سه طبقه می توان دسته بندی کرد:
- یادگیری با نظارت:
در این روش در مجموعه دادهها، کلاس یا متغیری در مجموعه داده ها وجود دارد که به دنبال پیش بینی آن می باشیم. یادگیری در تحت نظارت مدل شامل ایجاد تابعی است که با استفاده از مجموعه داده های آموزشی آموزش داده می شود و سپس می تواند باشد به داده های جدید اعمال می شود. در این روش مجموعه داده آموزشی حاوی رکوردهای برچسب گذاری شده (برچسب) است به طوری که نگاشت به نتیجه دلخواه با توجه به ورودی مجموعه از قبل شناخته شده است. هدف ساختن این تابع به گونهای است که امکان تعمیم برای فراتر از داده های اولیه وجود داشته باشد، یعنی داده های ناشناخته را به نتیجه صحیح اختصاص دهید.
- یادگیری بدون نظارت:
یادگیری بدون نظارت یک مدل یادگیری ماشین که فاقد یک برچسب یا کلاس نظارتی است و راهی به مشابه یادگیری با نظارت برای سنجش کیفیت وجود ندارد. هدف این روش خوشه بندی داده ها بر اساس ویژگی های مشترک به دسته های مختلفی می باشد به گونه ای که درون هر خوشه بیشترین شباهت و بین خوشه های بیشترین اختلاف باشد. یادگیری بدون نظارت را در دو گروه خوشه بندی و استخراج قوانین قرار دارد.
- یادگیری تقویتی:
یادگیری تقویتی یک مدل یادگیری با توانایی یادگیری نه تنها پیش بینی خروجی بر اساس ورودی، بلکه چگونگی نگاشت متغیرهای ورودی به متغیرهای خروجی بر اساس وابستگی بین متغیرها می باشد. در این روش مفهومی به نام محیط یادگیری تعریف می شود که در ان امکان بررسی عمل و عکس العمل های مختلف بر اساس تنبیه و پاداش ممکن می باشد. در این روش تمامی متغیرهای ورودی بر اساس یک عامل هوشمند نظارت می شود و سپس بر اساس تابع هدف تعریف شده اقدامات مختلفی تعریف می شود تا بتوان تاثیر پیاده سازی اقدامات مختلف را در محیط یادگیری ارزیابی کرد. نهایتا با استفاده از مکانیزم پاداش و تنبیه این امکان برای یادگیری و بهبود مدل فراهم می شود.
علاوه بر سه دسته بندی ارائه شده برای مدل های یادگیری ماشین نیاز هست تا انواع مسائل و تکنیک های یادگیری ماشین نیز آشنا شویم که در ادامه فصل به آن پگرداخته شده است.
- طبقه بندی:
فرآیند شناسایی، درک و دسته بندی دادهها یا اشیای از پیش تعیین شده است. الگوریتم طبقه بندی یک تکنیک یادگیری نظارت شده است. در این تکنیک، ماشین از مجموعهای از دادهها یاد میگیرد و سپس آنها را به تعدادی کلاس یا گروه طبقهبندی می کند به طور خلاصه در روش نظارت شده، از توابعی استفاده می شود که بتواند یک برچسب از قبل تعریف شده را برای مجموعهای از ورودیها پیشبینی کند. نکته مهم در روش طبقه بندی کلاس وابسته و یا برچسب مساله می باشد که به صورت متتغیر اسمی می باشند نه عددی پیوسته. در این دسته روش های مختلف و متنوعی همانند درخت تصمیم گیری، نایو بیز، شبکه های عصبی و نزدیک ترین همسایگی وجود دارد.
- استخراج قوانین
در این روش ها، برچسب و یا کلاس خاصی وجود ندارد و هدف شناسایی و کشف الگوهای وابستگی و الگوهای تکرار شونده بین متغیرها می باشد. الگوهای تکرار شونده به معنی وجود وابستگی در میان داده ها می باشد و به قوانینی که چنین روابطی را نشان می دهند، قوانین وابستگی یا قوانین انجمنی گفته می شود. چنین اطلاعاتی می تواند به عنوان مبنای تصمیماتی برای برخی از فعالیت های فروشگاهی همچون ارائه مناسب تخفیف برای محصولات یا قراردادن مناسب محصولات در کنار هم، مورد استفاده قرار گیرد. نقطه قوت این روشها استخراج قوانین شفاف و تفسیر پذیر می باشد که در تحلیل کسب و کار بینش های ارزشمندی را ایجاد می کند.
- خوشه بندی
این روش زیرمجموعهای از یادگیری نظارت نشده است که با بهرهگیری از الگوریتم خوشه بندی، دادههای بدون برچسب زیادی در اختیار آن قرار داده و اجازه میدهیم تا نمونهها را در گروههای مجزا طبقهبندی کند. به هر یک از این گروهها «خوشه» میگویند. یک خوشه، گروهی شامل نقاط داده شبیه به یکدیگر از نظر ارتباطشان با نمونههای مجاور است. در این نوع مسائل، در ابتدای کار، اطلاعات چندانی درباره مسئله نداریم و به همین خاطر، بهرهگیری از الگوریتم های خوشه بندی نقطه شروع خوبی برای آشنایی با دادهها است.
- پیش بینی و رگرسیون:
یکی دیگر از مسائل متداولی که در یادگیری ماشین برای تحلیل کسب و کار با آن مواجه می شویم استفاده از رگرسیون برای پیش بینی می باشد. در روش های رگرسیون به دنبال یافتن ارتباط بین متغیر وابسته که یک متغیر عددی پیوسته می باشد با مجموعه متغیرهای ورودی هستیم. مکانیزم این روش مشابه روش های یادگیری با نظارت می باشد به این صورت که مجموعه داده به دو دسته آموزش و تست تقسیم می شود تا بتوان بهترین مدل پیش بینی را انتخاب کرد.
- بهنیه سازی:
بهینه سازی فرایندی است که در آن بهترین جواب (با توجه به مجموعهای از معیارها) از میان مجموعهای از جوابهای ممکن، برای یک مسأله خاص انتخاب میشود. در هر مساله کسب و کاری که هدف بیشینه یا کمینه کردن تابع هدفی باشد می توان از روش های بهینه سازی استفاده کرد. نکته مهم در این مسائل شناسایی دقیق محدودیت ها و مدل سازی ریاضیاتی آن ها می باشد تا بتوان با در نظر گرفتن تمامی محدودیت های کسب و کاری بهترین جواب ممکن برای متغیرهای تصمیم گیری را گرفت.
- سیستم های توصیه گر:
سیستم های توصیه گر زیر مجموعهای از سیستمهای فیلتر اطلاعات محسوب میشوند. هدف سیستم های توصیه گر، پیشنهاد مناسبترین آیتمها به کاربران است. در روشهای مبتنی بر پیشنهاد، دادههای مرتبط با رفتار کاربران (در خرید کالا، دریافت دادهها، تماشای سرگرمی و سایر موارد) تحلیل و مدلسازی میشوند. سپس، از مدل تولید شده برای پیشبینی مناسبترین آیتم برای کاربران استفاده میشود. بیشترین استفاده سیستم های توصیه گر، در پیادهسازی کاربردهای تجاری به ویژه، در حوزه محصولات و خدمات مصرفی کاربران است.