دادهکاوی سودمندترین ابزار کشف دانش از میان تراکنشها است [3] [2] [1]. یکی از کاربردهای مهم دادهکاوی، کشف قوانین انجمنی میباشد که یکی از مهمترین روش های بازشناسی الگو در سیستمهای بدون نظارت است. کشف قوانین انجمنی مانند جستجوی طلا در یک پایگاه داده بسیار بزرگ است، که در اینجا منظور از طلا یک قانون جذاب که هنوز کشف نشده است، میباشد. از این طریق میتوان تمام قوانین ممکن را در یک پایگاه داده پیدا کرد، اما مسئله اینجاست که تحلیل تعداد زیادی قانون کار سختی است. به همین جهت، معیارهایی همچون ضریب پشتیبان و ضریب اطمینان برای مشخص کردن قوانین با کیفیت بالاتر به کار میروند.
اکثر الگوریتمهای کاوش قوانین انجمنی، مانند الگوریتم Apriori و AIS، مبتنی بر روش هایی هستند که توسط Agrawalدر [4] و [5] پیشنهاد شدهاند. با بهره گرفتن از این متدها نمیتوان قوانینی را که شامل صفات خاصه عددی هستند کشف نمود. این الگوریتمها مسئله کاوش قوانین انجمنی را به دو قسمت
تقسیم میکنند . از آنجایی که کاوش قوانین انجمنی عددی یک مسئله بهینه سازی سخت است تا یک مسئله گسسته سازی ساده، دستۀ مهمی از مسائل کاوش قوانین انجمنی وجود دارند که تنها زمانی میتوانند با یک الگوریتم بهینه سازی ترکیبی حل شوند که بازة پیوستۀ مقادیر مجاز صفات خاصۀ عددی به مجموعۀ محدودی تبدیل شوند. مسئله تبدیل بازة پیوسته به مجموعۀ متناهی همیشه کار راحتی نیست، به خصوص
زمانی که بازة اولیه، بازة وسیعی باشد و شفافیت و دقت بالایی مد نظر باشد. بنابراین، در این گونه موارد، معمولاً الگوریتمهایی که به طور طبیعی و ساده قادر به کار کردن با متغیرهای پیوسته عددی هستند، بهتر عمل میکنند [8].
هم چنین، کاوش قوانین انجمنی عددی باید به عنوان یک مسئلۀ چند هدفه تلقی شود، چرا که یک قانون انجمنی باید قانونی جذاب و با مقدار پشتیبان و اطمینان بالایی باشد؛ لذا الگوریتمهای کاوش قوانین انجمنی بایستی چند هدفه بوده و به طور همزمان همۀ معیارها را برای کشف قوانین انجمنی مفید بررسی نمایند.
در سالهای اخیر، الگوی هوش جمعی و به خصوص از این میان بهینه سازی کلونی مورچهها و بهینه سازی گروه ذرات، توجه زیادی را در تحقیقات به خود جلب کرده است. همینطور، این الگوریتمها رایجترین متاهیوریستیکهای هوش جمعی برای داده کاوی هستند.
هوش جمعی، شاخه نسبتاً جدیدی از هوش مصنوعی است که به بررسی هوش جمعی حاصل از گروهی از عاملهای ساده میپردازد. الگوریتمهای هوش جمعی مبتنی بر رفتار اجتماعی هستند که درطبیعت قابل مشاهده است، مانند کلونی مورچهها، دسته پرندگان، گروه ماهیها و کندوی زنبور عسل که در
آنها تعدادی از اعضاء که قابلیتهای محدودی دارند با همکاری هم قادرند به راه حلهایی برای مسائل پیچیده، دست پیدا کنند.
اولین الگوریتم ACO، توسط Dorigo و همکارانش در سال 1992 در [8] جهت حل مسئله فروشندة دورهگرد ارائه شد. این الگوریتم از رفتار جستجوی غذا در مورچه های حقیقی الهام گرفته شده است. اساس این رفتار، ارتباط غیر مستقیم مورچهها از طریق دنباله های شیمیایی فرومون است که آنها را
تا کنون الگوریتمهای ACO متعددی برای حل مسائل بهینه سازی گسسته و پیوسته، ارائه شده است. اخیراً، نسخۀ پیوستۀ متاهیوریستیک بهینه سازی کلونی مورچهها، با هدف حل مسائل بهینه سازی پیوسته توسط Socha و Dorigo، به نام ACOR، در [10] ،[8] و [11] ارائه شده است. نسخۀ ACOR، به جای استفاده از تابع احتمالی که، یک مقدار برای هر رأس (که نشان دهنده یک مقدار منفرد برای متغیر گسسته است) در نظر میگیرد، از یک توزیع احتمال که شامل توابع چگالی احتمال گوسی متعددی است و به راحتی قابل نمونهگیری میباشد، استفاده میکند. این الگوریتم در دادهکاوی برای آموزش وزنهای یک شبکه عصبی در [12] به کار رفته است. بر اساس آزمایشات انجام گرفته روی سه مجموعه دادة تشخیص پزشکی، آنها دریافتند، نسخه هیبرید، که الگوریتم 13] Levenberg-Marquart] را با ACOR ترکیب میکند، بهتر از الگوریتمهای Levenberg-Marqunt و انتشار به عقب عمل میکند. نتایج نشان میدهد، با وجود این که محیط آزمایشگاهی نسبتاً محدود است، پتانسیل کاربرد ACOR در داده کاوی امید بخش است.
تا کنون هیچ مطالعهای صورت نگرفته است که از ACOR برای کاوش قوانین انجمنی عددی استفاده کرده باشد. در این پایان نامه، به توصیف چگونگی پیدا کردن بازههای پر تکرار دادگان عددی و قوانین انجمنی حاصل از آنها توسط ACOR، در یک مرحله و بدون نیاز به مشخص کردن حد اقل
پشتیبان و اطمینان قوانین پرداخته شده است. در الگوریتم پیشنهادی، تابع هدفی که قرار است بهینه شود، تابعی وزن دار بوده، که سه معیار پشتیبان، اطمینان و جذابیت را به طور همزمان بهینه میکند و عملکرد چند هدفه دارد. نتایج نشان میدهد که قوانین انجمنی دقیق و صحیحی از این طریق، قابل تولید خواهند بود.
در فصل اول این پایان نامه، ی بر کلیات تحقیق ارائه میشود که شامل هدف تحقیق، پیشینۀ آن و روش تحقیق میباشد. سپس در فصل دوم، مفاهیم داده کاوی و کاوش قوانین انجمنی و هم چنین الگوریتمهای بهینه سازی کلونی مورچهها تحت عنوان ادبیات موضوع مطرح میشود. فصل سوم به توصیف الگوریتم پیشنهادی اختصاص دارد و نتایج و ارزیابی الگوریتم پیشنهادی و مقایسۀ آن با روش های قبلی در فصل چهارم آورده شده است. در نهایت در فصل پنجم، جمعبندی صورت گرفته و کارهای آینده پیشنهاد میشود.