توزيع

now browsing by tag

 
 

(سایت مقاله ) - \"(سایت مرجع ریسرچ)\"

عنوان صفحه
فصل اول: کلیات
1-1- بیان مسئله ..............................................................................................................................................................................1
1-2- اهمیت موضوع ..................................................................................................................................................................... 3
1-3- اهداف تحقیق ...................................................................................................................................................................... 4
1-3-1- هدف کلی ............................................................................................................................................................................ 5
1-3-2- اهداف جزئی ........................................................................................................................................................................ 5
فصل دوم: پیشینه تحقیق
2-1- تحقیقات داخلی ................................................................................................................................................................. 7
2-2- تحقیقات خارجی ............................................................................................................................................................... 9
فصل سوم: مبانی نظری تحقیق
3-1- مروری بر نظریات مرتبط ......................................................................................................................................... 19
3-1-1- نظریه ذائقه بوردیو .......................................................................................................................................................... 19

متن کامل در سایت امید فایل 

3-1-2- نظریه نیاز مازلو ..................................................................................................................................................................21
3-1-3- نظریه یادگیری اجتماعی تارد و باندورا .............................................................................................................. 23
3-1-4- نظریه مک دونالیزه شدن ریتزر ............................................................................................................................... 25
3-1-5- تئوری کنش و مفهوم عادت‌واره بوردیو ............................................................................................................... 27
3-1-6- نظریه کنش منطقی آیزن و فیش‌باین ............................................................................................................... 29
3-1-7- نظریه گذار تغذیه‌ای پاپکین ...................................................................................................................................... 30
3-2- چارچوب نظری تحقیق ................................................................................................................................................. 31
3-3- مدل نظری تحقیق ............................................................................................................................................................32
3-3-1- مدل مفهومی .................................................................................................................................................................... 32
3-3-2- مدل تجربی ....................................................................................................................................................................... 33
3-4- فرضیات تحقیق .................................................................................................................................................................. 34
3-5- تعریف نظری و عملیاتی متغیرها ......................................................................................................................... 32
3-5-1- متغیر وابسته .......................................................................................................................................................................34
3-5-2- متغیرهای مستقل ........................................................................................................................................................... 35
فصل چهارم: روش‌شناسی تحقیق
4-1- روش و تکنیک تحقیق ................................................................................................................................................ 38
4-2- ابزار گردآوری اطلاعات ................................................................................................................................................. 38
4-3- جامعه آماری ........................................................................................................................................................................ 39
4-4- روش نمونه‌گیری و حجم نمونه ............................................................................................................................. 39
4-5- پایایی و روایی ابزار سنجش .................................................................................................................................... 40
4-6- تکنیک تجزیه و تحلیل داده‌ها ............................................................................................................................... 40
فصل پنجم: تجزیه و تحلیل داده‌ها
5-1- آمار توصیفی ........................................................................................................................................................................ 38
5-2- آمار استنباطی .................................................................................................................................................................... 61
5-3- تحلیل چند متغیره ......................................................................................................................................................... 72
فصل ششم: بحث و نتیجه گیری
6-1- نتیجه‌گیری .......................................................................................................................................................................... 86
6-2- پیشنهادات تحقیق ........................................................................................................................................................ 92
6-3- محدودیت‌های تحقیق .................................................................................................................................................. 93
فهرست منابع .................................................................................................................................................................................... 94
فهرست جداول
شماره و عنوان صفحه
4-1- ضرایب آلفای کرونباخ متغیر وابسته تحقیق 40
5-1-1- توزیع فراوانی گروه سنی به تفکیک نسل مادران و دختران 43
5-1-2- توزیع فراوانی تعداد فرزندان در نسل مادران 44
5-1-3- توزیع فراوانی قومیت به تفکیک نسل مادران و دختران 44
5-1-4- توزیع فراوانی وضعیت تأهل به تفکیک نسل مادران و دختران 45
5-1-5- توزیع فراوانی وضعیت اشتغال به تفکیک نسل مادران و دختران 45
5-1-6- توزیع فراوانی هزینه ماهیانه در نسل مادران 46
5-1-7- توزیع فراوانی هزینه ماهیانه در نسل دختران 47
5-1-8- توزیع فراوانی طبقه اجتماعی فرد به تفکیک نسل مادران و دختران 48
5-1-9- توزیع فراوانی تحصیلات به تفکیک نسل مادران و دختران 49
5-1-10- وضعیت استفاده روزانه از رسانه‌های جمعی به تفکیک گروه سنی مادران 50
5-1-11- وضعیت استفاده روزانه از رسانه‌های جمعی به تفکیک گروه سنی دختران 51
5-1-12- توزیع فراوانی ارزیابی پاسخگویان از وضعیت سلامتیشان به تفکیک نسل 52
5-1-13- توزیع فراوانی احساسات غالب پاسخگویان به تفکیک نسل 53
5-1-14- توزیع فراوانی سابقه بیماری مختل کننده زندگی، به تفکیک نسل 54
5-1-14- توزیع فراوانی سابقه بیماری‌های خاص، به تفکیک نسل 55
5-1-16- توزیع فراوانی فعالیت بدنی به تفکیک نسل مادران و دختران 55
5-1-17- توزیع فراوانی تصور از بدن پاسخگویان، به تفکیک نسل 57
5-1-18- توزیع فراوانی نمایه توده بدنی پاسخگویان به تفکیک نسل 58
5-1-19- توزیع فراوانی میزان کنترل تغییرات وزن به تفکیک نسل 59
5-1-20- توزیع فراوانی عادت غذایی به تفکیک نسل مادران و دختران 60
5-1-21- توزیع فراوانی پاسخگویان بر حسب گروه‌های سنی و میانگین عادت غذایی 61
5-1-22- توزیع فراوانی پاسخگویان بر حسب هزینه ماهیانه و میانگین عادت غذایی 61
5-1-23- توزیع فراوانی پاسخگویان بر حسب طبقه و میانگین عادت غذایی 62
5-1-24- توزیع فراوانی پاسخگویان بر حسب گروه‌های تحصیلی و میانگین عادت غذایی 63
5-1-25- توزیع فراوانی پاسخگویان بر حسب وضعیت اشتغال و میانگین عادت غذایی 63
5-1-26- توزیع فراوانی پاسخگویان بر حسب میزان فعالیت و میانگین عادت غذایی 64
5-1-27- توزیع فراوانی پاسخگویان بر حسب کنترل وزن و میانگین عادت غذایی 64
5-2-1- آزمون رابطه‌ی عادت غذایی با سن پاسخگویان 65
5-2-2- آزمون رگرسیون رابطه‌ی عادت غذایی با تعداد فرزندان مادر 66
5-2-3- آزمون تحلیل واریانس عادت غذایی بر اساس قومیت پاسخگویان 66
5-2-4- آزمون رابطه‌ی عادت غذایی با وضعیت تأهل در نسل دختران 67
5-2-5-1 آزمون تفاوت میانگین عادت غذایی بر اساس اشتغال مادران 67
5-2-5-2 آزمون رابطه‌ی عادت غذایی با اشتغال مادران 68
5-2-5-3 آزمون تحلیل واریانس عادت غذایی بر اساس وضعیت اشتغال دختران 68
5-2-6- آزمون رگرسیون رابطه‌ی عادت غذایی با هزینه پاسخگویان 69
5-2-7-1 نتایج آزمون تحلیل واریانس عادت غذایی بر اساس طبقه اجتماعی پاسخگویان 70
5-2-7-2 آزمون رگرسیون رابطه‌ی عادت غذایی با طبقه اجتماعی پاسخگویان 70
5-2-8- آزمون رابطه‌ی عادت غذایی با میزان استفاده پاسخگویان از رسانه‌های جمعی 71
5-2-9- آزمون رابطه‌ی عادت غذایی با تحصیلات به تفکیک نسل مادران و دختران 72
5-2-10 آزمون رگرسیون رابطه عادت غذایی با سابقه بیماری به تفکیک نسل 73
5-2-11- آزمون رابطه‌ی عادت غذایی با فعالیت بدنی به تفکیک نسل مادران و دختران 73
5-2-12- آزمون تحلیل واریانس عادت غذایی بر اساس تصور از بدن به تفکیک نسل 74
5-2-13- آزمون رابطه‌ی عادت غذایی با حجم بدن به تفکیک نسل 75
5-2-14- آزمون تحلیل واریانس عادت غذایی بر اساس میزان کنترل وزن پاسخگویان 75
5-3-1-1- متغیرهای اقتصادی- اجتماعی وارد شده در رگرسیون گام‌به‌گام نسل مادران 76
5-3-1-2- متغیرهای اقتصادی- اجتماعی وارد شده در رگرسیون گام‌به‌گام نسل دختران 77
5-3-1-3 متغیرهای وارد شده آگاهی در در رگرسیون گام‌به‌گام برای نسل مادران 78
5-3-1-4 متغیرهای وارد شده آگاهی در در رگرسیون گام‌به‌گام برای نسل دختران 78
5-3-1-5 متغیرهای وارد شده شاخص‌های سلامت در رگرسیون گام‌به‌گام نسل مادران 79
5-3-1- 6 متغیرهای وارد شده شاخص‌های سلامت در رگرسیون گام‌به‌گام نسل دختران 80
5-3-1-7 متغیرهای خارج شده از رگرسیون گام به گام در مرحله آخر در نسل مادران 81
5-3-1-8 متغیرهای خارج شده از رگرسیون گام به گام در مرحله آخر در نسل دختران 81
5-3-2-1 نتایج رگرسیون چندگانه مدل نهایی در تبیین عادت غذایی برای نسل دختران 82
5-3-2-2 نتایج رگرسیون چند گانه مدل نهایی در تبیین عادت غذایی برای نسل مادران 83
6-1- نتایج آزمون فرضیه‌های تحقیق 87
فهرست شکل‌ها
شماره و عنوان صفحه
3-1- مدل مفهومی 33
3-2- مدل تجربی 33

فصل اول

کلیات
1-1- شرح و بیان مسئله
زمانی این یک اصل بدیهی تلقی می‌شد که فقرا لاغرند و فقط ثروتمندان استطاعت چاق شدن دارند، اما با روند رو به رشد چاقی به عنوان یک مسئله سلامتی، دیگر این حقیقت ندارد. این واقعیت در پدیده‌ای که بری پاپکین آن را به عنوان انتقال تغذیه نام نهاد، طرح می‌شود؛ انتقال تغذیه به طور کلی به تغییر جهانی به سمت رژیم غذایی با مقدار چربی بالا و غذاهای فرآوری شده و کم‌فیبر اشاره دارد که با سطح پایین فعالیت فیزیکی که منجر به افزایش امراض وابسته به انحطاط می‌شود، همراه است. (ویکس، 2008 : 155)
پاپکین (1999) معتقد است که تغییرات گسترده در رژیم غذایی، الگوی فعالیت بدنی و چاقی در نقاط شهری کشورهای کم‌درآمد نیز به وجود آمده است، (پاپکین، 1999: 1905) در این تغییرات، مواد غذایی جدید وارد برنامه غذایی شده و بعضی مواد غذایی عملا" از ترکیب مواد غذایی مصرفی حذف شده‌اند. این تغییر عمده دارای اثرات مثبت و منفی است که بسته به شرایط هر جامعه، متفاوت است. (کشاورز،1373: 39) انتقال تغذیه پدیده‌ای است که برخی محققان آن را پیرو انتقال جمعیتی می‌دانند که تغییرات اساسی در الگوی باروری و مرگ و میر ایجاد کرده‌است، بنابراین، تغییرات اقتصادی - اجتماعی و جمعیت شناسی با این تغییرات غذایی و تغییر در فعالیت بدنی و الگوهای ساختمان بدن مرتبط هستند. ( پاپکین، 1999 : 1905) یکی از نمودهای مشخص در انتقال تغذیه، تغییر در عادات غذایی است. عادت غذایی نشان دهنده درصد استفاده از ترکیب غذا برای مقاطع زمانی منظم است و از نظر جامعه شناسی، تکرار رفتار غذایی، عناصر الگوی غذایی را تشکیل می‌دهند. الگوی غذایی از عادات و یا تکرار رفتاری به دست می‌آید و از نظم مشخصی برخوردار است.
از نظر سعادت نوری، عادت غذایی شامل ترجیحات غذایی هستند که ما به‌طور مکرر گرایش به آن‌ها داریم و این ترجیحات با عوامل اجتماعی، فرهنگی، اقتصادی افراد هر جامعه رابطه دارد. (سعادت نوری، 1370: 16)
لی (2003) نیز در کتابی تحت عنوان دستیابی‌های تغذیه‌ای، چنین بیان کرده است که عادت تعیین کننده‌ی این است که چگونه یک فرد مقدار محدودی از غذاها را به طور مکرر مصرف می‌کند.
کیتلر و ساکر (2001) نیز در کتابی با عنوان غذا و فرهنگ، چنین بیان داشته‌اند که عادات غذایی اشاره به روش‌هایی دارند که طی آن، انسان از غذا استفاده می‌کند و شامل چگونگی به دست آمدن و نگهداری غذا، نحوه‌ی آماده کردن آن، چگونگی توزیع غذا و این‌که با چه کسانی و چگونه مصرف می‌شود.
دریایی (1387) در کتابی با عنوان الگوی صحیح تغذیه، تعریفی مشابه تعریف فوق ارائه می‌کند و چنین بیان می‌کند: « اصطلاح عادت غذایی اشاره به این دارد که چرا و چگونه مردم غذا می‌خورند، چه غذاهایی را و با چه کسانی می‌خورند. هم چنین راه‌های به دست آوردن، ذخیره کردن، استفاده کردن و دست کشیدن از غذا را شامل می‌شود. عوامل فردی، اجتماعی، فرهنگی، دینی، اقتصادی، محیطی و سیاسی، همگی بر عادت غذایی افراد تأثیرگذارند.» (دریایی، 1387: 54)

دانلود نمونه پژوهش علمی - تحقیق کامل

1-4-1- هدف اصلیارائه مدلی مبتنی بر سیستم‌های چند عامله برای داده‌کاوی در محیط‌های توزیع شده
سیستم داده کاوی توزیع شده چند عامله، حوزه تحقیقاتی جدیدی است که با تکنولوژی نوظهور هوش مصنوعی سازگار بوده، انعطاف پذیری و هوشمندی خاصی داشته، استفاده از منابع را بهبود بخشیده و پایداری سیستم را افزایش داده است. و لذا ارائه مدلی مبتنی بر سیستم‌های چند عامله برای داده‌کاوی در محیط‌های توزیع شده در دستور کار قرار گرفت. نتایج این تحقیق می‌تواند در عمل مورد استفاده قرار گرفته و به عنوان یک موضوع پژوهشی مورد توجه قرار گیرد.
1-4-2- اهداف فرعیبررسی قوانین انجمنی در چند مدل از داده کاوی
ارائه یک مدل مبتنی بر سیستم‌های چند عامله
ارزیابی مدل
1-5- پرسش‌های تحقیقپرسش‌های تحقیق به دنبال چگونگی دست‌یابی به اهداف تحقیق می‌باشند. لذا مانند اهداف تحقیق، پرسش‌های تحقیق را نیز به دو دسته تقسیم می‌کنیم: پرسش اصلی و پرسش‌های فرعی. که "پرسش اصلی" به دنبال جوابی در راستای دست‌یابی به هدف اصلی تحقیق می‌باشد و "پرسش‌های فرعی" نیز به دنبال چگونگی دست یافتن به اهداف فرعی تحقیق هستند.
پرسش‌های تحقیق حاضر عبارتند از:
1-5-1- پرسش اصلیاستفاده از عامل‌ها و سیستم‌های چندعامله در داده کاوی توزیع شده چه اثراتی ایجاد می‌کند؟
1-5-2- پرسش‌های فرعیچه روش‌هایی برای بهینه سازی الگوریتم‌های موجود، وجود دارد؟
عامل‌ها و سیستم‌های چندعامله در حوزه داده کاوی توزیع شده در چه کاربردهایی حائز اهمیت است؟
چه راه حل‌هایی را می‌توان برای رفع مشکلات موجود در این حوزه یافت؟
1-6- فرضیه‌هابا توجه به قابلیت‌های به اثبات رسیده‌ی عامل‌ها و سیستم‌های چندعامله در زمینه‌های مختلف، فرض ما این است که عامل‌ها و سیستم‌های چندعامله می‌توانند به عنوان ابزار مناسبی در تأثیر بهبود کارایی الگوریتم‌های داده کاوی در محیط توزیع شده به کار گرفته شوند.
1-7- روش تحقیقروش انجام تحقیق از طریق مطالعه الگوریتم‌ها و روش‌های مختلف موجود در راستای موضوع تحقیق می‌باشد. و نیز از طریق مقایسه با روش‌های مرتبط موجود انجام خواهد شد.
1-8- جنبه‌های نوآوریبا انجام این تحقیق می‌توان از تکنیک‌های داده کاوی در محیط‌های توزیع شده با سرعت و دقت بیشتری بهره برد.
1-9- مراحل انجام تحقیقمطالعه‌ی اولیه و ادبیات مسأله
شناسایی و بیان کامل مسأله
بررسی فعالیت‌های پیشین در راستای حل مسأله
بهره‌گیری از نقاط قوت روش‌های مختلف و دست‌یابی به مدلی کارآمدتر
حل مسأله و تحلیل آن
1-10- ساختار پایان‌نامهساختار این تحقیق شامل پنج فصل است.
فصل یک: مقدمه و کلیات تحقیق ارائه خواهد شد و به تعریف مسئله و ضرورت انجام تحقیق خواهیم پرداخت.
فصل دوم: به بیان ادبیات و تاریخچه‌ای از داده کاوی، داده کاوی توزیع شده، عامل‌ها و سیستم‌های چندعامله پرداخته، چندین تکنیک رایج در این حوزه را ذکر می‌کنیم و کاربردها و خصوصیات آن‌ها را شرح خواهیم داد.
فصل سوم: به بیان روش تحقیق، نحوه‌ی گردآوری داده‌ها و شیوه‌ی تجزیه و تحلیل اطلاعات خواهیم پرداخت.
فصل چهارم: در این فصل، به بیان یافتههای تحقیق در هر یک از مراحل اجرایی تحقیق خواهیم پرداخت و در نهایت مدلی بر پایه سیستم‌های چند عامله به منظور بهبود سرعت و دقت عملیات داده‌کاوی در محیط‌های توزیع شده ارائه خواهیم داد.
فصل پنجم: در این فصل، به پرسشهای تحقیق پاسخ داده خواهد شد و پیشنهادهایی برای کارهای آینده ارائه میشود.
فصل دوم ادبیات و پیشینه تحقیق2-1- مقدمهدر این فصل، به سه بخش اصلی با عناوین داده‌کاوی، عامل‌ها و سیستم‌های چند عامله، و کاربرد عامل‌ها در داده‌کاوی میپردازیم و در نهایت به بررسی کارهای انجام شده در این حوزه خواهیم پرداخت.
2-2- دادهکاویداده کاوی، یک تکنولوژی نوظهور است، که از ابزارها و تکنیک‌های مدل‌سازی و تجزیه و تحلیل آماری، الگوریتم‌های ریاضی، و متدهای یادگیری ماشین برای کشف الگوهای معتبر و ناشناخته در مجموعه داده‌های حجیم استفاده می‌کند. هرچند این تکنولوژی دوران نوباوگی خود را طی می‌کند، اما شرکت‌ها و سازمان‌های بسیاری از جمله خرده‌فروشی‌ها، بانک‌ها، مراکز درمانی، کارخانجات تولیدی، ارتباطات راه دور، و مؤسسات دولتی از ابزارها و تکنیک‌های داده‌کاوی برای تحلیل داده‌هایشان و کشف اطلاعات و دانش مفید از آن‌ها استفاده می‌کنند. ADDIN EN.CITE <EndNote><Cite><Author>Wang</Author><Year>2003</Year><RecNum>125</RecNum><DisplayText>[1, 2]</DisplayText><record><rec-number>125</rec-number><foreign-keys><key app="EN" db-id="sdppz00r3f0vfgep52hpezvosz5zr00zsfdv">125</key></foreign-keys><ref-type name="Book">6</ref-type><contributors><authors><author>Wang, J.</author></authors></contributors><titles><title>Data mining: opportunities and challenges</title></titles><dates><year>2003</year></dates><publisher>Irm Press</publisher><isbn>1931777837</isbn><urls></urls></record></Cite><Cite><Author>Rao</Author><Year>2010</Year><RecNum>105</RecNum><record><rec-number>105</rec-number><foreign-keys><key app="EN" db-id="sdppz00r3f0vfgep52hpezvosz5zr00zsfdv">105</key></foreign-keys><ref-type name="Journal Article">17</ref-type><contributors><authors><author>Rao, V.S.</author><author>Vidyavathi, S.</author></authors></contributors><titles><title>Distributed Data Mining and Mining Multi-Agent Data</title><secondary-title>IJCSE) International Journal on Computer Science and Engineering</secondary-title></titles><periodical><full-title>IJCSE) International Journal on Computer Science and Engineering</full-title></periodical><pages>1237-1244</pages><volume>2</volume><number>04</number><dates><year>2010</year></dates><urls></urls></record></Cite></EndNote>[1, 2] داده‌کاوی اطلاعاتی را از پایگاه داده‌ها استخراج می‌کند که از طریق کوئری‌ها و گزارش‌گیری‌ها قابل دست‌یابی نیستند.
رشد انفجاری داده‌های ذخیره شده در پایگاه داده‌ها، نیاز به تکنولوژی‌های جدید که بتوانند حجم عظیم داده‌ها را هوشمندانه به دانش مفید تبدیل کنند، را پدید آورده است. ADDIN EN.CITE <EndNote><Cite><Author>Chen</Author><Year>1996</Year><RecNum>106</RecNum><DisplayText>[3]</DisplayText><record><rec-number>106</rec-number><foreign-keys><key app="EN" db-id="sdppz00r3f0vfgep52hpezvosz5zr00zsfdv">106</key></foreign-keys><ref-type name="Journal Article">17</ref-type><contributors><authors><author>Chen, M.S.</author><author>Han, J.</author><author>Yu, P.S.</author></authors></contributors><titles><title>Data mining: an overview from a database perspective</title><secondary-title>Knowledge and Data Engineering, IEEE Transactions on</secondary-title></titles><periodical><full-title>Knowledge and Data Engineering, IEEE Transactions on</full-title></periodical><pages>866-883</pages><volume>8</volume><number>6</number><dates><year>1996</year></dates><isbn>1041-4347</isbn><urls></urls></record></Cite></EndNote>[3] دادهکاوی به معنای یافتن نیمه خودکار الگوهای پنهان در مجموعه دادههای موجود می‌باشد. ADDIN EN.CITE <EndNote><Cite><Author>Han</Author><Year>2005</Year><RecNum>1</RecNum><DisplayText>[4]</DisplayText><record><rec-number>1</rec-number><foreign-keys><key app="EN" db-id="sdppz00r3f0vfgep52hpezvosz5zr00zsfdv">1</key></foreign-keys><ref-type name="Journal Article">17</ref-type><contributors><authors><author>Han, J.</author><author>Kamber, M.</author></authors></contributors><titles><title>Data mining: Concepts and Techniques, 2nd Edition</title><secondary-title>San Francisco, CA, itd: Morgan Kaufmann</secondary-title></titles><periodical><full-title>San Francisco, CA, itd: Morgan Kaufmann</full-title></periodical><dates><year>2005</year></dates><urls></urls></record></Cite></EndNote>[4] این تکنولوژی با دیگر تکنیک‌های تحلیل داده، که سیستم، مقادیر اولیه را می‌گیرد و خود، الگوهایی را تولید می‌کند، متفاوت است. داده‌کاوی توسط ابزارهای الگوریتمیک، الگوها، تغییرات، آنومالی‌ها، قوانین، و ساختارهای مهم آماری، و رویدادها را از مجموعه داده‌های عظیم استخراج می‌کند. ADDIN EN.CITE <EndNote><Cite><Author>R. Grossman</Author><Year>1999</Year><RecNum>107</RecNum><DisplayText>[5]</DisplayText><record><rec-number>107</rec-number><foreign-keys><key app="EN" db-id="sdppz00r3f0vfgep52hpezvosz5zr00zsfdv">107</key></foreign-keys><ref-type name="Conference Paper">47</ref-type><contributors><authors><author>R. Grossman,</author><author>S. Kasif,</author><author>R. Moore,</author><author>D. Rocke,</author><author>J. Ullman</author></authors></contributors><titles><title>Data mining research: Opportunities and challenges</title><secondary-title>A Report of Three Workshops on Mining Large, Massive and Distributed Data</secondary-title></titles><dates><year>1999</year></dates><urls></urls></record></Cite></EndNote>[5] می‌توان گفت که داده کاوی در جهت کشف اطلاعات پنهان و روابط موجود در بین دادههای فعلی و پیشبینی موارد نامعلوم و یا مشاهده نشده عمل میکند. برای انجام عملیات کاوش لازم است قبلاً روی دادههای موجود پیش پردازش‌هایی انجام گیرد. عمل پیش پردازش اطلاعات خود از دو بخش کاهش اطلاعات، و خلاصهسازی و کلیسازی دادهها تشکیل شده است. کاهش اطلاعات عبارت است از تولید یک مجموعه کوچک‌تر، از دادههای اولیه، که تحت عملیات دادهکاوی نتایج تقریباً یکسانی با نتایج دادهکاوی روی اطلاعات اولیه به دست دهد. ADDIN EN.CITE <EndNote><Cite><Author>Han</Author><Year>2005</Year><RecNum>1</RecNum><DisplayText>[4]</DisplayText><record><rec-number>1</rec-number><foreign-keys><key app="EN" db-id="sdppz00r3f0vfgep52hpezvosz5zr00zsfdv">1</key></foreign-keys><ref-type name="Journal Article">17</ref-type><contributors><authors><author>Han, J.</author><author>Kamber, M.</author></authors></contributors><titles><title>Data mining: Concepts and Techniques, 2nd Edition</title><secondary-title>San Francisco, CA, itd: Morgan Kaufmann</secondary-title></titles><periodical><full-title>San Francisco, CA, itd: Morgan Kaufmann</full-title></periodical><dates><year>2005</year></dates><urls></urls></record></Cite></EndNote>[4] پس از انجام عمل کاهش اطلاعات و حذف خصایص غیر مرتبط نوبت به خلاصهسازی و کلیسازی دادهها می‌رسد. دادههای موجود در بانک‌های اطلاعاتی معمولاً حاوی اطلاعات در سطوح پایینی هستند، بنابراین خلاصهسازی مجموعه بزرگی از دادهها و ارائه آن به صورت یک مفهوم کلی اهمیت بسیار زیادی دارد. کلیسازی اطلاعات، فرآیندی است که تعداد زیادی از رکوردهای یک بانک اطلاعاتی را به صورت مفهومی در سطح بالاتر ارائه می‌نماید. تکنیک‌‌های دادهکاوی به چند دسته تقسیم میشوند که سه دسته اصلی عبارتند از خوشهبندی، طبقهبندی و کشف قواعد انجمنی. در ادامه هر یک از این روش‌ها را به طور کلی معرفی مینماییم.
2-2-1- خوشهبندی
فرآیند خوشهبندی سعی دارد که یک مجموعه داده را به چندین خوشه تقسیم نماید بطوریکه داده‌های قرار گرفته در یک خوشه با یکدیگر شبیه بوده و با دادههای خوشههای دیگر متفاوت باشند. در حال حاضر روش‌های متعددی برای خوشهبندی دادهها وجود دارد که بر اساس نوع دادهها، شکل خوشهها، فاصله دادهها و غیره عمل خوشهبندی را انجام میدهند. مهم‌ترین روش‌های خوشهبندی در زیر معرفی شدهاند:
2-2-1-1- روش‌های خوشه‌بندی مبتنی بر تقسیم‌بندیاین روش‌ها، دادههای موجود در یک مجموعه داده را به k خوشه تقسیم میکنند، بطوریکه هر خوشه دو خصوصیت زیر را داراست:
هر خوشه یا گروه حداقل شامل یک داده میباشد.
هر داده موجود در مجموعه داده دقیقاً به یک گروه یا خوشه تعلق دارد.
معیار اصلی در چنین مجموعه دادههایی میزان شباهت دادههای قرار گرفته در هر خوشه میباشد. در حالیکه داده‌های قرار گرفته در دو خوشه مختلف از نظر شباهت با یکدیگر فاصله زیادی دارند. مقدار k که به عنوان پارامتر استفاده میگردد، هم میتواند به صورت پویا تعیین گردد و هم اینکه قبل از شروع الگوریتم خوشهبندی مقدار آن مشخص گردد.
2-2-1-2- روش‌های سلسله مراتبی
روش‌های سلسله مراتبی به دو دسته کلی روش‌های پایین به بالا و روش‌های بالا به پایین تقسیم می‌گردند. روش‌های سلسله مراتبی پایین به بالا به این صورت عمل میکنند که در شروع هر کدام از دادهها را در یک خوشه جداگانه قرار میدهد و در طول اجرا سعی میکند تا خوشههایی نزدیک به یکدیگر را با هم ادغام نماید. این عمل ادغام تا زمانی که یا تنها یک خوشه داشته باشیم و یا اینکه شرط خاتمه برقرار گردد، ادامه مییابد. روش‌های بالا به پایین دقیقاً به طریق عکس عمل میکنند، به این طریق که ابتدا تمام دادهها را در یک خوشه قرار میدهد و در هر تکرار از الگوریتم، هر خوشه به خوشههای کوچک‌تر شکسته میشود و این کار تا زمانی ادامه مییابد که یا هر کدام از خوشهها تنها شامل یک داده باشند و یا شرط خاتمه الگوریتم برقرار گردد. شرط خاتمه معمولاً تعداد کلاستر یا خوشه میباشد.
2-2-1-3- روش‌های مبتنی بر چگالی
اکثر روش‌های خوشهبندی که به این روش عمل میکنند معمولاً از تابع فاصله به عنوان تابع معیار خود بهره میبرند. استفاده از چنین معیاری باعث میگردد که الگوریتم خوشهبندی تنها قادر به ایجاد خوشههایی با اشکال منظم باشد. در صورتیکه خوشههای واقعی در دادهها دارای اشکال غیر منظمی باشند، این الگوریتمها در خوشهبندی آن‌ها با مشکل مواجه میگردند. برای حل این‌گونه مشکلات یکسری از روش‌ها برای خوشهبندی پیشنهاد گردیدهاند که عمل خوشهبندی را بر مبنای چگالی دادهها انجام می‌دهند. ایده‌ی اصلی در این روش‌ها بر این اساس است که تا زمانی که دادههای قرار گرفته در همسایگی خوشه‌ها از حد معینی بیشتر باشند، آن‌ها رشد میکنند و بزرگ میشوند. چنین روش‌هایی قادرند خوشههایی با شکل‌های نامنظم نیز ایجاد نمایند.
البته دسته‌های دیگری از روش‌های خوشهبندی مانند روش‌های مبتنی بر گرید، روش‌های مبتنی بر مدل و غیره وجود دارند که میتوانید آن‌ها را در ADDIN EN.CITE <EndNote><Cite><Author>Han</Author><Year>2005</Year><RecNum>1</RecNum><DisplayText>[4]</DisplayText><record><rec-number>1</rec-number><foreign-keys><key app="EN" db-id="sdppz00r3f0vfgep52hpezvosz5zr00zsfdv">1</key></foreign-keys><ref-type name="Journal Article">17</ref-type><contributors><authors><author>Han, J.</author><author>Kamber, M.</author></authors></contributors><titles><title>Data mining: Concepts and Techniques, 2nd Edition</title><secondary-title>San Francisco, CA, itd: Morgan Kaufmann</secondary-title></titles><periodical><full-title>San Francisco, CA, itd: Morgan Kaufmann</full-title></periodical><dates><year>2005</year></dates><urls></urls></record></Cite></EndNote>[4] مطالعه نمایید.
2-2-2- طبقهبندیفرایند طبقهبندی در واقع نوعی یادگیری با ناظر میباشد که در طی دو مرحله انجام میگردد. در مرحله اول مجموعهای از دادهها که در آن هر داده شامل تعدادی خصوصیت دارای مقدار و یک خصوصیت بنام خصوصیت کلاس میباشد، برای ایجاد یک مدل داده بکار میروند که این مدل داده در واقع توصیف کننده مفهوم و خصوصیات آن مجموعه دادهها است. مرحله دوم فرآیند طبقهبندی، اعمال یا بکارگیری مدل ایجاد شده، بر روی داده‌هایی است که شامل تمام خصوصیات دادههایی که برای ایجاد مدل بکار گرفته شدهاند، میباشند، بجز خصوصیت کلاس، و هدف از عمل طبقهبندی نیز تخمین مقدار این خصوصیت میباشد.
الگوریتمها و روش‌های مختلفی برای طبقهبندی تاکنون پیشنهاد شدهاند که برای مثال میتوان از روش‌های طبقهبندی با استفاده از درخت تصمیم، طبقهبندی بیزین، SVM، طبقهبندی با استفاده از شبکه‌های عصبی، طبقهبندی مبتنی بر قواعد و غیره نام برد. ADDIN EN.CITE <EndNote><Cite><Author>Mitchell</Author><Year>1997</Year><RecNum>2</RecNum><DisplayText>[6]</DisplayText><record><rec-number>2</rec-number><foreign-keys><key app="EN" db-id="sdppz00r3f0vfgep52hpezvosz5zr00zsfdv">2</key></foreign-keys><ref-type name="Journal Article">17</ref-type><contributors><authors><author>Mitchell, T.M.</author></authors></contributors><titles><title>Machine learning. 1997</title><secondary-title>Burr Ridge, IL: McGraw Hill</secondary-title></titles><periodical><full-title>Burr Ridge, IL: McGraw Hill</full-title></periodical><dates><year>1997</year></dates><urls></urls></record></Cite></EndNote>[6] در اینجا ما قصد نداریم وارد مباحث مربوط به الگوریتمها و روش‌های طبقهبندی شویم و تنها روش طبقهبندی مبتنی بر قواعد را معرفی خواهیم نمود. در صورت نیاز به مطالعه بیشتر میتوانید به مرجع ADDIN EN.CITE <EndNote><Cite><Author>Han</Author><Year>2005</Year><RecNum>1</RecNum><DisplayText>[4]</DisplayText><record><rec-number>1</rec-number><foreign-keys><key app="EN" db-id="sdppz00r3f0vfgep52hpezvosz5zr00zsfdv">1</key></foreign-keys><ref-type name="Journal Article">17</ref-type><contributors><authors><author>Han, J.</author><author>Kamber, M.</author></authors></contributors><titles><title>Data mining: Concepts and Techniques, 2nd Edition</title><secondary-title>San Francisco, CA, itd: Morgan Kaufmann</secondary-title></titles><periodical><full-title>San Francisco, CA, itd: Morgan Kaufmann</full-title></periodical><dates><year>2005</year></dates><urls></urls></record></Cite></EndNote>[4] مراجعه نمایید.
2-2-2-1- طبقهبندی مبتنی بر قواعددر این قسمت قصد داریم نگاهی به بحث طبقهبندی مبتنی بر قواعد داشته باشیم. در این روش، مدل ایجاد شده از روی دادهها به صورت مجموعهای از قواعد میباشد. میتوان گفت که هر قاعده به صورت یک قاعده IF P THEN C میباشد که در آن P مجموعهای از شرایط بوده و C نیز مشخص کننده برچسب یک کلاس یا طبقه خاص میباشد. یک قاعده بدست آمده از مجموعه دادههای آموزشی با استفاده از دو معیار coverage و accuracy میتواند ارزیابی گردد. این دو معیار به صورت زیر تعریف میگردند:
(2-1)
(2-2)
که در تعاریف مذکور تعداد دادههایی در مجموعه داده D است که توسط قاعده پوشش داده میشوند. تعداد دادههایی است که توسط قاعده به درستی طبقهبندی شدهاند. |D| تعداد داده‌های موجود در D میباشد.
نکته مهمی که باید اینجا به آن اشاره کرد این بحث است که چگونه دادهها توسط این قواعد طبقه‌بندی میگردند. همان‌طور که اشاره گردید این قواعد دارای یک قسمت شرط (P) و یک قسمت C هستند. P یک الگو به صورت میباشد که هر کدام از piها بیان کننده‌ی یک محدودیت برای یکی از خصوصیات هستند. اگر خصوصیات دادهای محدودیتهای مذکور قاعدهای را برآورده سازد آنگاه کلاس یا طبقهبند آن داده، کلاس یا طبقهای است که آن قاعده بیان میکند(C). اما مسأله مهمی که اینجا پیش میآید، این است که اگر یک داده در قسمت شرط (P) بیش از یک قاعده صدق کند، آنگاه کدام قاعده را باید انتخاب کرد. بسته به استراتژیهای مختلف، این مشکل جواب‌های مختلفی می‌تواند داشته باشد. دو نمونه از مهم‌ترین استراتژیهایی که معمولاً برای حل این مشکل بکار میروند، استراتژی‌های مرتب‌سازی بر اساس اندازه و مرتب‌سازی بر اساس قاعده میباشند.
در استراتژی مرتب‌سازی بر اساس اندازه، چنانچه یک داده در بیش از یک قاعده صدق کند، قاعده‌ای برای طبقهبندی داده انتخاب میشود که خصوصیات بیشتری را برای مشخص نمودن کلاس داده تست کرده باشد. در استراتژی مرتب‌سازی بر اساس قاعده، پیش قواعد اولویت دهی میشوند و هنگام طبقهبندی، قاعده با اولویت بالاتر، مشخص کننده کلاس داده خواهد بود. اولویت‌دهی به قواعد هم به طرق مختلفی ممکن است انجام گردد. برای مثال ممکن است که ابتدا کلاس‌ها اولویتدهی شوند و قواعد مربوط به هر کلاس نیز با تأثیر پذیری از این اولویت‌دهی، اولویت بگیرند. اولویت کلاس‌ها نیز ممکن است بر اساس اهمیت کلاس یا تعداد دادههای متعلق به آن کلاس و یا غیره مشخص گردند. استراتژیهای دیگری نیز در این زمینه وجود دارند که ما در اینجا درباره آن‌ها صحبت نمیکنیم. مسأله دیگری که ممکن است پیش بیاید این است که یک داده با هیچ‌کدام از قواعد هم‌خوانی نداشته باشد. برای این مسأله هم میتوان راهحل‌هایی ارائه نمود. معمولترین راهحل این است که چنانچه دادهای با هیچ‌یک از قواعد هم‌خوانی نداشت، کلاسی به عنوان کلاس آن داده انتخاب گردد که بیشترین تعداد داده در بین دادهها به آن کلاس تعلق دارد.
مورد دیگری هم که اینجا قابل ذکر است این مطلب است که قواعدی که برای طبقهبندی استفاده میشوند، چگونه ایجاد میگردند. البته ما نمیخواهیم در اینجا وارد جزئیات مربوط به استخراج قواعد از دادههای آموزشی شویم. برای استخراج قواعد از مجموعه دادههای آموزشی معمولاً از دستهای از الگوریتم‌ها بنام الگوریتم‌های SCA استفاده میگردد که این الگوریتم‌ها در هر مرحله یک قاعده را از دادههای آموزشی یاد گرفته و دادههایی را که از آن قاعده پیروی میکنند را از مجموعه دادههای آموزشی خود حذف میکنند و با دادههای باقی‌مانده، کار خود را ادامه می‌دهند. از نمونه الگوریتم‌های معروف SCA میتوان به AQ، CN2 و RIPPER اشاره نمود. البته قابل ذکر است که برای کشف قواعد میتوان از روش‌های ایجاد درخت تصمیم و یا کشف قواعد انجمنی نیز استفاده نمود. در درخت تصمیم هر مسیر از ریشه تا یک برگ را میتوان به عنوان قسمت P قاعده در نظر گرفت و کلاسی که برگ مشخص میکند، قسمت C خواهد بود. در مورد نحوه استفاده از روش‌های کشف قواعد انجمنی و استفاده از آن‌ها برای طبقه‌‌بندی نیز میتوانید به ADDIN EN.CITE <EndNote><Cite><Author>Bing</Author><Year>1998</Year><RecNum>3</RecNum><DisplayText>[7, 8]</DisplayText><record><rec-number>3</rec-number><foreign-keys><key app="EN" db-id="sdppz00r3f0vfgep52hpezvosz5zr00zsfdv">3</key></foreign-keys><ref-type name="Conference Proceedings">10</ref-type><contributors><authors><author>Bing, Liu.</author><author>Wynne, Hsu.</author><author>Yiming, Ma.</author></authors></contributors><titles><title>Integrating classification and association rule mining</title><secondary-title>KDD</secondary-title></titles><pages>80-86</pages><dates><year>1998</year></dates><pub-location>New York City, New York, USA.</pub-location><urls></urls></record></Cite><Cite><Author>Bing</Author><Year>2000</Year><RecNum>4</RecNum><record><rec-number>4</rec-number><foreign-keys><key app="EN" db-id="sdppz00r3f0vfgep52hpezvosz5zr00zsfdv">4</key></foreign-keys><ref-type name="Journal Article">17</ref-type><contributors><authors><author>Bing, Liu.</author><author>Yiming, Ma.</author><author>Ching Kian, Wong.</author></authors></contributors><titles><title>Improving an association rule based classifier</title><secondary-title>Principles of Data Mining and Knowledge Discovery</secondary-title></titles><periodical><full-title>Principles of Data Mining and Knowledge Discovery</full-title></periodical><pages>293-317</pages><dates><year>2000</year></dates><urls></urls></record></Cite></EndNote>[7, 8] مراجعه کنید.
2-2-3- کشف قواعد انجمنیسازمان‌های کسب و کار، اغلب حجم عظیمی از داده‌ها را از عملیات روزانه جمع آوری می‌کنند. به عنوان مثال، حجم عظیمی از داده‌ها از خریدهای روزانه مشتریان در فروشگاه‌های خرده فروشی بدست می‌آید. استخراج قواعد انجمنی، نوعی از عملیات داده کاوی است که به تجزیه و تحلیل داده و جستجو برای یافتن ارتباط بین ویژگی‌ها از قبیل اینکه مشتریان کدام اقلام را هم‌زمان خریداری می‌کنند، می‌پردازد. نام دیگر روش کشف قواعد انجمنی، تحلیل سبد بازار می‌باشد. به عبارت دیگر، قواعد انجمنی، مطالعه ویژگی‌ها یا خصوصیاتی می‌باشد که با یکدیگر همراه بوده و به دنبال استخراج قواعد از میان این خصوصیات می‌باشد. این روش به دنبال استخراج قواعد به منظور کمی کردن ارتباط میان دو یا چند خصوصیت است. قواعد انجمنی به شکل اگر و آنگاه به همراه دو معیار پشتیبان و اطمینان تعریف می‌شوند.
در اینجا به مثال‌هایی از کاربرد قوانین انجمنی اشاره می‌شود:
بررسی ارتباط بین توانایی خواندن کودکان با خواندن داستان توسط والدین برای آن‌ها.
بررسی اینکه چه اقلامی در یک فروشگاه با یکدیگر خریداری می‌شوند و اینکه چه اقلامی هیچ‌گاه با یکدیگر خریداری نمی‌شوند.
تعیین سهم نمونه‌ها در بررسی تأثیرات خطرناک یک داروی جدید.
قواعد انجمنی، ماهیتا قواعد احتمالی هستند. به عبارت دیگر قاعده لزوماً قاعده را نتیجه نمی‌دهد، زیرا این قاعده ممکن است از شرط حداقل پشتیبان برخوردار نباشد. به طور مشابه قواعد و لزوماً قاعده را نتیجه نمی‌دهند زیرا قاعده اخیر ممکن است از شرط حداقل اطمینان برخوردار نباشد. ADDIN EN.CITE <EndNote><Cite><Author>Han</Author><Year>2005</Year><RecNum>1</RecNum><DisplayText>[4]</DisplayText><record><rec-number>1</rec-number><foreign-keys><key app="EN" db-id="sdppz00r3f0vfgep52hpezvosz5zr00zsfdv">1</key></foreign-keys><ref-type name="Journal Article">17</ref-type><contributors><authors><author>Han, J.</author><author>Kamber, M.</author></authors></contributors><titles><title>Data mining: Concepts and Techniques, 2nd Edition</title><secondary-title>San Francisco, CA, itd: Morgan Kaufmann</secondary-title></titles><periodical><full-title>San Francisco, CA, itd: Morgan Kaufmann</full-title></periodical><dates><year>2005</year></dates><urls></urls></record></Cite></EndNote>[4]
2-2-3-1- تعاریف و مفاهیم اصلی در قواعد انجمنیI = {I1, I2, …, Im} : مجموعه اقلام خریداری شده است.
T: هر زیرمجموعه‌ای از I می‌باشد که از آن به عنوان تراکنش یاد می‌شود.
D: مجموعه تراکنش‌های موجود در T است.
TID: شناسه منحصر به فرد و یکتایی است که به هر یک از تراکنش‌ها اختصاص می‌یابد.
نمای کلی یک قاعده انجمنی به شکل زیر می‌باشد:
[پشتیبان , اطمینان]

به طوری که داریم:
پشتیبان (X, Y): نشان دهنده‌ی درصد یا تعداد مجموعه تراکنش‌های D است که شامل هر دوی X و Y باشند.
اطمینان: میزان وابستگی یک کالای خاص را به دیگری بیان می‌کند و مطابق فرمول زیر محاسبه می‌شود:
(2-3) (X) پشتیبان / ()پشتیبان = (Y X,) اطمینان
این شاخص درجه‌ی وابستگی بین دو مجموعه X و Y را محاسبه می‌کند و به عنوان شاخصی برای اندازه‌گیری توان یک قاعده در نظر گرفته می‌شود. غالباً قاعده‌هایی انتخاب می‌شوند که عدد اطمینان بزرگی داشته باشند.
فرض کنید اطلاعات مشتریانی که محصول X را خریده‌اند، همچنین علاقه دارند در همان زمان از محصول Y نیز بخرند، در قاعده انجمنی زیر نشان داده شده است:
(پشتیبان = 20% و اطمینان = 60%)
شاخص‌های اطمینان و پشتیبان قواعد بیانگر جذابیت آن‌ها هستند. این دو شاخص به ترتیب مفید بودن و اطمینان از قواعد مکشوفه را نشان می‌دهند. پشتیبان 20% برای قاعده انجمنی فوق به این معنی است که 20% همه‌ی تراکنش‌های موجود نشان می‌دهند که کالای X و Y با هم خریداری شده‌اند. اطمینان 60% به این معنی است که60% مشتریانی که کالای X را خریده‌اند، کالای Y را نیز خریداری کرده‌اند.
اگر مجموعه‌ای از عناصر حداقل پشتیبانی لازم را داشته باشند مکرر خوانده می‌شوند. قواعد قوی، قواعدی هستند که به طور توأمان دارای مقدار پشتیبان و اطمینان بیش از مقدار آستانه باشند. با استفاده از این مفاهیم، پیدا کردن قواعد انجمنی در دو گام خلاصه می‌شود، یعنی پیدا کردن مجموعه‌های مکرر و استخراج قواعد قوی.
2-2-3-1-1- تقسیم بندی قواعد انجمنیبر اساس ارزش عناصر درون قواعد، می‌توان قواعد را به انواع دودویی و کمی تقسیم کرد، در مثال زیر، قاعده اولی دودویی و دومی، کمی است.
]60% = confidence ,2% Computer Financial management software [sup =
Buys (X, high resolution TV)
بر اساس ابعاد یک قاعده می‌توان آن را تک بعدی یا چند بعدی نامید. قاعده زیر، فقط بعد خرید را شامل می‌شود.
Buys (X, Computer) Buys (X, “Financial management software”)
اما قاعده‌ی زیر سه بعدی است، و ابعاد سن، درآمد و خرید را شامل می‌شود.
(X, high resolution TV) Buys ("k48.. k42" X,) and income ("39..30" X,) Age
از آنجایی که داده‌ها می‌توانند در سطوح و یا مقیاس‌های مختلف تعریف شوند، قواعد را می‌توان بر اساس این سطوح خلاصه نمود. مراتب خلاصه‌سازی و اینکه آیا قواعد در یک سطح هستند یا در چند سطح، می‌تواند مبنای تقسیم‌بندی باشد.
2-2-3-1-2- استخراج قواعد تک‌سطحی تک بعدی دودوییقبل از ارائه الگوریتم‌های استخراج قواعد، نمادها و قراردادهایی را به منظور درک بهتر این الگوریتم‌ها مطرح می‌کنیم.
اقلام مطابق با قاعده ترتیب حروف الفبا چیده می‌شوند، به عنوان مثال، اگر باشد، مطابق این قاعده، باید رابطه‌ی برقرار باشد.
در تمامی این الگوریتم‌ها مراحلی که طی می‌شوند به قرار زیر می‌باشند:
گام اول: در اولین گذر، پشتیبان هر یک از اجزا محاسبه شده، و اقلام مکرر (با بیشترین میزان فراوانی) با در نظر گرفتن آستانه حداقل پشتیبان انتخاب می‌شوند. (LK)
گام دوم: در هر گذر، اقلام مکرر که از فاز قبلی، محاسبه شده‌اند برای ایجاد اقلام کاندیدا به کار می‌روند. (CK)
گام سوم: پشتیبان هر یک از CK ها محاسبه شده، و بزرگ‌ترین آن‌ها انتخاب می‌شود. این کار تا زمانی که هیچ قلم بزرگ‌تری یافت نشود، ادامه می‌یابد.
در هر فاز پس از یافتن اقلام بزرگ (LK)، می‌توان قواعد مطلوب را به صورت زیر استخراج کرد:
برای تمامی اقلام مکرر L همه‌ی زیرمجموعه‌های غیرتهی آن را (s) در نظر می‌گیریم. برای تمامی این زیرمجموعه‌ها، یک قاعده به صورت زیر استخراج می‌کنیم:
"s (L – s)" این قاعده در صورتی برقرار می‌شود که اطمینان حاصل از آن بزرگ‌تر یا مساوی حداقل اطمینان در نظر گرفته شده توسط کاربر باشد، به بیان دیگر اگر رابطه‌ی زیر برقرار باشد، قاعده‌ی فوق پذیرفته می‌شود و در غیر این صورت این قاعده لغو می‌شود.
(2-4) حداقل اطمینان ( (s) پشتیبان / (L) پشتیبان)
پروسه استخراج قواعد انجمنی عبارت است از:
ابتدا همه‌ی اقلام مکرر را که بیشتر یا مساوی با آستانه‌ی پشتیبان هستند بیابید.
برای تمامی اقلام مکرر، همه‌ی زیر مجموعه‌های آن‌ها را استخراج کنید.
همه‌ی قواعد ممکن را استخراج کنید.
قواعدی را بپذیرید که از بیشتر و یا آستانه‌ی اطمینان برخوردار باشند.
در اینجا برای پیدا کردن این قواعد از الگوریتم ساده Apriori یا الگوریتم پیش‌نیاز استفاده می‌کنیم. فرض کنید که ابتدا باید تمام مجموعه‌های تک عضوی مکرر را پیدا کنید، سپس بر اساس آن مجموعه‌های دو عضوی مکرر را پیدا کنید و الی آخر. در هر مرحله باید کل فضا جستجو شود اما این الگوریتم از خصوصیت Apriori استفاده می‌کند به این صورت که "اگر مجموعه‌ای از عناصر مکرر باشد، تمام زیرمجموعه‌های غیر تهی آن نیز مکرر خواهند بود".
هر زیر مجموعه‌ی یک مجموعه مکرر، خود نیز مکرر است. این خصوصیت را این‌گونه نیز می‌توان توصیف کرد: اگر مجموعه I به تعداد مشخصی تکرار شده باشد و اگر ما A را به آن اضافه کنیم تعداد تکرار این مجموعه از مجموعه قبلی بیشتر نخواهد بود. پس اگر اولی مکرر نباشد دومی نیز مکرر نخواهد بود. این الگوریتم از این خصوصیت استفاده می‌کند و در اینجا عملکرد آن را شرح می‌دهیم: می‌دانیم که از یک زیرمجموعه 1-k عضوی یا همان Lk-1 برای به دست آوردن Lk یعنی مجموعه‌های k عضوی استفاده می‌شود. این کار در دو مرحله صورت می‌گیرد، ابتدا باید مجموعه‌ای از اعضا پیدا شود که با ترکیب LK-1 با آن‌ها Lk به دست آید. این مجموعه از عناصر را Ck نامیده و مرحله به دست آوردن آن‌ها را پیوست می‌نامیم. مرحله بعد اضافه کردن این عناصر به مجموعه‌های قبلی است که آن را مرحله هرس می‌نامیم. در زیر این دو مرحله شرح داده می‌شوند.
2-2-3-1-2-1- مرحله پیوستابتدا باید مطمئن شویم که عناصر بر مبنای ترتیب حروف الفبا مرتب شده‌اند. دو مجموعه از Lk-1 با یکدیگر قابل پیوست هستند اگر 2-k عنصر اول آن‌ها با یکدیگر برابر باشند. یعنی: توجه کنید که دو عنصر آخر مرتب شده‌اند و از وجود عناصر تکراری جلوگیری می‌کنند. با اجتماع دو مجموعه قابل پیوست، آن دو مجموعه ترکیب می‌شوند.

متن کامل در سایت امید فایل 

با این روش، مجموعه ترکیب شده حاصل k عضو خواهد داشت که البته عنصر آخر (از نظر ترتیبی) از مجموعه دوم خواهد بود. در مثال زیر دو مجموعه (4، 2، 1) و (3، 2، 1) را در نظر بگیرید: مجموعه اول و دوم مرتب هستند و داریم: 4>3>2>1 پس می‌توان مجموعه ترکیب شده زیر را به دست آورد.