کارشناسی ارشددانلود - دانلود پایان نامه فارسی

متن کامل پایان نامه را در سایت منبع fuka.ir می توانید ببینید

اکثر کلاسه بندی های مدرن الگو، نظیر شبکه های عصبی پرسپترون چند لایه و ماشین بردارهای پشتیبان در فاز آموزش عموماً نیاز به صرف بازه های زمانی طولانی داشته و همچنین بار محاسباتی سنگینی به سیستم تحمیل می کنند. امروزه در بسیاری از موارد، بخصوص در سیستم های امنیتی مدرن فرودگاه ها، ترمینالها و غیره، رویکردهای مبتنی بر تشخیص و بازشناسی به هنگام چهره، به شکل فزاینده ای رو به گسترش می باشد. بنابراین نیاز به طبقه بندی های سریع و دقیق با بار محاسباتی و الگوریتمی پایین برای چنین کاربردهایی اجتناب ناپذیر می باشد. بعلاوه در چنین سیستم هایی علاوه بر اینکه یادگیری اولیه بر روی دسته ای از داده ها به صورت یکجا انجام می شود، نیاز به نوعی یادگیری افزایشی نیز وجوددارد تا علاوه بر یادگیری فضای نمونه های اولیه، تغییرات و پویاییهای فضای نمونه ها نیز، برای کلاسه بند، قابل یادگیری بوده و قابلیت رشد و ارتقاء آموزش برای سیستم فراهم می باشد. برای مثال یک سیستم بازشناسی چهره در یک فرودگاه بین المللی را در نظر بگیرید که در ابتدا برای تشخیص هویت یک سری از افراد خاص با سابقه جرایم تروریستی، آموزش دیده است. آنچه واضح است با گذشت زمان مشخصه های چهره افراد ثابت نمانده و همچنین بازشناسی چهره مجرمین جدید نیز اجتناب ناپذیر می نماید. به دلایل ذکر شده، سیستم بازشناسی بایستی بدون فراموش کردن نمونه هایی که قبلاً دیده است، قابلیت به روزرسانی یادگیری و بازشناسی چهره های جدید را نیز داشته باشد.
در این پایان نامه سعی شده با بررسی مزایای ذاتی نوع خاصی از شبکه های عصبی مصنوعی مبتنی بر الگوریتم رزونانس تطبیقی و استفاده از آنها بعنوان کلاسه بند در بازشناسی چهره، چالشهای مذکور تا حدی مرتفع شود. همچنین با استفاده از الگوریتم های تکاملی نظیر الگوریتم ژنتیک و شبکه های مذکور، روشی کارا جهت انتخاب ویژگیهای مؤثر چهره در بازشناسی، پیشنهاد شده است.
اهداف کلی این پروسه تحقیقاتی به شرح ذیل می باشد:
استفاده از شبکه های عصبی مصنوعی مبتنی بر الگوریتم رزونانس تطبیقی در بازشناسی چهره با توجه به مزایای ذاتی این نوع شبکه هااصلاح یک سری چالشهای خاص در حیطه بازشناسی چهره با استفاده از این ویژگیها
مقایسه کارایی شبکه های مذکور با شبکه های عصبی پرسپترون چند لایه در بازشناسی چهره.
ارائه روشی جدید برای انتخاب ویژگیهای مؤثر در بازشناسی چهره با استفاده از شبکه های عصبی مبتنی بر الگوریتم رزونانس تطبیقی و الگوریتم ژنتیک
ارائه پیشنهاداتی برای ادامه کار با توجه به پتانسیل ها و دینامیک های ذاتی این نوع شبکه ها.
پایان نامه حاضر دارای چهار فصل می باشد. در فصل اول کلیاتی از روشهای بازشناسی چهره بیان شده و در ادامه به بحث راجع به یک سری چالشها در کلاسه بندی‌های پرکاربرد در حیطه بازشناسی چهره پرداخته شده است. در ادامه با بیان مختصر و اجمالی تعدادی از خصوصیات ذاتی شبکه های عصبی مبتنی بر الگوریتم رزونانس تطبیقی، مزایای احتمالی آنها در رفع چالشهای موجود بیان شده است. در فصل دوم، تاریخچه، الگوریتم، پیکربندی و انواع مختلف شبکه های عصبی مبتنی بر الگوریتم رزونانس تطبیقی به تفصیل بیان شده است. همچنین به یک سری از کاربردهای پیشین این شبکه ها به صورت خلاصه و تیتروار اشاره شده است. فصل سوم اختصاص به نتایج آزمایشات و شبیه سازیهای انجام شده دارد. آزمایشها در سه دسته مجزا انجام شده اند. در فصل چهارم که فصل نهایی می باشد،‌کلیه مطالب بیان شده جمع بندی شده و پیشنهاداتی جهت ادامه روند پژوهشی دراین زمینه ارائه شده است.

فصـل اول
کلیات
1-1- مقدمهدر این بخش پس از طرح کلیاتی از مسئله بازشناسی چهره، با تمرکز بر مسئله طبقه بندها به بیان برخی چالشهای موجود در این زمینه پرداخته شده است. در ادامه با برشمردن یک سری مزایای ذاتی شبکه های عصبی مبتنی بر الگوریتم رزونانس تطبیقی، ایده کاربرد آنها در بازشناسی چهره، جهت رفع نقایص موجود مطرح و در انتها جمع بندی مطالب فصل ارائه شده است.
1-2- بازشناسی چهره
بازشناسی چهره در یک جمله بدین صورت تعریف می شود: اخذ تصویر چهره و شناسایی آن با توجه به نمونه‌هایی که قبلاً به سیستم آموزش داده شده است. تحقیقات در زمینه بازشناسی چهره دارای قدمتی در حدود نیم قرن می باشد. هر ساله تعداد مقالات علمی که در این زمینه منتشر می شود، افزایش یافته و هر یک سعی در ارائه روشی بادرصد صحت کلاسه بندی بالاتر دارند. از آنجا که این موضوع با رشته های علمی فراوانی ارتباط دارد، محققین با دیدگاهها و انگیزه های گوناگون، از جمله روانشناسان، متخصصان در زمینه‌های بازشناسی الگو، شبکه های عصبی، بینایی ماشین و ... به آن علاقه فراوان نشان می دهند.
مطالعات ابتدایی دراین زمینه مربوط به کارهای روانشناسان دردهه 1950 میلادی است. تحقیقات فنی و مهندسی در این باب یک دهه بعد، آغاز شد. اما ایده بازشناسی خودکار چهره توسط ماشین در دهه 1970 میلادی توسط کاناده و کلی مطرح گردید [53]. در سالهای نخست تحقیقات صورت گرفته با استفاده از تصاویر دوبعدی بوده است. اخیراً با پیشرفت تکنولوژی امکان تصویربرداری سه بعدی نیز فراهم شده و زمینه تحقیقات گسترده ای را گشوده شده است.
به طور کلی روشهای بازشناسی چهره را می توان به سه دسته تقسیم نمود:
الف) روشهای مبتنی بر ویژگیهای محلی
در این روشها عناصر محلی مانندچشم، دهان، بینی و ... استخراج شده، خواص هندسی و موقعیت آنها نسبت به یکدیگر به عنوان ویژگی به سیستم شناسایی اعمال می شود [54].
ب) روشهای کل نگر
در این دست از متدها از اطلاعات کل تصویر چهره استفاده می شود. برای استخراج ویژگیهای تفکیک کننده چهره افراد مختلف، تکنیکهای آماری به کار برده می شوند. برخی از معروفترین و کارآمدترین این روشها به قرار ذیل می باشند:
روش آنالیز مولفه های اساسی [56 و 55]
روش آنالیز مؤلفه های مستقل [57 و 55]
روش آنالیز تفکیک کننده خطی [58 و 55]
ج) روش‌های هیبرید
این روشها بیشترین شباهت را به سیستم ادراک انسانی داشته و به شکل ترکیبی از دو روش پیشین می باشند. نتایج تحقیقات عملکرد بهتر این روش نسبت به دو روش قبل را نشان داده است [59].
از آنجا که در این پایان نامه از روش آنالیز مؤلفه های اساسی، استفاده شده، درادامه با تفصیل بیشتری مورد بررسی قرار گرفته است.
1-2-1- تعبیر ومفهوم بردارچهره [60]
تصویر دو بعدی چهره را می توان به صورت یک بردار یک بعدی در نظر گرفت. اگر عرض وطول تصویر به صورت h و w در نظر گرفته شود، این بردار دارای h×w مولفه خواهد بود. چگونگی انجام این کار در شکل 1-1 نشان داده شده است.

متن کامل در سایت امید فایل 

شکل 1-1-روش برداری سازی تصویر [Rom 1999]1-2-2- مفهوم فضای چهره‌بردار چهره معرفی شده در 1-2-1 را می توان به صورت یک نقطه در فضای h ×w بعدی در نظر گرفت که این فضا ، فضای تصویر نامیده می شود. از آنجایی که ساختار چهره ها به لحاظ کلی شبیه به یکدیگر می باشند، تمامی چهره ها منحصر به ناحیه ای محدود در این فضای خواهند شد. بنابراین فضای مذکور، یک فضای بهینه جهت توصیف افتراق چهره ها نمی باشد. در این جا هدف ایجاد یک فضای جدید به صورتی است که بتواند با ابعاد کمتر و به صورت موثرتر این کار را انجام دهد (فضای چهره). تفاوت روش های مختلف مبتنی بر ظاهر، در چگونگی ایجاد فضای چهره می باشد. در PCA ، بردارهای پایه در فضای چهره باید طوری انتخاب شوند که در صورت تصویر شدن نمونه ها بر بردارهای پایه، تفاوت نمونه ها بیشینه گردد.این بردارهای پایه در فضای چهره، مولفه‌های اساسی نامیده می شوند. در شکل 1-2 یک نمونه از فضای دو بعدی به همراه مولفه های اساسی آن نشان داده شده است.

شکل 1-2 یک فضای دو بعدی به همراه دو مولفه اساسی مجموعه نمونه ها. P1 و P2 دو بردار مولفه اساسی می باشند. [Rom 1999]1-2-3- صورت های ویژه
در صورت وجود مجموعه ای از چهره ها، اگر مولفه های اساسی این مجموعه را به دست آوریم، از آنجا که ابعاد این مولفه ها با تصویر اصلی یکسان می باشد، به فرم تصویری، قابل نمایش می باشند. لذا به هر کدام از این مولفه ها یک صورت ویژه گفته می شود. در شکل 1-3 تعدادی از این صورت های ویژه، مربوط به مجموعه چهره های پایگاه داده ORL ،‌ نمایش داده شده است.

شکل 1-3- برخی از صورت های ویژه پایگاه داده ORLدر صورت تصویر کردن هر یک از نمونه های چهره بر صورت های ویژه،‌ تعدادی ضریب بدست می آید. این ضرایب، بردار خصوصیت آن چهره را می سازد (شکل 1-4).

شکل 1-4- باز نمایی چهره توسط چهره های ویژه و مجموعه ضرایب(بردار ویژگی چهره). [Rom 1999]1-2-4- مولفه های اساسی یک مجموعه
از آنجا که در فضای تصویر، هر پیکسل به پیکسل های دیگر بستگی شدید دارد،فضای تصویر به شدت دچار افزونگی است. (رابطه 1-1)
(1-1)
در رابطه 1-1، بیانگر کواریانس میان پیکسل iام و jام می باشد. لذا ساختن یک فضای جدید به صورتی که مولفه های آن از همدیگر مستقل باشند، اجتناب ناپذیر مینماید. بدین شکل که باید ماتریس کواریانس رابطه 2-1 قطری شود. این بدان مفهوم است که شباهت هر مولفه (پایه فضای جدید) با خودش بیشینه و با مولفه های دیگر صفر گردد.با محاسبه بردارهای ویژه متناظر با ماتریس کواریانس ، این مقصود حاصل می شود. بردارهای ویژه از طریق روش های جبری قابل محاسبه می باشند.
(1-2)
در رابطه 1-2، C ماتریس کواریانس، بردارهای ویژه و مقادیر ویژه متناظر با C می باشند.
1-2-5 روند کلی بازشناسی چهره با استفاده از مولفه های اساسی
منظور از اعمال PCA کاهش ابعاد فضای ویژگی است. با مولفه های اساسی بدست آمده از اعمال PCA بر روی یک مجموعه داده، فضای جدیدی ایجاد می شود که دارای ابعادی برابر با ابعادفضای اولیه است. خاصیت PCA این است که بردارهای فضای جدید را در راستای بیشترین اختلاف، انتخاب می کند. بنابراین چنانچه تنها تعدادی از مولفه های اساسی که متناظر با بزرگترین مقادیر ویژه هستند، برای نمایش فضای جدید استفاده شوند، می توانیم تا حد زیادی مطمئن باشیم که اطلاعات تفکیک پذیری نمونه ها حفظ شده است. چنانچه بخواهیم یک روند کلی را جهت بازشناسی چهره با استفاده از مولفه های اساسی بیان نماییم، به صورت ذیل خواهد بود:
تبدیل n نمونه آموزشی w.h بعدی به یک ماتریس بعدی.
محاسبه ماتریس کواریانس X.
(1-3)
محاسبه بردارهای ویژه و مقادیر ویژه ماتریس کواریانس.
(1-4)
(1-5)
چیدمان بردارهای ویژه بر اساس مقادیر ویژه A، به صورت نزولی و انتخاب چند بردار اول به عنوان مولفه های پایه فضای جدید.
تصویر کردن نمونه های آموزشی و آزمایشی بر روی پایه های فضای جدید و در نظر گرفتن ضرایب آنها به عنوان بردار ویژگی نمونه ها .
انتخاب یک معیار مناسب جهت یافتن نزدیک ترین نمونه آموزشی به هر نمونه آزمایشی دیگر در فضای جدید.
1-3- بررسی برخی چالشهای موجودتلاش اکثر محققین در زمینه بازشناسی چهره بر ارائه روشهای جدید، جهت افزایش نرخ بازشناسی در آزمایشات، استوار بوده است. امروزه با پیشرفت تکنولوژی و از جمله در سیستم های تشخیص هویت، موضوع بازشناسی چهره به یک امر امنیتی تبدیل شده و جایگاه خود را بین سیستم های امنیتی به هنگام، باز کرده است.
همگام با افزایش کاربردهای به هنگام بازشناسی چهره، معیارهای برتری و تفوق روشهای مختلف بازشناسی بر یکدیگر نیز دچار تغییر و تحول شده است. یک سیستم بازشناسی به هنگام موفق، صرفاً به سیستمی با بالاترین نرخ بازشناسی اطلاق نمی شود. معیارهایی نظیر زمان آموزش، قابلیت تعقیب پویایی های فضای ویژگی، وجود قابلیت رشد در سیستم یادگیرنده، عدم حساسیت بالای کارایی سیستم به تنظیم دقیق پارامترهای آن و به عبارت بهتر راحتی استفاده بهینه از سیستم توسط کاربر از جمله مواردی هستند که علاوه بر نرخ بازشناسی بالا باید مورد توجه قرار گیرند.
همانطور که می دانیم روال بازشناسی چهره به طور کلی از سه بخش اساسی تشکیل شده است که عبارتند از: اخذ تصاویر چهره، استخراج ویژگیهای تصویر چهره و طبقه بندی یا کلاسه بندی چهره ها با استفاده از ویژگیهای آنها. تمرکز ما در این پایان نامه بیشتر بر موضوع طبقه بندها بوده و سعی شده چالشهای بیان شده در این حیطه مرتفع شوند. ذیلاً به تفصیل راجع به این چالشها بحث شده است.
1-3-1- زمان آموزش
اکثر کلاسه بندی های پرکابرد مانند شبکه های عصبی پرسپترون چند لایه و ماشین بردارهای پشتیبان جهت یادگیری کامل فضای ویژگیها و رسیدن به عملکرد بهینه خود، نیازمند صرف زمانهای طولانی و تحمیل بار محاسباتی و الگوریتمی سنگین بر سیستم می‌باشند. شبکه های عصبی پرسپترون چند لایه جهت رسیدن به پایین ترین خطا در خروجی نیازمند تعداد تکرارهای زیاد در فاز آموزش می باشند. در صورتی که در کاربردهای به هنگام به طبقه بندی های سریع و دقیقی نیاز داریم که با تعداد تکرارهای محدود و در کمترین زمان ممکن به عملکرد مطلوب خود برسند.
1-3-2- پیکربندی ثابت و غیر قابل تغییر در اکثر طبقه بندهادر بیشتر طبقه بندها وقتی پارامترهای مربوطه تنظیم شده و فاز آموزش طی شده باشد، کلاسه بند به یک حالت ایستا رسیده و چنانچه تغییرات جدیدی در فضای ویژگیها رخ دهد و یا اینکه تعدادنمونه ها بیشتر شوند و یا حتی کلاس جدیدی اضافه شود، سیستم برای انطباق و یادگیری فضای جدید باید مجدداً به صورت کامل آموزش دیده و پارامترهای بهینه طبقه بند تغییر کند. در صورتی که در بسیاری از کاربردهای به هنگام، علاوه بر یادگیری اولیه روی داده های آموزش، نیاز به نوعی قابلیت با عنوان یادگیری افزایشی وجوددارد. این بدان جهت است که سیستم بتواند داده های جدید و پویاییهای فضای ویژگی را که به مرور زمان واقع می‌شوند، بدون فراموش کردن هر گونه اطلاعاتی راجع به یادگیری‌های اولیه خود، به خوبی فرا گرفته و نیاز به بازآموزی و تنظیم مجدد پارامترهای آن وجود نداشته باشد.
1-3-3- دشواری تنظیم پارامترهای ذاتی در کلاسه بندی های متداول‌معمولاً تنظیم پارامترها برای رسیدن به عملکرد بهینه سیستم در اکثر طبقه بندها، امر نسبتاً دشواری است. این دشواری از آن روست که عملکرد و خروجی طبقه بند به شدت وابسته به تنظیم دقیق این پارامترها می باشد. به عنوان مثال برای این پارامترها در شبکه های عصبی پرسپترون چند لایه، می توان به تعداد لایه ها و سایز هر لایه اشاره کرد. این دشواری در این مورد از آنجا ناشی می شود که مقادیر مجاز پارامترها در محدوده وسیعی قابل تغییر بوده و تنها در بازه ای کوچک یا دقیقاً در مقدار مشخصی عملکرد بهینه را در پی دارد. با این تفاسیر طراحی طبقه بندها و یافتن پارامترهای بهینه آنها مستلزم صرف وقت و آزمایشهای متنوع و فراوان می باشد.
1-3-4- افزایش پیچیدگی شبکه با افزایش تعداد نمونه های آموزش‌در شبکه های عصبی پرسپترون چند لایه یکی از پارامترهای طبقه بند، سایز یا تعداد گره‌های هر لایه از شبکه می‌باشد. اکثر مسایل طبقه بندی با استفاده از یک شبکه عصبی پرسپترون سه لایه (تک لایه مخفی) قابل حل هستند. اما سایز لایه مخفی شبکه که عملکرد بهینه را تضمین می کند به تعداد نمونه هایی که برای آموزش اختصاص می یابند بستگی شدید دارد. به عبارت دیگر باافزایش تعداد نمونه های آموزش برای هر کلاس، شبکه نیاز به تعداد بیشتری از گره های مخفی جهت تقریب زدن صحیح فضای ویژگی، پیدا می کند. این بدان علت است که با افزایش تعداد نمونه های آموزش، فضای ویژگی دقیق تر شده و پیچیدگی های ذاتی آن دقیق تر نمود پیدا می کند.
افزایش تعدادگره های لایه میانی بر اثر افزایش نمونه های آموزش، به معنی افزایش حجم شبکه و تحمیل بار محاسباتی بیشتری بر سیستم می‌باشد. علاوه بر این زمان آموزش نیز به شکل فزاینده ای افزایش می یابد.
در سیستم های به هنگام، از این جهت که مرتباً نمونه های جدید، دیده شده و یادگیری افزایشی هم وجود دارد، به علت محدود بودن حافظه سیستم، افزایش حجم و توسعه پیکربندی شبکه نباید روند افزایشی شدیدی داشته باشد.
1-4- استفاده از شبکه های عصبی مبتنی بر الگوریتم رزونانس تطبیقی به عنوان راهکار پیشنهادیمواردی که به آنها اشاره شد، برخی ازچالشهایی بود که با به هنگام شدن سیستم های بازشناسی چهره در سالیان اخیر، نمود بیشتری یافته و تلاش جهت رفع آنها اجتناب ناپذیر می نماید. در این پایان نامه با استفاده از دسته ای خاص از شبکه های عصبی که مبتنی بر الگوریتم رزونانس تطبیقی می باشند و استفاده از آنها به عنوان کلاسه بند در بازشناسی چهره، سعی شده نقایص مذکور رفع شده یا بهبود یابند.
ویژگیهای ذاتی این نوع شبکه ها که از این به بعد از آنها با عنوان اختصاری ART و یا ARTMAP، نام برده می شود، به شرح ذیل می باشند.
یادگیری بر اساس تطابق نمونه های جدید با نمونه های دیده شده
در اکثر طبقه بندها الگوریتم آموزش بر اساس نوعی اصلاح خطا در خروجی بوده و الگوریتم سعی در کم کردن فاصله بین خروجی مطلوب و خروجی واقعی شبکه دارد. به علت خصوصیات ذاتی در این نوع الگوریتم ها از مشتقات و ماتریسهای گرادیان و... استفاده شده که بار محاسباتی و الگوریتمی سنگینی به شبکه تحمیل می کند. اما در شبکه های ART و ARTMAP الگوریتم آموزش بر اساس تطابق نمونه هاست و نه اصلاح خطای ایجاد شده. این امر باعث می شود با تعریف یک سری قوانین و معیارهای ساده آموزش برای اندازه گیری این تطابق،‌شبکه فاز اموزش را به سرعت طی کرده و بار محاسباتی و الگوریتمی تحمیل شده بر سیستم کاهش یابد.
تعریف لایه ای از گره ها در شبکه به عنوان خوشه به همراه یادگیری افزایشی
این خاصیت باعث شده که شبکه بدون فراموش کردن نمونه های قبلی قابلیت یادگیری نمونه های جدید را نیز داشته باشد. علاوه بر این تعریف گره ها به عنوان خوشه باعث شده که یادگیری در این شبکه ها، کیفی باشد بدین معنا که با تغییر در اندازه خوشه ها، نمونه های جدید به خوبی فرا گرفته شده و افزایش تعداد نمونه ها، بندرت منجر به حجیم شدن شبکه می شود.
وجود پارامترهای ذاتی با بازه تغییرات مجاز محدود و عملکرد بهینه شبکه در اکثر نقاط بازه
تعیین تعداد گره های بهینه توسط شبکه به صورت خودکار
این خاصیت از پویاییهای ذاتی شبکه های ART و ARTMAP محسوب شده و نه تنها طراحی شبکه را بسیار آسان کرده، بلکه قابلیت استفاده از آن را در کاربردهای به هنگام نیز، فراهم ساخته است. به دلیل وجوداین ویژگی ذاتی، پیکربندی شبکه های مذکور به شدت انعطاف پذیر می باشد.

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *