یادگیری ماشین

نام درس یادگیری ماشین
کد درس 8101501
تعداد واحد 3
نوع درس اجباری - هوش مصنوعی و روباتیک
مقطع درس کارشناسی ارشد
دروس هم نیاز فرایندهای اتفاقی
دروس پیش نیاز
مطالب پیش نیاز
کتاب (کتب) مرجع
  1. Paul W. Glimcher, Colin F. Camerer, Ernst Fehr, Russell A. Poldrack (editors) (2009) Neuroeconomics: Decision making and the brain, Elsevier
  2. Szepesv C. (2010) Algorithms for Reinforcement Learning. Morgan & Claypool Publishers, 2010
  3. Sutton, R. S. and Barto, A. G. (1998). Reinforcement Learning: An Introduction. Bradford Book. MIT Press.
  4. Olson M., Hergenhahn B.R. (2000), Introduction to the Theories of Learning (8th edition),  Prentice-Hall
  5. Some state of the art papers on learning in SMDP, POMDP, and continuous environments
مدرس دکترنیلی
اهداف درس

هدف این درس ارائه اصول و مبانی ریاضی و محاسباتی برای یادگیری تصمیم بهینه است. تصمیم بهینه تصمیمی است که حداکثر سود را از منظر عامل یادگیر برای او داشته باشد. محیط­های یادگیری مورد بحث اشکال مختلف از محیط­های غیر قطعی، مشاهده پذیر کامل و مشاهده پذیر جزیی است. مدلسازی مسئله یادگیری به گونه­ای انجام می­گردد که در حالت کلی یادگیری با سرپرست و تقویتی را شامل گردد. اما با توجه به وجود روش­های متنوع و کارآمد برای یادگیری با سرپرستی، تکیه اصلی بر روی روش­های یادگیری تقویتی خواهد بود.

نتایج درس

کسب مهارتهای مدلسازی و تحلیل یادگیری در تعامل فعال با محیط و توسعه سیستم­های یادگیر

مباحث
  1. مروری بر تئوری­های یادگیری
  2. مدلسازی و الگوریتم­های یادگیری در محیط تک حالته
  3. مدل­های مارکوف برای محیط­های گسسته
  4. بهینه­سازی تصمیم در محیط­های مارکوف مشاهده پذیر کامل (برنامه­ریزی پویا)
  5. یادگیری تقویتی در محیط­های مارکوف مشاهده پذیر کامل
  6. یادگیری تقویتی در محیط­های شبهِ مارکوف
  7. یادگیری تقویتی در محیط­های مارکوفِ مشاهده پذیر جزیی
  8. یادگیری تقویتی در محیط­های پیوسته
  9. مدلسازی مشاهده و تصميم­گیری در نایقینی
  10. کاربرد یادگیری در مدلسازی تصميم­گیری در موجودات زنده  
استفاده از کامپیوتر
تکالیف
پروژه ها
نمره دهی
سایر مراجع
تنظیم کننده دکترنیلی
تاریخ تنظیم