مقاله ای کامل درباره یادگیری تقویتی

عنوان مقاله

فهرست/چکیده

بخشی از متن:

حیوانات، انسان ها، اتومات ها و .. از خود رفتار های مختلفی در محیطی که آن ها را احاطه کرده، در شرایط مختلف، از خود نشان می دهند. آن ها کارهای مختلفی را به عنوان باز خورد در جواب ورودی هایی که از محیط می گیرند انجام می دهند. بعضی از این عامل ها رفتار های خود را در طول زمان عوض می کنند. آن ها ممکن است با دادن ورودی های یکسان، عمل های متفاوتی نسبت به حرکت های قبلی خود انجام دهند. چنین عاملی یاد می گیرد. شاخه یادگیری ماشین به مطالعه الگوریتم های یادگیری که مشخص می کند تغییر در ورودی ها چگونه در رفتار عامل تغییر ایجاد می کند می پردازد. الگوریتم های یادگیری به ۳ دسته تقسیم می شوند: …

فهرست مقاله یادگیری تقویتی:

معرفی یادگیری تقویتی

برنامه نویسی پویا

اجزا یک سیستم یادگیری تقویتی

محیط

تابع پاداش

تابع مقدار

Q-Learning

معرفی

الگوریتم یادگیری

مثالی از یک عامل

مثالی از برج هانوی

اثبات همگرایی

یادگیری Q برای MDP غیرقطعی

روش های مونت کارلو در یادگیری تقویتی

ویژگیها

سیاست first visit MC

کنترل مونت کارلو

همگرایی مونت کارلو

on line policy و off linepolicy

منابع

======

خرید مقاله

در کلیه ساعات شبانه روز، پس از پرداخت، فوراً می توانید مقاله را دانلود فرمایید.

نوع فایل	تعداد صفحات
word-ورد	۲۴ صفحه

9900 تومان خريد

توجه مهم :

*دوست عزیز در صورت نداشتن رمز پویا یا قطع بودن درگاه بانکی ، لطفا نام پروژه درخواستی خود را جهت هماهنگی برای دریافت شماره کارت واریزی و دریافت لینک دانلود، به واتساپ پشتیبانی سایت ۰۹۳۹۲۷۶۱۶۳۰ ارسال کنید *(از ساعت ۸ الی ۲۳)

Tags: تحقیق و مقالات کامپیوتر و IT