التعلم المعزز هو شكل قوي من أشكال الذكاء الاصطناعي الذي يحاكي سلوك البشر والحيوانات. إنه نوع من التعلم الآلي الذي يمكن أنظمة الكمبيوتر من التعلم من بيئتها من خلال اتخاذ الإجراءات وتلقي التعليقات من بيئتها. الهدف النهائي من التعلم المعزز هو العثور على أفضل إجراء ممكن في موقف معين من شأنه زيادة المكافآت وتقليل الخسائر. يمكن التعلم المعزز الآلات من التعلم من بيئتها من خلال اتخاذ الإجراءات ورؤية نتائج أفعالها. من خلال التجربة والخطأ ، تكون الآلات قادرة على تحديد الإجراءات التي من المرجح أن تؤدي إلى النتيجة المرجوة ، وتصبح الإجراءات الناتجة هي الاستراتيجية المثلى. تسمح هذه العملية للآلات بتعلم المهام المعقدة التي قد يكون من الصعب أو المستحيل برمجتها. التعلم المعزز مفيد بشكل خاص في مجال الروبوتات ، حيث يمكن للآلات تعلم التفاعل مع بيئتها بطريقة آمنة وفعالة. كما أن لديها تطبيقات في الألعاب ، حيث يمكن للروبوتات تعلم ممارسة الألعاب مثل الشطرنج و Go على مستوى عال.