Mặc dù hầu hết công việc vào học tập tăng cường tập trung hoàn toàn vào các đại lý duy nhất chúng tôi có thể mở rộng tăng cường học thẳng thắn với nhiều đại lý nếu họ hoàn toàn độc lập. Họ cùng nhau sẽ tốt hơn bất kỳ đại lý duy nhất do thực tế rằng họ có nhiều nguồn lực và cơ hội tốt hơn nhận được phần thưởng. Gần đây, Whitehead (1991) cũng đã chứng minh lợi ích tiềm năng của nhiều "quan sát hoàn thành" đại lý hợp tác trong một tác nhân duy nhất. Tuy nhiên các nghiên cứu thực tế hơn là để so sánh hiệu suất của n đại lý độc lập với một trong những đại lý hợp tác xã và n để xác định sự cân bằng của họ.
Làm thế nào có thể tăng cường học tập các đại lý có hợp tác xã? Tôi xác định ba cách hợp tác. Đầu tiên, các đại lý có thể giao tiếp thông tin tức thời như những hành động cảm giác hay phần thưởng. Thứ hai, các đại lý có thể giao tiếp tập có trình tự bộ ba phần thưởng hành động cảm giác kinh nghiệm của các đại lý. Thứ ba, các đại lý có thể giao tiếp chính sách quyết định học. Bài viết này trình bày ba nghiên cứu trường hợp tăng cường đa tác nhân liên quan đến học tập hợp tác như vậy và rút ra một số kết luận liên quan mà không bị giới hạn nhiều đại lý tăng cường học tập. Luận án chính của bài viết này là nếu hợp tác được thực hiện một cách thông minh mỗi đại lý có thể thuần từ các đại lý khác thông tin tức thời nhiều tập kinh nghiệm và học được biết gờ đá.
đang được dịch, vui lòng đợi..
