Although most work on reinforcement learning has focused exclusively o dịch - Although most work on reinforcement learning has focused exclusively o Việt làm thế nào để nói

Although most work on reinforcement

Although most work on reinforcement learning has focused exclusively on single agents we can extend reinforcement learning straightforwardly to multiple agents if they are all independent. They together will outperform any single agent due to the fact that they have more resources and a better chance of receiving rewards. Recently, Whitehead (1991) has also demonstrated the potential benefit of multiple “complete observing” cooperative agents over a single agent. However the more practical study is to compare the performance of n independent agents with the one of n cooperative agents and to identify their tradeoff.
How can reinforcement learning agents be cooperative? I identify three ways of cooperation. First, agents can communicate instantaneous information such as sensation actions or rewards. Second, agents can communicate episodes that are sequences of sensation action reward triples experienced by agents. Third, agents can communicate learned decision policies. This paper presents three case studies of multi-agent reinforcement learning involving such cooperation and draws some related conclusions that are not limited to multi-agent reinforcement learning. The main thesis of this paper is that if cooperation is done intelligently each agent can be net from other agents instantaneous information episodic experience and learned know ledge.
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
Mặc dù hầu hết làm việc trên việc học tăng cường đã tập trung hoàn toàn vào đại lý duy nhất chúng tôi có thể mở rộng tăng cường việc học dàng để nhiều đại lý nếu họ tất cả độc lập. Họ cùng nhau sẽ tốt hơn bất kỳ đại lý duy nhất do thực tế là họ có nguồn lực nhiều hơn và một cơ hội tốt hơn nhận được phần thưởng. Gần đây, Whitehead (1991) cũng đã chứng minh lợi ích tiềm năng của đại lý "hoàn toàn quan sát" nhiều của hợp tác xã qua một đại lý duy nhất. Tuy nhiên nghiên cứu thực tế hơn là để so sánh hiệu suất của n đại lý độc lập với một đại lý hợp tác xã n và xác định sự cân bằng của.
làm thế nào có thể tăng cường học đại lý được hợp tác? Tôi xác định ba cách hợp tác. Đầu tiên, Đại lý có thể giao tiếp tức thời thông tin như cảm giác hành động hoặc phần thưởng. Thứ hai, các đại lý có thể giao tiếp tập phim là trình tự của các cảm giác hành động thưởng ba có kinh nghiệm của các đại lý. Thứ ba, đại lý có thể giao tiếp học quyết định chính sách. Bài báo này trình bày ba trường hợp nghiên cứu nhiều đại lý tăng cường việc học liên quan đến hợp tác và rút ra một số kết luận có liên quan mà không phải là giới hạn để học tập nhiều đại lý tăng cường. Luận án chính của giấy này là nếu hợp tác được thực hiện thông minh mỗi đại lý có thể ròng từ đại lý thông tin tức thời episodic kinh nghiệm và học biết lồi ra.
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
Mặc dù hầu hết công việc vào học tập tăng cường tập trung hoàn toàn vào các đại lý duy nhất chúng tôi có thể mở rộng tăng cường học thẳng thắn với nhiều đại lý nếu họ hoàn toàn độc lập. Họ cùng nhau sẽ tốt hơn bất kỳ đại lý duy nhất do thực tế rằng họ có nhiều nguồn lực và cơ hội tốt hơn nhận được phần thưởng. Gần đây, Whitehead (1991) cũng đã chứng minh lợi ích tiềm năng của nhiều "quan sát hoàn thành" đại lý hợp tác trong một tác nhân duy nhất. Tuy nhiên các nghiên cứu thực tế hơn là để so sánh hiệu suất của n đại lý độc lập với một trong những đại lý hợp tác xã và n để xác định sự cân bằng của họ.
Làm thế nào có thể tăng cường học tập các đại lý có hợp tác xã? Tôi xác định ba cách hợp tác. Đầu tiên, các đại lý có thể giao tiếp thông tin tức thời như những hành động cảm giác hay phần thưởng. Thứ hai, các đại lý có thể giao tiếp tập có trình tự bộ ba phần thưởng hành động cảm giác kinh nghiệm của các đại lý. Thứ ba, các đại lý có thể giao tiếp chính sách quyết định học. Bài viết này trình bày ba nghiên cứu trường hợp tăng cường đa tác nhân liên quan đến học tập hợp tác như vậy và rút ra một số kết luận liên quan mà không bị giới hạn nhiều đại lý tăng cường học tập. Luận án chính của bài viết này là nếu hợp tác được thực hiện một cách thông minh mỗi đại lý có thể thuần từ các đại lý khác thông tin tức thời nhiều tập kinh nghiệm và học được biết gờ đá.
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2025 I Love Translation. All reserved.

E-mail: