Đưa hai điểm này lại với nhau, nó có vẻ rõ ràng rằng có một tài sản bị mất chất lượng
từ các thuật toán epsilon-tham lam. Chúng tôi cần phải thực hiện chăm sóc thuật toán cướp của chúng tôi
về sự khác biệt nổi tiếng giữa các giá trị ước tính của cánh tay khi thuật toán của chúng tôi
quyết định mà cánh tay để khám phá. Chúng tôi cần phải thăm dò cấu trúc hơn là
thăm dò lung tung rằng các thuật toán epsilon-Greedy cung cấp.
đang được dịch, vui lòng đợi..
