Suy nghĩ nghiêm trọng về các thuật toán epsilon-Greedy
Trước khi chúng ta làm bất cứ điều gì khác, hãy chứng minh rằng các thuật toán epsilon-tham lam có thể được
cấu hình để hành xử chính xác theo cách mà Cynthia đề nghị, với sự tham gia hoàn toàn
thử nghiệm ngẫu nhiên như bạn muốn làm trong truyền thống A / B thử nghiệm. Sau khi chúng tôi
thấy rằng bạn có thể cấu hình các thuật toán epsilon-Greedy cư xử như thử nghiệm A / B,
chúng tôi sẽ cho bạn thấy rằng các thuật toán epsilon-tham lam cũng có thể được cấu hình để hành xử
chính xác như các quy tắc lợi nhuận tối đa hóa mà Bob hy vọng sẽ giải quyết Deb theo sau
giai đoạn thử nghiệm của mình đã kết thúc.
đang được dịch, vui lòng đợi..
