Ví dụ, một số các khe máy trong casino giả thuyết này có thể trả $ 5 vào
1 trong 100 kéo, trong khi các máy khác sẽ trả $ 25 trên 1 trong 1.000 Kéo. Đối với
bất cứ lý do gì, các nhà toán học ban đầu quyết định để điều trị các khe máy khác nhau
trong thí nghiệm tưởng tượng của họ như thể họ là một khe máy khổng lồ đó đã có rất nhiều
vũ khí. Điều này dẫn họ đến tham khảo các tùy chọn trong vấn đề của họ như là vũ khí. Nó cũng dẫn họ để
gọi suy nghĩ này thử nghiệm các Bandit Vấn đề Multiarmed. Cho đến ngày nay, chúng ta vẫn gọi
những thuật toán thuật toán cướp, vì vậy biết tên lịch sử giúp giải thích
lý do tại sao chúng tôi tham khảo các tùy chọn như cánh tay.
đang được dịch, vui lòng đợi..
