Bây giờ chúng ta đã xác định cả hai cánh tay và phần thưởng, chúng ta có thể mô tả các ý tưởng trừu tượng của một
vấn đề tên cướp đó thúc đẩy tất cả các thuật toán, chúng tôi sẽ thực hiện trong cuốn sách này:
• Chúng ta đang phải đối mặt với một khe máy phức tạp, được gọi là một tên cướp, đó có một bộ N vũ khí
mà chúng ta có thể kéo về.
• Khi kéo, bất kỳ tay cho sẽ ra một phần thưởng. Nhưng những phần thưởng là không đáng tin cậy,
đó là lý do tại sao chúng tôi đang đánh bạc: Arm 1 có thể cung cấp cho chúng tôi 1 đơn vị phần thưởng chỉ có 1% của
thời gian, trong khi Arm 2 có thể cung cấp cho chúng tôi 1 đơn vị phần thưởng chỉ có 3% thời gian. Bất kỳ cụ
kéo của bất kỳ tay cụ thể là nguy hiểm.
• Không chỉ được mỗi kéo của một cánh tay đầy rủi ro, chúng tôi cũng không bắt đầu biết những gì các phần thưởng
giá đều là cho bất kỳ của cánh tay. Chúng ta phải tìm ra này bằng thực nghiệm bởi thực sự
kéo trên tay chưa biết.
đang được dịch, vui lòng đợi..