If the difference in reward rates between two arms is small, you’ll need to explore a lot more often than 10% of the time to correctly determine which of the two options is actually better.
Nếu sự khác biệt trong khen thưởng tỷ giá giữa hai cánh tay nhỏ, bạn sẽ cần phải khám phárất nhiều thường xuyên hơn 10% thời gian để một cách chính xác xác định lựa chọn hailà thực sự tốt hơn.
Nếu sự khác biệt về tỷ lệ phần thưởng giữa hai cánh tay là nhỏ, bạn sẽ cần phải khám phá rất nhiều thường xuyên hơn so với 10% thời gian để xác định một cách chính xác mà trong hai tùy chọn là thực sự tốt hơn.