Ngược lại, nếu sự khác biệt quá lớn, bạn cần phải khám phá ít hơn rất nhiều so với 10% của
thời gian để ước tính một cách chính xác hơn về hai lựa chọn. Vì lý do đó, bạn sẽ kết thúc
lên mất rất nhiều phần thưởng bằng cách khám phá một lựa chọn rõ ràng thua kém trong trường hợp này.
Khi chúng tôi lần đầu tiên mô tả các thuật toán epsilon-tham lam, chúng tôi nói rằng chúng tôi sẽ không
đặt epsilon = 1.0 chính xác để chúng tôi wouldn 't lãng phí thời gian vào tùy chọn kém hơn, nhưng,
nếu sự khác biệt giữa hai cánh tay là đủ lớn, chúng ta kết thúc thời gian lãng phí
tùy chọn kém chỉ đơn giản bởi vì các thuật toán epsilon-tham lam luôn khám phá hoàn toàn
ngẫu nhiên.
33
đang được dịch, vui lòng đợi..
