Hiệu suất của đại học giao thông thường có thể được đáng kể cải thiện bằng cách kết hợp kiến thức miền vào chính sách mặc định[19,20]. Đại học giao thông các thuật toán, bằng cách sử dụng một chính sách mặc định được lựa chọn cẩn thận, có tốt hơn trước đó phương pháp tiếp cận để tìm kiếm trong mộtloạt các trò chơi đầy thách thức, bao gồm cả đi [19], tướng Game Playing [4], Amazon [5], dòng hành động [6], nhiều người chơithẻ trò chơi [7,8], và trò chơi chiến lược thời gian thực [9]. Nhiều nghiên cứu bổ sung trong Monte-Carlo cây tìm kiếm đã được phát triểntrong bối cảnh của máy tính đi, và được thảo luận chi tiết hơn trong phần tiếp theo.
đang được dịch, vui lòng đợi..