RLGO 1.0 [31] sử dụng một phương pháp đơn giản nhưng nhiều tính toán hiệu quả để tăng cường học tập. Nó sử dụng một triệu
tính năng hình dạng của địa phương để có thể liệt kê tất cả 1 × 1, 2 × 2 và 3 × 3 cấu hình của Black, White và các nút giao rỗng,
tại mỗi địa điểm có thể trên diễn đàn. Giá trị của một nhà nước được ước tính bằng một sự kết hợp tuyến tính của các tính năng hình dạng địa phương
được xuất hiện trong trạng thái đó. Trọng lượng của những tính năng được đào tạo ẩn bằng cách học theo thời gian, sự khác biệt từ các trò chơi
tự phát, và chia sẻ trọng giữa đối xứng đặc điểm hình dạng địa phương. Phiên bản cơ bản của RLGO được đánh giá ở 1350 Elo
trên 9 × 9 Toán Go Server.
đang được dịch, vui lòng đợi..
