Chương trình đầu tiên Monte-Carlo Go, Gobble [33], mô phỏng nhiều trò chơi tự phát từ trạng thái của hiện tại. Nó kết hợp
đánh giá Monte-Carlo với hai ý tưởng mới: heuristic mọi động thái-as-đầu tiên, và ra lệnh cho mô phỏng. Tất cả-di chuyển-as-đầu
heuristic, giả định rằng giá trị của một di chuyển không bị ảnh hưởng đáng kể bởi những thay đổi ở những nơi khác trên diễn đàn. Các giá trị của
hành động chơi một ngay lập tức được ước tính bằng các kết quả trung bình của tất cả các mô phỏng trong đó hành động một được chơi tại bất kỳ
thời gian. Chúng tôi chính thức hóa ý tưởng này chính xác hơn tại mục 4.1. Gobble cũng sử dụng mô phỏng lệnh để sắp xếp tất cả di chuyển theo
để ước tính giá trị của họ. Sự sắp xếp này là ngẫu nhiên bị xáo trộn theo một lịch trình ủ mà nguội đi xuống với
các mô phỏng phụ. Mỗi mô phỏng sau đó diễn ra tất cả di chuyển theo thứ tự quy định. Gobble tự chơi một cách yếu ớt, với
đánh giá ước tính khoảng 25 kyu
đang được dịch, vui lòng đợi..
