Ý nghĩa của các kết quả có thể là như sau:
• 0 năm - phần thưởng (phát hành) để xưng tội đơn phương;
• 6 tháng - phần thưởng cho sự hợp tác của hai nghi phạm;
• 5 năm - hình phạt cho lời thú nhận song phương;
• 10 năm - hình phạt cho phản bội lại niềm tin.
Như chúng ta cũng có thể thấy trong bảng, hai tù nhân sẽ được hưởng lợi nhiều hơn nếu cả hai từ chối để xưng tội. Do thực tế rằng cả hai không có cơ hội để đồng ý quyết định họ nên làm, một sự phản bội đơn phương thu được bằng cách đó một thú nhận và hy vọng sẽ có được kết quả tốt nhất cho chính mình - để được tha bổng (nếu nghi ngờ nào khác không thú nhận) hoặc bị kết án tại năm năm thay vì mười (nếu nghi ngờ khác thú nhận). Sự khác biệt giữa hai tình huống là chi phí của việc không thể hợp tác hoặc giá của sự mất lòng tin lẫn nhau.
2. Trò chơi và chiến lược
2.1 Single-chơi trò chơi
Trong tiến thoái lưỡng nan của người tù chỉ chơi một thời gian, các cá nhân chỉ quan tâm đến phúc lợi của riêng mình sẽ chọn chiến lược hợp lý duy nhất, tức là không hợp tác với các nghi phạm khác, và phải thú nhận, do đó phản bội hắn. Các quyết định của một trong những nghi phạm không thể ảnh hưởng đến quyết định của người khác và, do đó, mỗi người trong hai có một vị trí tốt hơn nếu ông thú nhận. Trong trường hợp này, các cầu thủ chỉ đáp ứng được một thời gian, và các quyết định của họ không ảnh hưởng đến sự tương tác tiếp theo. Điều quan trọng là đề cập đến trong một trò chơi duy nhất-play nó không quan trọng cho dù hai bên đã đồng ý hay không, và thậm chí sau một cuộc thảo luận có thể tình hình vẫn không thay đổi.
2.2 trò chơi lặp đi lặp lại (hữu hạn)
Không giống như các trò chơi duy nhất-play, trong (hữu hạn) lặp đi lặp lại trò chơi cảnh thay đổi, bởi vì sự phản bội lòng tin có thể được báo thù trong trận đấu tới hay trong một trận đấu tiếp theo, và sự hợp tác được khen thưởng. Điều quan trọng mà người chơi nên không biết thời điểm khi trận đấu kết thúc là, nếu không nó có thể là, ban đầu cho hợp tác chiến lược, sự phản bội xảy ra ở vòng cuối cùng, bởi vì không có phần thưởng có thể cho nó nữa. Trong trường hợp như vậy, vòng cuối cùng nhưng một người trở thành người cuối cùng, mà tình trạng tương tự kết quả một lần nữa. Từ quan điểm này, một giải pháp không tối ưu thu được. Nếu nó được giả định rằng các trò chơi diễn ra như là một giải đấu vô hạn, thì vấn đề của vòng cuối cùng được giải quyết.
2.3 trò chơi lặp đi lặp lại vô cấp
Trong trường hợp của các trò chơi vô cùng lặp đi lặp lại, trò chơi như vậy được lặp lại, và các cầu thủ không biết khi nào nó sẽ kết thúc. Trong trường hợp này, có thể có sự thiếu hợp tác trong các trò chơi tiếp theo, đó là không được khen thưởng. Hình phạt dành cho sự phản bội sẽ được nhận được trong trận đấu tiếp theo, trong khi hợp tác là (liên tục) khen thưởng.
Hình phạt dành cho sự phản bội trong giai đoạn tiếp theo được gọi là Tit-for-tat, vì vậy chúng tôi đang nói về sự tự tin tính toán. Chiến lược Tit-for-tat được phát triển bởi Anatol Rapoport và được dựa trên sự hợp tác miễn là hợp tác khác quá. Mặt khác, nếu một bên cố gắng phản bội, so với bên kia sẽ phản bội quá.
2.4 Năng động và tiến hóa các cuộc thi
trò chơi được chơi bởi nhiều thế hệ ngụ ý một sự phát triển của các trò chơi trong nhiều vòng. Nếu trong một vài trường hợp, các chiến lược xuất hiện những người chống lại những người khác, cho mỗi chiến lược kết quả sẽ được tính lại với nhau. Ở vòng tiếp theo, các chiến lược ít thành công được thay thế bởi những thành công, những chiến lược thành công nhất có mật độ cao hơn trong các thế hệ tiếp theo. Axelrod là người đã thực hiện phiên bản này của cuộc thi.
đang được dịch, vui lòng đợi..
