Đây là một diễn đàn lý thuyết. Mặc dù chúng tôi chứa áp phích với một loạt các nền tảng, một số các cuộc thảo luận có thể trở nên khá kỹ thuật. Những cuộc thảo luận thường vẽ trên các khái niệm, sự kiện, và từ trong lĩnh vực toán học được gọi là lý thuyết trò chơi. Thật không may, nhiều từ thường được sử dụng trong lý thuyết trò chơi có rất cụ thể, ý nghĩa chính xác mà có thể hoặc không thể xếp hàng với cách sử dụng của họ trong bài phát biểu hàng ngày. Để chúng ta có thể giao tiếp hiệu quả, điều quan trọng là phải hiểu được ý nghĩa kỹ thuật của một vài điều khoản. Cách quá nhiều chủ đề đã biến thành tranh cãi giữa áp phích người có ý nghĩa khác nhau khi họ nói "tối ưu". Với ý nghĩ đó, đây là một giới thiệu nhanh chóng đến một số thuật ngữ phổ biến, một số trong số đó đến từ lý thuyết trò chơi. dao Một loạt được về cơ bản chỉ là một nhóm của bàn tay, có thể có một số thông tin tần số kèm theo. Phạm vi là đặc biệt hữu ích cho việc xác định chiến lược. Ví dụ, bạn có thể muốn nói rằng bạn có một hành động cụ thể với tất cả của một số tay đặc biệt, một nửa của người khác, vv vốn chủ sở hữu Vốn chủ sở hữu của một tay hoặc một phạm vi là tỷ lệ phần trăm của nồi dự kiến sẽ giành được nếu tất cả cá cược là dừng lại và tất cả người chơi kiểm tra xuống Showdown. Tần số này được tính trung bình trên tất cả các thẻ mà có thể đến và tất cả các phạm vi liên quan. trò chơi Có một vài cách khác nhau để xác định một trò chơi tùy thuộc vào tình huống mà bạn muốn học. Về cơ bản, nó chỉ sẽ là một chuỗi các quyết định đó dẫn đến một số tiền chi trả tùy thuộc vào những gì bạn thực hiện các quyết định và quyết định những gì các cầu thủ khác thực hiện. Đó là, phần thưởng của bạn phụ thuộc vào quyết định của bạn cũng như các quyết định của những người khác. Đôi khi bạn có một tình huống, và bạn có thể làm cho một số quyết định, và kết quả chỉ phụ thuộc vào quyết định của riêng bạn (và có thể một số ngẫu nhiên từ thiên nhiên). Đây có thể là vấn đề thú vị, nhưng họ không phải là câu hỏi cho lý thuyết trò chơi. Đó là một thực tế là phần thưởng của bạn phụ thuộc vào quyết định của người khác quá mà đặt chúng tôi trong lĩnh vực lý thuyết trò chơi. Ví dụ, kéo giấy đá (RPS) là một trò chơi chỉ với một điểm quyết định, và ba phần thưởng có thể là: thắng, thua , hoặc cà vạt, tùy thuộc vào sự lựa chọn của bạn và của đối thủ của bạn lựa chọn. Chiến lược Chiến lược xác định làm thế nào bạn chọn di chuyển của bạn ở mọi điểm quyết định trong một trò chơi, đó là, ở mọi tình huống mà bạn có thể có thể phải đối mặt với trong trò chơi. chiến lược tinh khiết A tinh khiết chiến lược là một chiến lược xác định chính xác làm thế nào bạn sẽ chơi trong mọi tình huống bạn có thể phải đối mặt. Trong RPS, có ba chiến lược tinh khiết: ném đá, ném giấy, hoặc ném kéo. chiến lược hỗn hợp A chiến lược hỗn hợp là một trong đó liên kết với một số xác suất mỗi chiến lược tinh khiết có thể. Ví dụ, trong RPS, bạn có thể chơi một chiến lược hỗn hợp bằng cách sử dụng "ném đá" 60% thời gian và sử dụng "ném giấy" khác 40%. Đó là một ý tưởng tốt để chơi một chiến lược hỗn hợp trong RPS. Nó không phải là rõ ràng rằng điều này là cần thiết để thành công trong poker. chiến lược thống trị Một chiến lược là (đúng) chiếm ưu thế nếu có một chiến lược khác có thể đó là lợi nhuận nhiều hơn bất kể chiến lược đối thủ của bạn. Điều này thực sự không đưa ra quá thường xuyên trong poker, kể từ khi gần như bất cứ điều gì có thể là tốt nếu đối thủ cụ thể của bạn xảy ra để chơi đặc biệt kém chống lại nó. Một ví dụ từ hold'em là như sau: bất kỳ chiến lược có liên quan đến gấp các loại hạt trên sông là chi phối (ít nhất là trong một bối cảnh trò chơi tiền mặt, bỏ qua cái cào). Đặc biệt, nó bị chi phối bởi một chiến lược mà là giống ngoại trừ các loại hạt được chơi bằng cách nào đó khác hơn bằng cách gấp. Chiến lược thứ hai này sẽ có lợi nhuận hơn bất kể đối thủ của bạn chơi. + EV + EV là viết tắt của "giá trị kỳ vọng tích cực" hay "giá trị kỳ vọng cao hơn". Đây là mơ hồ cho một vài lý do. Thứ nhất, giá trị kỳ vọng? giá trị của những gì mong đợi? Thứ hai, cao hơn? cao hơn so với những gì? giá trị dự kiến chỉ có nghĩa là giá trị trung bình của một số lượng ngẫu nhiên. Trong poker, số lượng chúng tôi quan tâm (và mà chúng tôi đang quan tâm đến việc tối đa hóa) là kích thước của chip của chúng tôi stack. Tuy nhiên, khi thực hiện tính toán, chúng ta không luôn luôn tính toán kích thước trung bình hoặc dự kiến của chip của chúng tôi stack. Đôi khi chúng ta tính toán sự thay đổi dự kiến trong kích thước ngăn xếp của chúng tôi trong quá trình của bàn tay, bắt đầu từ đầu, và cố gắng làm cho sự lựa chọn đó maximze đó. Hoặc, đôi khi chúng ta tính toán sự thay đổi dự kiến trong kích thước ngăn xếp bắt đầu từ một số điểm cụ thể trong tay. Về cơ bản, nó không quan trọng mà cách bạn làm điều đó, miễn là bạn là phù hợp trong lựa chọn của bạn và rõ ràng về những gì bạn đang làm khi bạn viết một bài. Thứ hai, cao hơn so với những gì? Đôi khi người ta nói "cao hơn 0", nhưng điều đó không có nghĩa là bất cứ điều gì phụ thuộc vào kỳ vọng của chúng tôi đang xem xét. Những lần khác, mọi người đang ngụ ý "cao hơn so với EV của gấp nếu tôi tính toán với quy ước tương tự", nhưng điều đó có thể hoặc không có thể quan trọng trong bất kỳ tình huống cụ thể (ví dụ, nếu chúng ta thực sự quan tâm trong việc quyết định giữa gọi điện thoại và nâng cao ). Từ một quan điểm chiến lược, điều quan trọng là để chọn tùy chọn với một EV cao hơn so với tất cả các lựa chọn có thể khác của bạn. Vì vậy, nếu bạn đang tranh cãi rằng cái gì là "+ EV", hãy nói những gì nó là di chuyển ưa thích của bạn có một EV cao hơn, và nếu bạn viết ra EV phương trình, làm rõ những gì bạn đang tìm kiếm sự mong đợi của. đáp ứng tốt nhất chiến lược hay chiến lược hoặc kẻ thù chiến lược tối đa-bóc lột Giả sử tất cả các chiến lược đối thủ của bạn là cố định và bạn biết họ. Sau đó, bạn có thể tính toán một cách rất có lợi nhuận nhất để đối đầu với họ. Chiến lược tốt nhất này được biết đến như là một phản ứng tốt nhất hay một chiến lược tối đa-bóc lột. An (tưởng tượng) người chơi tự động biết chiến lược của bạn và luôn luôn đóng tối đa exploitatively trong phản ứng đôi khi ám chỉ như kẻ thù. cân bằng nash hoặc (lý thuyết trò chơi) chiến lược tối ưu hoặc chiến lược unexploitable Một cân bằng Nash là một tập hợp các chiến lược (một cho mỗi người chơi trong các trò chơi) với một vài thuộc tính. Các tính chất này là tương đương, họ chỉ cách nhìn khác nhau của cùng một điều: - Không có cầu thủ trong trò chơi đơn phương có thể thay đổi chiến lược của mình để nâng cao kỳ vọng của mình. - chiến lược của mỗi người chơi được tối đa khai thác những đối thủ của mình (s), tại cùng một lúc. Chú ý rằng không có gì về những định nghĩa này ngụ ý rằng các cầu thủ sẽ phá vỡ, thậm chí trung bình. Tuy nhiên, nó chỉ ra rằng trong poker, nếu tất cả các cầu thủ đang chơi chiến lược cân bằng của họ, họ sẽ phá vỡ ngay cả trong ý thức trung bình dài hạn khi chúng tôi trung bình trên tất cả các vị trí trong trò chơi. Sự tồn tại của một tập hợp các chiến lược như thế này có một số hậu quả đặc biệt (ít nhất là trong heads-up chơi!). Bất cứ khi nào người chơi không chơi chiến lược cân bằng của họ, và một cầu thủ được làm ra nhiều tiền hơn anh ta sẽ ở trạng thái cân bằng, và do đó khác đang ít hơn, sau đó anh chàng người đang thực hiện ít có động cơ để chuyển sang trạng thái cân bằng chiến lược của mình. Tuy nhiên, bất cứ khi nào cả hai cầu thủ đang chơi cân bằng, không có động lực để thay đổi. Vì vậy, nếu cả hai người chơi là hợp lý và đủ để tính toán cân bằng chiến lược thông minh, họ đó là những chiến lược cuối cùng họ sẽ chơi. Đó là chỉ sau đó không có bất kỳ động cơ để đi chệch. Bây giờ nó không phải là ngay lập tức rõ ràng rằng đó là một tập hợp các chiến lược tồn tại, nhưng John Nash đã chứng minh cho một lớp học của trò chơi bao gồm poker. Tất nhiên, biết rằng nó tồn tại là khác nhau hơn là hiểu biết chính xác nó là gì, và trong thực tế, chiến lược cân bằng là không rõ cho tất cả các trò chơi poker "thực sự". Nhưng họ chắc chắn tồn tại, và cũng có thể, điểm cân bằng cho các phiên bản rất đơn giản hóa của một số trò chơi được biết đến. Ví dụ, nếu SB được giới hạn chơi xô-hoặc lần preflop trong đầu lên không có giới hạn giữ 'em, sau đó trò chơi trở nên đơn giản hơn nhiều, và chúng ta có thể tìm thấy những xô nổi tiếng / lần trạng thái cân bằng có thể hữu ích cho ngắn chơi -stacked. Bất cứ chiến lược không cân bằng cũng có thể được ám chỉ như khai thác. Chú ý rằng, nếu bạn đang chơi unexploitably, nhưng sau đó bạn đã thay đổi chiến lược của bạn để tận dụng lợi thế của một số những sai lầm của đối thủ của bạn, sau đó bạn mình đang chơi exploitably, nhưng đó là OK nếu đối thủ của bạn không tận dụng lợi thế của nó. chiến lược cân bằng Nash còn được gọi là lý thuyết tối ưu hoặc trò chơi tối ưu hoặc GTO hoặc unexploitable. Thực tế là "tối ưu" không chỉ đơn giản có nghĩa là "bóc lột tối đa" thực sự có vẻ vấp người lên và do đó không may mắn, nhưng đó là ngôn ngữ các nhà toán học đã chọn, vì vậy chúng tôi đang mắc kẹt với nó. Việc sử dụng "tối ưu" hoặc "trò chơi lý thuyết tối ưu "để tham khảo các Nash Equilibrium xuất hiện được phần nào độc đáo để poker. Đó là nguồn gốc có thể từ cuốn sách "Toán học of Poker" mà sử dụng thuật ngữ theo cách này. Việc sử dụng này không xuất hiện để được phổ biến trong lý thuyết trò chơi và chắc chắn gây ra một số nhầm lẫn ở lần.
đang được dịch, vui lòng đợi..
