This is a theory forum. Although we

This is a theory forum. Although we accomodate posters with a wide variety of backgrounds, some of the discussions can become quite technical. These discussions often draw upon concepts, facts, and words from the field of mathematics known as game theory.

Unfortunately, many words commonly used in game theory have very specific, exact meanings which may or may not line up with their usage in everyday speech. In order that we are able to communicate effectively, it is important to understand the technical meanings of a few terms. Way too many threads have degenerated into arguments between posters who mean different things when they say "optimal".

With that in mind, here's a quick intro to some common terminology, some of which comes from game theory.

range

A range is basically just a group of hands, possibly with some frequency information attached. Ranges are particularly useful for specifying strategies. For example, you might want to say that you take a particular action with all of some particular hands, half of others, etc.

equity

The equity of a hand or a range is the percentage of the pot expected to be won if all betting were stopped and all players checked down to showdown. This frequency is averaged over all the cards that can come and all the ranges involved.

game

There's a few different ways to define a game depending on the situation you want to study. Basically, it's just going to be a sequence of decisions which lead to some payoff depending on what decisions you make and what decisions the other players make. That is, your payoff depends on your decisions as well as other peoples' decisions.

Sometimes you have a situation, and you get to make some decisions, and the results only depend on your own decisions (and maybe some randomness from Nature). These might be interesting problems, but they're not questions for game theory. It's the fact that your payoff depends on other peoples' decisions too that puts us in the field of game theory.

For example, rock paper scissors (RPS) is a game with only one decision point, and three payoffs are possible: win, lose, or tie, depending on your choice and your opponent's choice.

strategy

A strategy specifies how you choose your move at every decision point in a game, that is, at every situation you could possibly be faced with in the game.

pure strategy

A pure strategy is a strategy that specifies exactly how you will play in every situation you could face. In RPS, there are three pure strategies: throw rock, throw paper, or throw scissors.

mixed strategy

A mixed strategy is one which associates some probability with each of the possible pure strategies. For example, in RPS, you could play a mixed strategy by using "throw rock" 60% of the time and using "throw paper" the other 40%. It is a good idea to play a mixed strategy in RPS. It's not as clear that this is necessary to be successful in poker.

dominated strategy

A strategy is (strictly) dominated if there is another strategy possible which is more profitable regardless of your opponents' strategies. This actually does not come up too often in poker, since almost anything can be good if your particular opponent happens to play particularly poorly against it.

One example from hold'em is as follows: any strategy that involves folding the nuts on the river is dominated (at least in a cash game context, ignoring rake). In particular, it is dominated by a strategy which is the same except that the nuts are played somehow other than by folding. This second strategy will be more profitable regardless of how your opponents play.

+EV

+EV is short for "positive expected value" or "higher expected value". This is vague for a couple of reasons. First, expected value? expected value of what? Second, higher? higher than what?

Expected value just means the average value of some random quantity. In poker, the quantity we're interested in (and which we're interested in maximizing) is the size of our chip stack. However, when doing calculations, we don't always calculate the average or expected size of our chip stack. Sometimes we calculate the expected change in our stack size over the course of the hand, starting from the beginning, and try to make choices that maximze that. Or, sometimes we calculate the expected change in stack size starting from some specific point in the hand.

Basically, it doesn't matter which way you do it, as long as you are consistent in your choice and clear about what you are doing when you write a post.

Second, higher than what? Sometimes people say "higher than 0", but that doesn't necessarily mean anything depending on what expectation we're considering. Other times, people are implying "higher than than the EV of folding if I computed it with the same convention", but that may or may not be important in any particular situation (say, if we are really interested in deciding between calling and raising).

From a strategic point of view, it's important to choose the option with an EV higher than all your other possible choices. So if you are arguing that something is "+EV", please say what it is that your favored move has a higher EV than, and if you write down EV equations, make it clear what you're finding the expectation of.

best response strategy or maximally-exploitative strategy or nemesis strategy

Suppose all your opponents' strategies are fixed and you know them. Then, you can compute the very most profitable way to play against them. This best strategy is known as a best response or a maximally-exploitative strategy. An (imaginary) player who automatically knows your strategy and always plays maximally exploitatively in response is sometimes refered to as nemesis.

nash equilibrium or (game theory) optimal strategies or unexploitable strategies

A Nash equilibrium is a set of strategies (one for each player in the game) with a couple properties. These properties are equivalent, they're just different ways of looking at the same thing:
- No player in the game can unilaterally change his strategy to improve his expectation.
- Each player's strategy is maximally exploiting those of his opponent(s), at the same time.

Notice that nothing about these definitions implies that the players will break-even on average. However, it turns out that in poker, if all players are playing their equilibrium strategies, they will break even in the long-term average sense when we average over all positions in the game.

The existence of a set of strategies like this has some special consequences (at least in heads-up play!). Whenever players are not playing their equilibrium strategies, and one player is making more money than he would at equilibrium, and thus the other is making less, then the guy who is making less has incentive to switch to his equilibrium strategy. However, whenever both players are playing the equilibrium, neither has any incentive to change. Thus, if both players are rational and smart enough to compute the equilibrium strategies, they those are the strategies they will end up playing. It's only then that neither has any incentive to deviate.

Now it is not immediately obvious that such a set of strategies exist, but John Nash proved it for a class of games that includes poker. Of course, knowing that it exists is different than knowing exactly what it is, and in fact the equilibrium strategies are unknown for all "real" poker games. But they definitely exist, and also, equilibriums for greatly-simplified versions of some games are known. For example, if the SB is restricted to playing shove-or-fold preflop in heads up no limit hold 'em, then the game becomes much simpler, and we can find the well-known shove/fold equilibrium which can be useful for short-stacked play.

Any non-equilibrium strategy may also be refered to as exploitable. Notice that, if you were playing unexploitably, but then you changed your strategy to take advantage of some mistakes of your opponent, then you yourself are now playing exploitably, but that's OK if your opponent isn't taking advantage of it.

Nash equilibrium strategies are also known as optimal or game theory optimal or GTO or unexploitable. The fact that "optimal" does not simply mean "maximally exploitative" really seems to trip people up and is thus unfortunate, but that's the language the mathematicians chose, so we're stuck with it.

The usage of "optimal" or "game theory optimal" to refer to the Nash Equilibrium appears to be somewhat unique to poker. It's genesis may be from the book "The Mathematics of Poker" which uses the term this way. This usage does not appear to be common among game theorists and definitely causes some confusion at times.

Unfortunately, many words commonly used in game theory have very specific, exact meanings which may or may not line up with their usage in everyday speech. In order that we are able to communicate effectively, it is important to understand the technical meanings of a few terms. Way too many threads have degenerated into arguments between posters who mean different things when they say "optimal".

With that in mind, here's a quick intro to some common terminology, some of which comes from game theory.

range

A range is basically just a group of hands, possibly with some frequency information attached. Ranges are particularly useful for specifying strategies. For example, you might want to say that you take a particular action with all of some particular hands, half of others, etc.

equity

The equity of a hand or a range is the percentage of the pot expected to be won if all betting were stopped and all players checked down to showdown. This frequency is averaged over all the cards that can come and all the ranges involved.

game

There's a few different ways to define a game depending on the situation you want to study. Basically, it's just going to be a sequence of decisions which lead to some payoff depending on what decisions you make and what decisions the other players make. That is, your payoff depends on your decisions as well as other peoples' decisions.

Sometimes you have a situation, and you get to make some decisions, and the results only depend on your own decisions (and maybe some randomness from Nature). These might be interesting problems, but they're not questions for game theory. It's the fact that your payoff depends on other peoples' decisions too that puts us in the field of game theory.

For example, rock paper scissors (RPS) is a game with only one decision point, and three payoffs are possible: win, lose, or tie, depending on your choice and your opponent's choice.

strategy

A strategy specifies how you choose your move at every decision point in a game, that is, at every situation you could possibly be faced with in the game.

pure strategy

A pure strategy is a strategy that specifies exactly how you will play in every situation you could face. In RPS, there are three pure strategies: throw rock, throw paper, or throw scissors.

mixed strategy

A mixed strategy is one which associates some probability with each of the possible pure strategies. For example, in RPS, you could play a mixed strategy by using "throw rock" 60% of the time and using "throw paper" the other 40%. It is a good idea to play a mixed strategy in RPS. It's not as clear that this is necessary to be successful in poker.

dominated strategy

A strategy is (strictly) dominated if there is another strategy possible which is more profitable regardless of your opponents' strategies. This actually does not come up too often in poker, since almost anything can be good if your particular opponent happens to play particularly poorly against it.

One example from hold'em is as follows: any strategy that involves folding the nuts on the river is dominated (at least in a cash game context, ignoring rake). In particular, it is dominated by a strategy which is the same except that the nuts are played somehow other than by folding. This second strategy will be more profitable regardless of how your opponents play.

+EV

+EV is short for "positive expected value" or "higher expected value". This is vague for a couple of reasons. First, expected value? expected value of what? Second, higher? higher than what?

Expected value just means the average value of some random quantity. In poker, the quantity we're interested in (and which we're interested in maximizing) is the size of our chip stack. However, when doing calculations, we don't always calculate the average or expected size of our chip stack. Sometimes we calculate the expected change in our stack size over the course of the hand, starting from the beginning, and try to make choices that maximze that. Or, sometimes we calculate the expected change in stack size starting from some specific point in the hand.

Basically, it doesn't matter which way you do it, as long as you are consistent in your choice and clear about what you are doing when you write a post.

Second, higher than what? Sometimes people say "higher than 0", but that doesn't necessarily mean anything depending on what expectation we're considering. Other times, people are implying "higher than than the EV of folding if I computed it with the same convention", but that may or may not be important in any particular situation (say, if we are really interested in deciding between calling and raising).

From a strategic point of view, it's important to choose the option with an EV higher than all your other possible choices. So if you are arguing that something is "+EV", please say what it is that your favored move has a higher EV than, and if you write down EV equations, make it clear what you're finding the expectation of.

best response strategy or maximally-exploitative strategy or nemesis strategy

Suppose all your opponents' strategies are fixed and you know them. Then, you can compute the very most profitable way to play against them. This best strategy is known as a best response or a maximally-exploitative strategy. An (imaginary) player who automatically knows your strategy and always plays maximally exploitatively in response is sometimes refered to as nemesis.

nash equilibrium or (game theory) optimal strategies or unexploitable strategies

A Nash equilibrium is a set of strategies (one for each player in the game) with a couple properties. These properties are equivalent, they're just different ways of looking at the same thing:
- No player in the game can unilaterally change his strategy to improve his expectation.
- Each player's strategy is maximally exploiting those of his opponent(s), at the same time.

Notice that nothing about these definitions implies that the players will break-even on average. However, it turns out that in poker, if all players are playing their equilibrium strategies, they will break even in the long-term average sense when we average over all positions in the game.

The existence of a set of strategies like this has some special consequences (at least in heads-up play!). Whenever players are not playing their equilibrium strategies, and one player is making more money than he would at equilibrium, and thus the other is making less, then the guy who is making less has incentive to switch to his equilibrium strategy. However, whenever both players are playing the equilibrium, neither has any incentive to change. Thus, if both players are rational and smart enough to compute the equilibrium strategies, they those are the strategies they will end up playing. It's only then that neither has any incentive to deviate.

Now it is not immediately obvious that such a set of strategies exist, but John Nash proved it for a class of games that includes poker. Of course, knowing that it exists is different than knowing exactly what it is, and in fact the equilibrium strategies are unknown for all "real" poker games. But they definitely exist, and also, equilibriums for greatly-simplified versions of some games are known. For example, if the SB is restricted to playing shove-or-fold preflop in heads up no limit hold 'em, then the game becomes much simpler, and we can find the well-known shove/fold equilibrium which can be useful for short-stacked play.

Any non-equilibrium strategy may also be refered to as exploitable. Notice that, if you were playing unexploitably, but then you changed your strategy to take advantage of some mistakes of your opponent, then you yourself are now playing exploitably, but that's OK if your opponent isn't taking advantage of it.

Nash equilibrium strategies are also known as optimal or game theory optimal or GTO or unexploitable. The fact that "optimal" does not simply mean "maximally exploitative" really seems to trip people up and is thus unfortunate, but that's the language the mathematicians chose, so we're stuck with it.

The usage of "optimal" or "game theory optimal" to refer to the Nash Equilibrium appears to be somewhat unique to poker. It's genesis may be from the book "The Mathematics of Poker" which uses the term this way. This usage does not appear to be common among game theorists and definitely causes some confusion at times.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Đây là một lý thuyết diễn đàn. Mặc dù chúng tôi phục vụ các áp phích với nhiều nguồn gốc, một số các cuộc thảo luận có thể trở nên khá kỹ thuật. Các cuộc thảo luận thường rút ra sau khi khái niệm, sự kiện, và từ từ lĩnh vực toán học được gọi là lý thuyết trò chơi. Thật không may, nhiều từ thường được sử dụng trong lý thuyết trò chơi có ý nghĩa rất cụ thể, chính xác mà có thể hoặc không có thể xếp hàng với việc sử dụng của họ trong bài phát biểu hàng ngày. Để mà chúng tôi có thể giao tiếp hiệu quả, nó là quan trọng để hiểu ý nghĩa kỹ thuật của một vài điều khoản. Cách quá nhiều chủ đề có thoái hóa vào đối số giữa các áp phích những người có nghĩa là những thứ khác nhau khi họ nói "tối ưu".Với ý nghĩ đó, đây là một giới thiệu nhanh chóng đến một số thuật ngữ phổ biến, một số trong đó đến từ lý thuyết trò chơi.phạm viMột loạt các là về cơ bản chỉ là một nhóm các tay, có thể với một số thông tin tần số gắn liền. Dãy là đặc biệt hữu ích cho việc xác định chiến lược. Ví dụ, bạn có thể muốn nói rằng bạn có một hành động cụ thể với tất cả một số tay đặc biệt, một nửa của những người khác, vv.vốn chủ sở hữuVốn chủ sở hữu của một bàn tay hoặc một phạm vi là tỷ lệ phần trăm của nồi mong đợi để được chiến thắng nếu tất cả cược đã được ngừng lại và tất cả người chơi kiểm tra xuống cuộc tranh chấp. Tần số này được tính trung bình trên tất cả các thẻ có thể đến và tham gia tất cả các phạm vi.trò chơiĐó là một số cách khác nhau để xác định một trò chơi tùy thuộc vào tình hình bạn muốn theo học. Về cơ bản, nó sẽ là một chuỗi các quyết định mà dẫn đến một số tiền chi trả tùy thuộc vào quyết định những gì bạn thực hiện và quyết định những gì các người chơi khác thực hiện. Có nghĩa là, kết quả của bạn phụ thuộc vào quyết định của bạn cũng như những người khác quyết định. Đôi khi bạn có một tình hình, và bạn có thể làm cho một số quyết định, và các kết quả chỉ phụ thuộc vào quyết định của riêng bạn (và có lẽ một số ngẫu nhiên từ thiên nhiên). Đây có thể là vấn đề thú vị, nhưng họ không câu hỏi cho lý thuyết trò chơi. Nó là một thực tế là kết quả của bạn phụ thuộc vào những người khác quyết định quá mà đặt chúng tôi trong lĩnh vực lý thuyết trò chơi.Ví dụ, đá giấy kéo (RPS) là một trò chơi với quyết định chỉ có một điểm, và ba kết quả có thể: giành chiến thắng, mất hay tie, tùy thuộc vào sự lựa chọn của bạn và sự lựa chọn đối thủ của bạn.chiến lượcMột chiến lược xác định làm thế nào bạn chọn di chuyển của bạn tại mỗi điểm quyết định trong một trò chơi, có nghĩa là, tại mọi tình huống bạn có thể có thể phải đối mặt với trong trò chơi.chiến lược thuần túyMột chiến lược thuần túy là một chiến lược xác định chính xác làm thế nào bạn sẽ chơi trong mọi tình huống bạn có thể phải đối mặt. Ở RPS, có ba chiến lược tinh khiết: ném đá, ném giấy, hoặc ném kéo.chiến lược hỗn hợpMột chiến lược hỗn hợp là một trong những liên kết xác suất một số với mỗi người trong số các chiến lược thuần túy có thể. Ví dụ, trong RPS, bạn có thể chơi một chiến lược hỗn hợp bằng cách sử dụng "ném đá" 60% thời gian, bằng cách sử dụng "ném giấy" khác 40%. Đó là một ý tưởng tốt để chơi một chiến lược hỗn hợp trong RPS. Nó không phải là rõ ràng rằng điều này là cần thiết để thành công trong poker.thống trị chiến lượcMột chiến lược (hoàn toàn) chủ yếu là nếu có là một chiến lược có thể đó là lợi hơn bất kể chiến lược đối thủ của bạn. Điều này thực sự không đưa ra quá thường xuyên trong poker, kể từ khi hầu hết mọi thứ có thể được tốt nếu đối thủ cụ thể của bạn xảy ra để chơi đặc biệt là kém chống lại nó.Một ví dụ từ hold'em là như sau: bất kỳ chiến lược có liên quan đến gấp các hạt trên sông thống trị (tối thiểu trong một bối cảnh trò chơi tiền mặt, bỏ qua rake). Đặc biệt, nó bị chi phối bởi một chiến lược mà là tương tự ngoại trừ việc các hạt được chơi bằng cách nào đó khác hơn bằng cách gấp. Chiến lược thứ hai này sẽ thêm lợi nhuận bất kể như thế nào đối thủ của bạn chơi.+ EV+ EV là viết tắt "tích cực giá trị kỳ vọng" hoặc "giá trị kỳ vọng cao". Đây là mơ hồ cho một vài lý do. Đầu tiên, các giá trị kỳ vọng? giá trị kỳ vọng của những gì? Thứ hai, cao hơn? cao hơn những gì? Giá trị kỳ vọng chỉ có nghĩa là giá trị trung bình của một số số lượng ngẫu nhiên. Trong poker, số lượng chúng tôi đang quan tâm đến (và mà chúng tôi đang quan tâm đến tối đa hóa) là kích cỡ của chip ngăn xếp của chúng tôi. Tuy nhiên, khi thực hiện tính toán, chúng tôi luôn luôn không tính toán kích thước trung bình hoặc dự kiến của chip ngăn xếp của chúng tôi. Đôi khi chúng tôi tính toán các dự kiến sẽ thay đổi kích thước ngăn xếp của chúng tôi trong quá trình của bàn tay, bắt đầu từ đầu, và cố gắng để làm cho sự lựa chọn mà maximze đó. Hoặc, đôi khi chúng tôi tính toán sự thay đổi dự kiến kích thước ngăn xếp bắt đầu từ một số điểm cụ thể trong tay. Về cơ bản, nó không quan trọng đó là cách bạn làm điều đó, miễn là bạn phù hợp trong sự lựa chọn của bạn và rõ ràng về những gì bạn đang làm khi bạn viết một bài đăng.Thứ hai, cao hơn so với những gì? Đôi khi người ta nói "cao hơn 0", nhưng đó không nhất thiết có nghĩa là bất cứ điều gì tùy thuộc vào những gì mong đợi chúng tôi đang xem xét. Lần khác, những người ngụ ý "cao hơn so với EV gấp nếu tôi tính nó với công ước tương tự", nhưng mà có thể hoặc có thể không được quan trọng trong mọi tình huống cụ thể (nói, nếu chúng ta thực sự quan tâm trong việc quyết định giữa gọi và nâng cao).Từ một điểm chiến lược quan, nó là quan trọng để lựa chọn các tùy chọn với một EV cao hơn tất cả các lựa chọn có thể khác. Vì vậy, nếu bạn đang tranh cãi rằng cái gì là "+ EV", hãy nói những gì nó là rằng di chuyển ưa thích của bạn có một EV cao hơn, và nếu bạn viết ra phương trình EV, làm cho nó rõ ràng những gì bạn đang tìm kiếm những kỳ vọng của.tốt nhất phản ứng chiến lược hoặc chiến lược tối đa bóc lột hoặc nemesis chiến lượcGiả sử tất cả đối thủ của bạn chiến lược được cố định và bạn biết họ. Sau đó, bạn có thể tính cách rất đặt lợi nhuận để chơi chống lại họ. Chiến lược tốt nhất này được gọi là một phản ứng tốt nhất hay một chiến lược tối đa bóc lột. Một cầu thủ (tưởng tượng) tự động biết chiến lược của bạn và luôn luôn đóng tối đa exploitatively trong trả lời là đôi khi được gọi là nemesis.Nash cân bằng hoặc (lý thuyết trò chơi) các chiến lược tối ưu hoặc unexploitable chiến lượcMột cân bằng Nash là một tập hợp chiến lược (một cho mỗi người chơi trong các trò chơi) với một vài thuộc tính. Các thuộc tính này là tương đương, chúng khác nhau chỉ cách nhìn vào cùng một điều:-Không có cầu thủ trong trò chơi có thể đơn phương thay đổi chiến lược của mình để cải thiện các kỳ vọng của mình.-Mỗi người chơi chiến lược tối đa khai thác những người opponent(s) của mình, cùng một lúc.Thông báo rằng không có gì về các định nghĩa này ngụ ý rằng những người chơi sẽ điểm hòa vốn trung bình. Tuy nhiên, nó chỉ ra rằng trong poker, nếu tất cả người chơi đang chơi chiến lược cân bằng của họ, họ sẽ phá vỡ ngay cả trong ý nghĩa trung bình dài hạn khi chúng tôi trung bình trên tất cả các vị trí trong các trò chơi.Sự tồn tại của một tập hợp các chiến lược như thế này có một số hậu quả đặc biệt (tối thiểu trong heads-up chơi!). Bất cứ khi nào người chơi đang không chơi chiến lược cân bằng của họ, và một máy nghe nhạc kiếm tiền nhiều hơn ông nào lúc cân bằng, và do đó khác làm cho ít hơn, sau đó guy những người là làm cho ít có khuyến khích để chuyển sang chiến lược cân bằng của mình. Tuy nhiên, bất cứ khi nào cả hai người chơi đang chơi cân bằng, không có bất kỳ khuyến khích để thay đổi. Vì vậy, nếu cả hai người chơi là hợp lý và đủ thông minh để tính toán chiến lược cân bằng, họ đó là chiến lược mà họ sẽ kết thúc chơi. Đó là chỉ sau đó rằng không có bất kỳ khuyến khích để đi chệch.Bây giờ nó không phải là ngay lập tức rõ ràng rằng một tập hợp các chiến lược tồn tại, nhưng John Nash đã chứng minh nó cho một lớp học của trò chơi bao gồm các xi phe. Tất nhiên, biết rằng nó tồn tại là khác nhau hơn biết chính xác những gì nó là, và trong thực tế chiến lược cân bằng được biết cho tất cả các trò chơi poker "thực sự". Nhưng họ chắc chắn tồn tại, và ngoài ra, equilibriums cho đơn giản hóa rất nhiều phiên bản của trò chơi một số được biết đến. Ví dụ, nếu SB là bị giới hạn để chơi preflop Xô hoặc gấp trong đầu lên không có giới hạn hold 'em, sau đó trò chơi trở nên đơn giản hơn nhiều, và chúng tôi có thể tìm thấy cân bằng nổi tiếng Xô/màn hình đầu tiên mà có thể hữu ích cho chơi ngắn xếp chồng lên nhau.Bất kỳ chiến lược không cân bằng cũng có thể được gọi là khai thác. Nhận thấy rằng, nếu bạn đang chơi unexploitably, nhưng sau đó bạn thay đổi chiến lược của bạn để tận dụng lợi thế của một số sai lầm của đối thủ của bạn, sau đó bạn mình đã chơi exploitably, nhưng đó là OK nếu đối thủ của bạn không phải là lợi dụng của nó.Chiến lược cân bằng Nash là cũng được gọi là lý thuyết tối ưu hoặc trò chơi tối ưu hoặc GTO hoặc unexploitable. Một thực tế rằng "tối ưu" không chỉ đơn giản là có nghĩa là "tối đa bóc lột" thực sự dường như mọi người chuyến đi lên và như vậy là đáng tiếc, nhưng đó là ngôn ngữ đã chọn những nhà toán học, vì vậy chúng tôi đang mắc kẹt với nó. Sử dụng "tối ưu" hay "lý thuyết trò chơi tối ưu" để chỉ cân bằng Nash dường như là hơi độc đáo poker. Nguồn gốc của nó có thể từ cuốn sách "The toán học của xi phe" sử dụng thuật ngữ theo cách này. Sử dụng này dường như không được phổ biến trong số các nhà lý thuyết trò chơi và chắc chắn gây ra một số sự nhầm lẫn vào các thời điểm.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Đây là một diễn đàn lý thuyết. Mặc dù chúng tôi chứa áp phích với một loạt các nền tảng, một số các cuộc thảo luận có thể trở nên khá kỹ thuật. Những cuộc thảo luận thường vẽ trên các khái niệm, sự kiện, và từ trong lĩnh vực toán học được gọi là lý thuyết trò chơi. Thật không may, nhiều từ thường được sử dụng trong lý thuyết trò chơi có rất cụ thể, ý nghĩa chính xác mà có thể hoặc không thể xếp hàng với cách sử dụng của họ trong bài phát biểu hàng ngày. Để chúng ta có thể giao tiếp hiệu quả, điều quan trọng là phải hiểu được ý nghĩa kỹ thuật của một vài điều khoản. Cách quá nhiều chủ đề đã biến thành tranh cãi giữa áp phích người có ý nghĩa khác nhau khi họ nói "tối ưu". Với ý nghĩ đó, đây là một giới thiệu nhanh chóng đến một số thuật ngữ phổ biến, một số trong số đó đến từ lý thuyết trò chơi. dao Một loạt được về cơ bản chỉ là một nhóm của bàn tay, có thể có một số thông tin tần số kèm theo. Phạm vi là đặc biệt hữu ích cho việc xác định chiến lược. Ví dụ, bạn có thể muốn nói rằng bạn có một hành động cụ thể với tất cả của một số tay đặc biệt, một nửa của người khác, vv vốn chủ sở hữu Vốn chủ sở hữu của một tay hoặc một phạm vi là tỷ lệ phần trăm của nồi dự kiến sẽ giành được nếu tất cả cá cược là dừng lại và tất cả người chơi kiểm tra xuống Showdown. Tần số này được tính trung bình trên tất cả các thẻ mà có thể đến và tất cả các phạm vi liên quan. trò chơi Có một vài cách khác nhau để xác định một trò chơi tùy thuộc vào tình huống mà bạn muốn học. Về cơ bản, nó chỉ sẽ là một chuỗi các quyết định đó dẫn đến một số tiền chi trả tùy thuộc vào những gì bạn thực hiện các quyết định và quyết định những gì các cầu thủ khác thực hiện. Đó là, phần thưởng của bạn phụ thuộc vào quyết định của bạn cũng như các quyết định của những người khác. Đôi khi bạn có một tình huống, và bạn có thể làm cho một số quyết định, và kết quả chỉ phụ thuộc vào quyết định của riêng bạn (và có thể một số ngẫu nhiên từ thiên nhiên). Đây có thể là vấn đề thú vị, nhưng họ không phải là câu hỏi cho lý thuyết trò chơi. Đó là một thực tế là phần thưởng của bạn phụ thuộc vào quyết định của người khác quá mà đặt chúng tôi trong lĩnh vực lý thuyết trò chơi. Ví dụ, kéo giấy đá (RPS) là một trò chơi chỉ với một điểm quyết định, và ba phần thưởng có thể là: thắng, thua , hoặc cà vạt, tùy thuộc vào sự lựa chọn của bạn và của đối thủ của bạn lựa chọn. Chiến lược Chiến lược xác định làm thế nào bạn chọn di chuyển của bạn ở mọi điểm quyết định trong một trò chơi, đó là, ở mọi tình huống mà bạn có thể có thể phải đối mặt với trong trò chơi. chiến lược tinh khiết A tinh khiết chiến lược là một chiến lược xác định chính xác làm thế nào bạn sẽ chơi trong mọi tình huống bạn có thể phải đối mặt. Trong RPS, có ba chiến lược tinh khiết: ném đá, ném giấy, hoặc ném kéo. chiến lược hỗn hợp A chiến lược hỗn hợp là một trong đó liên kết với một số xác suất mỗi chiến lược tinh khiết có thể. Ví dụ, trong RPS, bạn có thể chơi một chiến lược hỗn hợp bằng cách sử dụng "ném đá" 60% thời gian và sử dụng "ném giấy" khác 40%. Đó là một ý tưởng tốt để chơi một chiến lược hỗn hợp trong RPS. Nó không phải là rõ ràng rằng điều này là cần thiết để thành công trong poker. chiến lược thống trị Một chiến lược là (đúng) chiếm ưu thế nếu có một chiến lược khác có thể đó là lợi nhuận nhiều hơn bất kể chiến lược đối thủ của bạn. Điều này thực sự không đưa ra quá thường xuyên trong poker, kể từ khi gần như bất cứ điều gì có thể là tốt nếu đối thủ cụ thể của bạn xảy ra để chơi đặc biệt kém chống lại nó. Một ví dụ từ hold'em là như sau: bất kỳ chiến lược có liên quan đến gấp các loại hạt trên sông là chi phối (ít nhất là trong một bối cảnh trò chơi tiền mặt, bỏ qua cái cào). Đặc biệt, nó bị chi phối bởi một chiến lược mà là giống ngoại trừ các loại hạt được chơi bằng cách nào đó khác hơn bằng cách gấp. Chiến lược thứ hai này sẽ có lợi nhuận hơn bất kể đối thủ của bạn chơi. + EV + EV là viết tắt của "giá trị kỳ vọng tích cực" hay "giá trị kỳ vọng cao hơn". Đây là mơ hồ cho một vài lý do. Thứ nhất, giá trị kỳ vọng? giá trị của những gì mong đợi? Thứ hai, cao hơn? cao hơn so với những gì? giá trị dự kiến chỉ có nghĩa là giá trị trung bình của một số lượng ngẫu nhiên. Trong poker, số lượng chúng tôi quan tâm (và mà chúng tôi đang quan tâm đến việc tối đa hóa) là kích thước của chip của chúng tôi stack. Tuy nhiên, khi thực hiện tính toán, chúng ta không luôn luôn tính toán kích thước trung bình hoặc dự kiến của chip của chúng tôi stack. Đôi khi chúng ta tính toán sự thay đổi dự kiến trong kích thước ngăn xếp của chúng tôi trong quá trình của bàn tay, bắt đầu từ đầu, và cố gắng làm cho sự lựa chọn đó maximze đó. Hoặc, đôi khi chúng ta tính toán sự thay đổi dự kiến trong kích thước ngăn xếp bắt đầu từ một số điểm cụ thể trong tay. Về cơ bản, nó không quan trọng mà cách bạn làm điều đó, miễn là bạn là phù hợp trong lựa chọn của bạn và rõ ràng về những gì bạn đang làm khi bạn viết một bài. Thứ hai, cao hơn so với những gì? Đôi khi người ta nói "cao hơn 0", nhưng điều đó không có nghĩa là bất cứ điều gì phụ thuộc vào kỳ vọng của chúng tôi đang xem xét. Những lần khác, mọi người đang ngụ ý "cao hơn so với EV của gấp nếu tôi tính toán với quy ước tương tự", nhưng điều đó có thể hoặc không có thể quan trọng trong bất kỳ tình huống cụ thể (ví dụ, nếu chúng ta thực sự quan tâm trong việc quyết định giữa gọi điện thoại và nâng cao ). Từ một quan điểm chiến lược, điều quan trọng là để chọn tùy chọn với một EV cao hơn so với tất cả các lựa chọn có thể khác của bạn. Vì vậy, nếu bạn đang tranh cãi rằng cái gì là "+ EV", hãy nói những gì nó là di chuyển ưa thích của bạn có một EV cao hơn, và nếu bạn viết ra EV phương trình, làm rõ những gì bạn đang tìm kiếm sự mong đợi của. đáp ứng tốt nhất chiến lược hay chiến lược hoặc kẻ thù chiến lược tối đa-bóc lột Giả sử tất cả các chiến lược đối thủ của bạn là cố định và bạn biết họ. Sau đó, bạn có thể tính toán một cách rất có lợi nhuận nhất để đối đầu với họ. Chiến lược tốt nhất này được biết đến như là một phản ứng tốt nhất hay một chiến lược tối đa-bóc lột. An (tưởng tượng) người chơi tự động biết chiến lược của bạn và luôn luôn đóng tối đa exploitatively trong phản ứng đôi khi ám chỉ như kẻ thù. cân bằng nash hoặc (lý thuyết trò chơi) chiến lược tối ưu hoặc chiến lược unexploitable Một cân bằng Nash là một tập hợp các chiến lược (một cho mỗi người chơi trong các trò chơi) với một vài thuộc tính. Các tính chất này là tương đương, họ chỉ cách nhìn khác nhau của cùng một điều: - Không có cầu thủ trong trò chơi đơn phương có thể thay đổi chiến lược của mình để nâng cao kỳ vọng của mình. - chiến lược của mỗi người chơi được tối đa khai thác những đối thủ của mình (s), tại cùng một lúc. Chú ý rằng không có gì về những định nghĩa này ngụ ý rằng các cầu thủ sẽ phá vỡ, thậm chí trung bình. Tuy nhiên, nó chỉ ra rằng trong poker, nếu tất cả các cầu thủ đang chơi chiến lược cân bằng của họ, họ sẽ phá vỡ ngay cả trong ý thức trung bình dài hạn khi chúng tôi trung bình trên tất cả các vị trí trong trò chơi. Sự tồn tại của một tập hợp các chiến lược như thế này có một số hậu quả đặc biệt (ít nhất là trong heads-up chơi!). Bất cứ khi nào người chơi không chơi chiến lược cân bằng của họ, và một cầu thủ được làm ra nhiều tiền hơn anh ta sẽ ở trạng thái cân bằng, và do đó khác đang ít hơn, sau đó anh chàng người đang thực hiện ít có động cơ để chuyển sang trạng thái cân bằng chiến lược của mình. Tuy nhiên, bất cứ khi nào cả hai cầu thủ đang chơi cân bằng, không có động lực để thay đổi. Vì vậy, nếu cả hai người chơi là hợp lý và đủ để tính toán cân bằng chiến lược thông minh, họ đó là những chiến lược cuối cùng họ sẽ chơi. Đó là chỉ sau đó không có bất kỳ động cơ để đi chệch. Bây giờ nó không phải là ngay lập tức rõ ràng rằng đó là một tập hợp các chiến lược tồn tại, nhưng John Nash đã chứng minh cho một lớp học của trò chơi bao gồm poker. Tất nhiên, biết rằng nó tồn tại là khác nhau hơn là hiểu biết chính xác nó là gì, và trong thực tế, chiến lược cân bằng là không rõ cho tất cả các trò chơi poker "thực sự". Nhưng họ chắc chắn tồn tại, và cũng có thể, điểm cân bằng cho các phiên bản rất đơn giản hóa của một số trò chơi được biết đến. Ví dụ, nếu SB được giới hạn chơi xô-hoặc lần preflop trong đầu lên không có giới hạn giữ 'em, sau đó trò chơi trở nên đơn giản hơn nhiều, và chúng ta có thể tìm thấy những xô nổi tiếng / lần trạng thái cân bằng có thể hữu ích cho ngắn chơi -stacked. Bất cứ chiến lược không cân bằng cũng có thể được ám chỉ như khai thác. Chú ý rằng, nếu bạn đang chơi unexploitably, nhưng sau đó bạn đã thay đổi chiến lược của bạn để tận dụng lợi thế của một số những sai lầm của đối thủ của bạn, sau đó bạn mình đang chơi exploitably, nhưng đó là OK nếu đối thủ của bạn không tận dụng lợi thế của nó. chiến lược cân bằng Nash còn được gọi là lý thuyết tối ưu hoặc trò chơi tối ưu hoặc GTO hoặc unexploitable. Thực tế là "tối ưu" không chỉ đơn giản có nghĩa là "bóc lột tối đa" thực sự có vẻ vấp người lên và do đó không may mắn, nhưng đó là ngôn ngữ các nhà toán học đã chọn, vì vậy chúng tôi đang mắc kẹt với nó. Việc sử dụng "tối ưu" hoặc "trò chơi lý thuyết tối ưu "để tham khảo các Nash Equilibrium xuất hiện được phần nào độc đáo để poker. Đó là nguồn gốc có thể từ cuốn sách "Toán học of Poker" mà sử dụng thuật ngữ theo cách này. Việc sử dụng này không xuất hiện để được phổ biến trong lý thuyết trò chơi và chắc chắn gây ra một số nhầm lẫn ở lần.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.