Hơn nữa, Δ Pr (s | a, σi) −≤ ∥ Δ Pr (s | a, σi) ∥implies rằng, z cho trước, enforceability với trách nhiệm hữu hạn hai mặt sau từ enforceability với trách nhiệm hữu hạn một mặt. Để tiết kiệm trên trách nhiệm của mình, trong môi trường một mặt hiệu trưởng tối ưu chọn người để thưởng, trong khi trong môi trường hai mặt, ông có thể thưởng và trừng phạt đại lý độc lập
đang được dịch, vui lòng đợi..
