Trong khi lúng túng là một chỉ số chất lượng, nó không thực sự
đo lường hiệu quả tại các nhiệm vụ ghi bàn chúng tôi là cuối cùng
quan tâm. Đặc biệt, nó không đưa vào tài khoản
các hạn chế của việc lựa chọn một phản ứng trong R. Do đó, chúng tôi
cũng đánh giá các mô hình trên một phản ứng xếp hạng nhiệm vụ: cho mỗi
N cặp báo test (o; r) trong đó r 2 R, chúng tôi tính toán
s = P (rjo) và 8I xi = P (wijo), nơi wi là phần tử thứ i
của R. Sau đó chúng tôi sắp xếp các bộ R = fs; x1; :::; xNg tự giảm dần
theo thứ tự. Cuối cùng, chúng ta định nghĩa ranki = argminj (RjjRj = s). Đặt
đơn giản, chúng tôi đang tìm kiếm thứ hạng của các phản ứng thực tế với
sự tôn trọng cho tất cả các yếu tố trong R.
đang được dịch, vui lòng đợi..
