Nhãn Bias Vấn đề
cổ điển automata xác suất (Paz, 1971), phân biệt
mô hình Markov (Bottou, 1991), entropy tối đa
người gắn thẻ (Ratnaparkhi, 1996), và MEMMs, cũng như
không xác suất mô hình gắn thẻ tự và phân đoạn
với đào tạo next- độc lập phân loại trạng thái (Punyakanok &
Roth, 2001) là tất cả các nạn nhân tiềm năng của các nhãn
vấn đề thiên vị.
Ví dụ, hình 1 là một hữu hạn nhà nước đơn giản
mô hình được thiết kế để phân biệt giữa hai từ xương sườn
và cướp. Giả sử rằng trình tự quan sát được ri b.
Trong thời gian bước đầu tiên, r phù hợp với cả hai chuyển từ
trạng thái bắt đầu, vì vậy khối lượng xác suất được phân phối gần
bằng nhau giữa hai quá trình chuyển đổi. Tiếp theo chúng ta quan sát tôi.
Cả hai trạng thái 1 và 4 chỉ có một chuyển tiếp đi. Nhà nước
1 đã nhìn thấy sự quan sát này thường trong đào tạo, nhà nước 4 đã gần như
không bao giờ nhìn thấy sự quan sát này; nhưng cũng giống như trạng thái 1, tiểu bang 4
không có sự lựa chọn nhưng để vượt qua tất cả khối lượng của nó để đi duy nhất của nó
chuyển tiếp, vì nó không phải là tạo ra những quan sát, chỉ có
điều trên đó. Do đó, các tiểu bang có một sự chuyển tiếp đi duy nhất
bỏ qua hiệu quả quan sát của họ. Tổng quát hơn,
các tiểu bang có entropy thấp tới phân bố trạng thái sẽ có ít
thông báo của các quan sát. Quay trở lại với ví dụ này, các
con đường trên và đường dẫn phía dưới sẽ về đều có khả năng,
độc lập của chuỗi quan sát. Nếu một trong những
hai từ này là hơi phổ biến hơn trong tập huấn luyện, các
hiệu ứng chuyển tiếp ra khỏi trạng thái bắt đầu sẽ hơi thích tương ứng của nó
chuyển đổi, và chuỗi nhà nước từ đó sẽ
luôn luôn giành chiến thắng. Hành vi này được chứng minh bằng thực nghiệm
trong phần 5.
L'eon Bottou (1991) thảo luận về hai giải pháp cho các nhãn
vấn đề thiên vị. Một là để thay đổi trạng thái phiên struc ture của mô hình. Trong ví dụ trên, chúng ta có thể sụp đổ
bang 1 và 4, và trì hoãn việc phân nhánh cho đến khi chúng tôi có được một phân biệt
quan sát. Hoạt động này là một trường hợp đặc biệt
của determinization (Mohri, 1997), nhưng determinization của
máy hữu hạn nhà nước có trọng không phải là luôn luôn có thể, và
ngay cả khi có thể, nó có thể dẫn đến sự bùng nổ tổ hợp.
Các giải pháp khác được đề cập là bắt đầu với một fullyconnected
mô hình và để cho các thủ tục đào tạo ra
một cấu trúc tốt. Nhưng điều đó sẽ ngăn cản việc sử dụng trước khi
kiến thức cơ cấu đã được chứng minh rất có giá trị trong thông tin
nhiệm vụ khai thác (Freitag & McCallum, 2000).
Giải pháp đúng yêu cầu mô hình chiếm toàn bộ
chuỗi nhà nước cùng một lúc bằng cách cho phép một số chuyển "bỏ phiếu"
mạnh mẽ hơn những người khác tùy thuộc vào tương ứng
quan sát. Điều này ngụ ý rằng điểm số khối lượng sẽ không được bảo tồn,
nhưng quá trình chuyển đổi thay vì cá nhân có thể "khuếch đại" hay
"làm yếu" của đại chúng mà họ nhận được. Trong ví dụ trên,
chuyển từ trạng thái khởi đầu sẽ có ảnh hưởng rất yếu
về số con đường, trong khi quá trình chuyển đổi từ trạng thái 1 và 4
sẽ có tác dụng mạnh hơn rất nhiều, khuếch đại hoặc giảm xóc
tùy thuộc vào quan sát thực tế, và một tỷ lệ
đóng góp cao hơn để việc lựa chọn các path.3 Viterbi
trong phần công việc liên quan, chúng tôi thảo luận về mô hình heuristic, khác
lớp mà chiếm chuỗi nhà nước chứ không phải trên toàn cầu so với
địa phương. Để tốt nhất của kiến thức của chúng tôi, CRFs là chỉ có
mô hình lớp học mà thực hiện điều này trong một khung cảnh hoàn toàn xác suất,
với đảm bảo toàn cầu hội tụ khả năng tối đa.
đang được dịch, vui lòng đợi..