Vắt được áp dụng cho các câu liên tiếp trong ngữ liệu, và việc phải lấy kết quả được thu thập.
Các hệ thống mở IE đầu tiên là TEXTRUNNER [Banko et al., 2007], trong đó sử dụng một mô hình Naive Bayes với POS unlexicalized và các tính năng NP-đoạn, được đào tạo sử dụng các ví dụ heuristically tạo ra từ Penn Treebank. Công việc tiếp theo cho thấy rằng sử dụng một tuyến tính chuỗi CRF [Banko và Etzioni, 2008] hoặc Markov logic Mạng [Zhu et al., 2009] có thể dẫn đến nhổ cải thiện. Các hệ thống WOE đã sử dụng Wikipedia như một nguồn dữ liệu huấn luyện cho nhổ của họ, dẫn đến những cải tiến hơn nữa trong TEXTRUNNER
đang được dịch, vui lòng đợi..