Các mô hình túi-of-từ là một đại diện đơn giản hóa được sử dụng trong xử lý ngôn ngữ tự nhiên và truy xuất thông tin (IR). Trong mô hình này, một văn bản (chẳng hạn như một câu hoặc một tài liệu) được biểu diễn như là các túi (MultiSet) của lời nói của mình, bất chấp ngữ pháp và thậm chí từ đơn đặt hàng nhưng giữ đa. Gần đây, các mô hình túi-of-lời cũng đã được sử dụng cho các máy tính tầm nhìn. [1] Các mô hình túi-of-từ thường được sử dụng trong phương pháp phân loại tài liệu, nơi (tần số) xuất hiện của mỗi từ được sử dụng như một tính năng để đào tạo một phân loại. Một tham chiếu sớm để "túi của các từ" trong một bối cảnh ngôn ngữ có thể được tìm thấy vào năm 1954 bài viết Zellig Harris về kết cấu mặt phân phối
đang được dịch, vui lòng đợi..