Trong máy tính, ngăn chặn từ là những từ được lọc ra trước hoặc sau khi xử lý dữ liệu ngôn ngữ tự nhiên (văn bản). [1] Mặc dù từ dừng thường tham khảo các từ phổ biến nhất trong một ngôn ngữ, không có danh sách phổ quát duy nhất của từ dừng sử dụng bởi tất cả các công cụ xử lý ngôn ngữ tự nhiên, và thực sự không phải tất cả các công cụ thậm chí sử dụng một danh sách như vậy. Một số công cụ đặc biệt tránh loại bỏ các từ dừng để hỗ trợ cụm từ tìm kiếm.
Bất kỳ nhóm các từ có thể được chọn làm từ dừng cho một mục đích nhất định. Đối với một số công cụ tìm kiếm, đây là một trong những, từ chức năng ngắn phổ biến nhất, chẳng hạn như, là, ở, trong đó, và về. Trong trường hợp này, dừng lại lời nói có thể gây ra vấn đề khi tìm kiếm các cụm từ mà bao gồm họ, đặc biệt là ở những cái tên như "The Who", "The", hay "Take That". Công cụ tìm kiếm khác loại bỏ một số từ ngữ trong đó phổ biến nhất từ vựng, chẳng hạn như "muốn" -Từ một truy vấn để cải thiện hiệu suất. [2]
Hans Peter Luhn, một trong những người tiên phong trong tìm kiếm thông tin, được ghi nhận với danh xưng các cụm từ và sử dụng các khái niệm. [3] Cụm từ "dừng từ", mà không phải là năm 1959 trình bày Luhn, và các điều khoản liên quan đến "danh sách cửa" và "stoplist" xuất hiện trong các tài liệu ngay sau đó. [4]
Một khái niệm tiền nhiệm đã được sử dụng trong việc tạo ra một số Sách dẫn. Ví dụ, sự phù hợp Hebrew đầu tiên, Me'ir Nativ, chứa một danh sách một trang chữ unindexed, với nhiều giới từ và liên từ nonsubstantive mà là tương tự như từ dừng hiện đại. [5]
đang được dịch, vui lòng đợi..
