sublinear Liên quan văn bản kích thước đến IndexingĐánh giá: Những gì là mục đích của một chỉ số và làm thế nào nó được thực hiện? Dựa trên: "Phụ lục một: tổ chức tập tin và lưu trữ cấu trúc"Xử lý văn bản: bộ sưu tập lớn các văn bản được thường xuyên lập chỉ mục bằng cách sử dụng đảo ngược các tập tin. Một vector khác biệt từ các hình thức một vốn từ vựng, với liên kết đến một danh sách tất cả các tài liệu có chứa các xuất.Chỉ số có thể được nén để cho phép truy cập nhanh hơn. (Thảo luận điều này với Ch.7.)Dịch:
đang được dịch, vui lòng đợi..
