20.3 chỉ số Phân phối
InSection4.4wedescribeddistributedindexing.Wenowconsiderthedistribution của chỉ số trên một cluster2 máy tính lớn có hỗ trợ truy vấn. Hai triển khai chỉ số thay thế rõ ràng cho bản thân: parti - tioning bởi các điều khoản, còn được gọi là tổ chức chỉ số toàn cầu, và phân vùng của tài liệu cũng được biết như là tổ chức chỉ số địa phương. Trong cựu, từ điển các thuật ngữ chỉ số được phân chia thành các tập con, mỗi tập con cư trú tại một nút. Cùng với các điều khoản tại một nút, chúng tôi giữ các thông tin đăng cho những điều khoản. Một truy vấn được chuyển đến các nút tương ứng với thuật ngữ truy vấn của nó. Về nguyên tắc, điều này cho phép truy cập đồng thời lớn hơn bởi vì một dòng các truy vấn với các thuật ngữ truy vấn khác nhau sẽ đánh bộ máy khác nhau. Trong thực tế, chỉ số phân vùng bằng các từ ngữ như hóa ra là không tầm thường. Truy vấn yêu cầu nhiều từ việc gửi thông tin đăng dài liệt kê giữa bộ nút cho việc sáp nhập, và các chi phí này có thể lớn hơn những concurrency.Load lớn cân bằng các phân vùng được điều chỉnh không phải bởi một tiên nghiệm phân tích các tần số tương đối dài, mà là do sự phân bố của thuật ngữ truy vấn và đồng lần xuất hiện của họ, có thể trôi theo thời gian hoặc thể hiện các vụ nổ bất ngờ. Đạt được các phân vùng tốt là một chức năng của sự hợp xuất hiện của thuật ngữ truy vấn và kéo theo các phân nhóm từ ngữ để tối ưu hóa các mục tiêu mà không phải là dễ dàng để định lượng. Cuối cùng, chiến lược này làm cho việc thực hiện các chỉ mục động khăn hơn fi sùng bái. Một thực hiện phổ biến hơn là phân chia bởi các văn bản: Mỗi nút chứa các chỉ số cho asubset của mọi tài liệu. Mỗi truy vấn được phân phối cho tất cả các nút, với có sults từ các nút khác nhau được sáp nhập trước khi trình bày cho người dùng. Chiến lược này được giao dịch đĩa địa phương hơn tìm cách cho ít liên nút giao. Một gặp khó khăn fi trong phương pháp này là số liệu thống kê toàn cầu sử dụng
2 Xin lưu ý sử dụng khác nhau của cụm ở những nơi khác trong cuốn sách này, trong ý nghĩa của các Chương 16 và 17.
đang được dịch, vui lòng đợi..
