Các tính năng một thu thập thông tin sẽ cung cấpPhân phối: Thu thập nên có khả năng thực hiện trong một thời trang phân phối trên nhiều máy tính.Khả năng mở rộng: Kiến trúc thu thập thông tin nên cho phép mở rộng tỷ lệ thu thập dữ liệu bằng cách thêm phụ máy và băng thông.Hiệu suất và hiệu quả: Hệ thống thu thập dữ liệu sẽ làm cho hiệu quả sử dụng tài nguyên hệ thống khác nhau bao gồm bộ vi xử lý, lưu trữ và băng thông mạng.Chất lượng: Cho rằng một phần đáng kể của tất cả các trang web của người nghèo util¬ity để phục vụ người sử dụng truy vấn nhu cầu, các trình thu thập sẽ được thiên vị về hướng lấy "hữu ích" trang đầu tiên.Thể trạng: Trong nhiều ứng dụng, các trình thu thập nên hoạt động trong chế độ continu¬ous: nó phải có được các bản sao tươi của trang đã tải trước đó. Một tìm kiếm trình thu thập, ví dụ, có thể do đó đảm bảo rằng chỉ số tìm en¬gine có một đại diện khá hiện tại của mỗi trang web được lập chỉ mục. Cho thu thập liên tục như vậy, một trình thu thập sẽ có thể thu thập thông tin một trang với một tần số xấp xỉ mức độ thay đổi của trang đó.Mở rộng: Thu thập thông tin cần được thiết kế để được mở rộng trong nhiều cách - đối phó với định dạng dữ liệu mới, mới lấy giao thức, và như vậy. Điều này đòi hỏi rằng thu thập thông tin kiến trúc được mô-đun.
đang được dịch, vui lòng đợi..
