VÍ DỤ 10 Web Spiders Để trang web chỉ số, công cụ tìm kiếm như Google và Yahoo có hệ thống
khám phá Web bắt đầu từ các trang web nổi tiếng. Những công cụ tìm kiếm sử dụng các chương trình gọi là nhện Web
(hay crawlers hay chương trình) để thăm các trang web và phân tích nội dung của họ. Web nhện sử dụng cả hai sâu-đầu tiên
tìm kiếm và bề rộng-đầu tiên tìm kiếm để tạo ra indices.As mô tả trong ví dụ 5 trong Mục 10.1,
các trang web và các liên kết giữa chúng có thể được mô hình hóa bởi một đồ thị có hướng gọi là đồ thị Web.
Các trang Web được đại diện bởi các đỉnh và các liên kết được biểu diễn bằng các cạnh đạo. Sử dụng depth-
tìm kiếm đầu tiên, một trang web ban đầu được chọn, một liên kết được tiếp nối đến một trang web thứ hai (nếu có
như vậy một liên kết), một liên kết trên trang web thứ hai là tiếp đến một trang web thứ ba, nếu có như vậy một
liên kết, và như vậy, cho đến khi một trang không có liên kết mới được tìm thấy. Quay lui sau đó được sử dụng để kiểm tra các liên kết ở cấp độ trước đó để tìm các liên kết mới, và như vậy. (Do hạn chế của thực tế, Web
nhện có giới hạn độ sâu họ tìm kiếm trong tìm kiếm theo chiều sâu.) Sử dụng tìm kiếm theo chiều rộng, một
trang web ban đầu được lựa chọn và một liên kết trên trang này được theo sau đến một trang web thứ hai, sau đó một
liên kết thứ hai trên trang đầu tiên được theo sau (nếu nó tồn tại), và như vậy, cho đến khi tất cả các liên kết của các đầu
trang có được tuân thủ. Sau đó liên kết trên các trang dưới một cấp được theo sau, từng trang,
và như vậy.
đang được dịch, vui lòng đợi..
![](//viimg.ilovetranslation.com/pic/loading_3.gif?v=b9814dd30c1d7c59_8619)