Liên kết sauCon nhện sẽ xem xét các trang web và theo các liên kết đến các nội dung khác-nhữnggiống như cách bạn làm trong trình duyệt của bạn. Khi con nhện sẽ kiểm tra trang,nó thấy mã ngôn ngữ đánh dấu siêu văn bản (HTML) cho thấy một liên kết đếnmột trang khác (xem triển lãm 3-6)-cùng một mã HTML mã số mà trình duyệt của bạnđịnh dạng để hiển thị cho bạn các trang.© 2008 DK xuất bản 375 Hudson St. New York, NY 10014. Tất cả các quyềndành riêng.Triển lãm 3-6 như thế nào thu thập theo các liên kết. Mỗi nhện nhìn thấy cùng một mã HTMLMã rằng trình duyệt của bạn nhìn thấy và có thể làm theo các liên kết đến các trang khác.128Con nhện mãi lên HTML cho mỗi trang, ghi nhận các liên kết đến các trang khácVì vậy, nó có thể trở lại để thu thập các mã HTML của các trang đó sau này. Bạn có thểHãy tưởng tượng rằng, được đưa ra đủ thời gian, một con nhện có thể cuối cùng tìm thấy mỗi trang trênCác trang web (hoặc ít nhất mỗi trang được liên kết đến một trang khác). Quá trình nàynhận được một trang, việc tìm kiếm tất cả các liên kết trên trang đó, và sau đó nhận được nhữngTrang, được gọi là thu thập dữ liệu các trang web. Sau đó trong chương này, chúng tôi giải thíchcon nhện không với HTML nó thu thập từ tất cả những trang đónó thu thập dữ liệu.Trang web của tổ chức bạn không nghi ngờ gì được biết đến công cụ tìm kiếmnhện, và bạn chắc chắn có một số trang được liệt kê trong chỉ mục tìm kiếm của họ.Nhưng bạn có thể không có càng nhiều của các trang của bạn được liệt kê như bạn nghĩ, và bất kỳtrang đó không phải là trong chỉ mục không bao giờ có thể được tìm thấy bằng công cụ tìm kiếm. Vì vậy, nóquan trọng là phải có nhiều trang trong chỉ mục càng tốt. Chương 7, "GetCủa bạn nội dung liệt kê,"cho bạn thấy làm thế nào để tìm ra bao nhiêu tranglập chỉ mục từ các trang web của tổ chức bạn và một số cách đơn giản để có được nhiều hơnchúng lập chỉ mục.Nhớ liên kếtSau liên kết là rất quan trọng bởi vì nó là cách tốt nhất cho một con nhện đểtoàn diện, thu thập dữ liệu các trang web. Nhưng điều quan trọng cho một lý do khác, quá.Nhện phải cẩn thận danh mục mỗi liên kết mà họ tìm thấy — kiểm tra các trangliên kết đến trang web của bạn và kiểm tra các từ Hiển thị mô tả liên kết(văn bản neo). Trước đó trong chương này, chúng tôi đã thảo luận làm thế nào công cụ tìm kiếmkết quả tìm kiếm xếp hạng; họ làm như vậy với các thông tin này. Triển lãm 3-7 cho thấy như thế nàospiders thu thập thông tin liên kết là rất quan trọng để xếp hạng cáckết quả.
đang được dịch, vui lòng đợi..