Các hoạt động cơ bản là như sau: một khách hàng (chẳng hạn như một trình duyệt) sẽ gửi một yêu cầu http đến một máy chủ web. Các trình duyệt specifies một URL (đối với các đại lý phổ resourceURL) chẳng hạn như http://www.stanford.edu/home/atoz/contact.html. Trong này ví dụ URL, Chuỗi http đề cập đến các giao thức được sử dụng để truyền dữ liệu. Chuỗi www.stanford.edu được gọi là các tên miền và specifies gốc rễ của một hệ thống phân cấp của các trang web (thường phản ánh một hệ thống phân cấp filesystem tiềm ẩn các máy chủ web). Trong ví dụ này, /home/atoz/contact.html là một con đường trong hệ thống phân cấp này với một contact.htmlthatcontainstheinformationtobereturnedbythewebserver gỡ tại www.stanford.edu để đáp ứng với yêu cầu này. Thư mã hoá HTML gỡ contact.htmlholdsthehyperlinksandthecontent (inthisinstance, các thông tin liên hệ cho trường đại học Stanford), cũng như định dạng quy tắc cho renderingthiscontentinabrowser. Suchanhttprequestthusallowsustofetchthe các nội dung của một trang, một cái gì đó mà sẽ chứng minh là hữu ích cho chúng tôi để thu thập dữ liệu và lập chỉ mục tài liệu (chương 20).
đang được dịch, vui lòng đợi..
