The algorithm is best explained wit

The algorithm is best explained with an example, which is given in Fig.9.43. In this figure, page 1 on the left (in HTML code) is the initial wrapper. Page 2 on the right is a new page to be matched with page 1.
Let us look at some matches and mismatches. Lines 13 of both pages are the same and thus match. Lines 4 of both pages are text strings and are different. They are thus data items to be extracted. We go down further. Lines 6 of the pages do not match. Line 6 of page 1 matches line 7 of page 2. Thus, is likely to be optional. Line 11 of page 1 and line 12 of page 2 give another mismatch. Since they are text strings, they are thus data items to be extracted. Line 17 of page 1 and line 18 of page 2 are also data items. Another mismatch occurs at line 19 of page 1 and line 20 of page 2. Further analysis will find that we have a list here. The final refined regular expression wrapper is given at the bottom of Fig. 9.43.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Các thuật toán tốt nhất là giải thích với một ví dụ, được đưa ra trong Fig.9.43. Trong hình này, trang 1 trên bên trái (trong mã HTML) là các wrapper ban đầu. Trang 2 trên bên phải là một trang mới để phù hợp với trang 1.Chúng ta hãy nhìn vào một số trận đấu và mismatches. Dòng 13 của cả hai trang này đều giống nhau và do đó phù hợp. Dòng 4 của cả hai trang này là các chuỗi ký tự và là khác nhau. Họ là như vậy, các mục dữ liệu cần được trích xuất. Chúng tôi đi xa hơn. Dòng 6 các trang không phù hợp. Dòng 6 Trang 1 trận dòng 7 trang 2. Vì vậy, có khả năng là tùy chọn. Dòng 11 trang 1 và trang 2 dòng 12 cung cấp cho một mismatch. Vì chúng là các chuỗi ký tự, chúng là như vậy, các mục dữ liệu cần được trích xuất. Dòng 17 trong số trang 1 và dòng 18 trang 2 cũng là bản ghi dữ liệu. Mismatch khác xảy ra tại đường 19 trang 1 và dòng 20 trang 2. Tiếp tục phân tích sẽ thấy rằng chúng tôi có một danh sách ở đây. Wrapper cuối cùng biểu hiện tinh thường xuyên được đưa ra ở dưới cùng của hình 9.43.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Các thuật toán được giải thích tốt nhất với một ví dụ, được đưa ra trong Fig.9.43. Trong hình này, trang 1 bên trái (trong HTML code) là wrapper ban đầu. Trang 2 trên bên phải là một trang mới để được xuất hiện với trang 1.
Chúng ta hãy xem xét một số trận đấu và bất xứng. Dòng 13 của cả các trang đều giống nhau và vì thế trận đấu. Dòng 4 của cả hai trang là chuỗi văn bản và là khác nhau. Họ là như vậy, các mục dữ liệu được trích xuất. Chúng tôi đi xuống hơn nữa. Dòng 6 của các trang không phù hợp. Dòng 6 của trang 1 trận đấu xếp hàng 7 trang 2. Như vậy, có khả năng là tùy chọn. Dòng 11 của trang 1 và dòng 12 trang 2 cho phù hợp khác. Vì họ là những chuỗi văn bản, họ là như vậy, các mục dữ liệu được trích xuất. Line 17 của trang 1 và dòng 18 trang 2 cũng là mục dữ liệu. Không phù hợp khác xảy ra tại dòng 19 của trang 1 và dòng 20 trang 2. Phân tích sâu hơn sẽ thấy rằng chúng tôi có một danh sách ở đây. Các thức tinh wrapper biểu hiện thường xuyên được đưa ra ở dưới đáy của hình. 9.43.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.