Tóm tắtBài báo này giới thiệu "Slug" một trình thu thập web (hay "Scutter") được thiết kế cho thu hoạch web ngữ nghĩanội dung. Thực hiện trong Java bằng cách sử dụng Jena API, Slug cung cấp một khuôn khổ cấu hình, mô-đuncho phép một mức độ lớn của sự linh hoạt trong cấu hình phục hồi, xử lý và lưu trữnội dung thu hoạch. Khuôn khổ cung cấp một từ vựng RDF cho mô tả thu thập thông tincấu hình và thu thập siêu dữ liệu liên quan đến hoạt động thu thập. Thu thập thông tin siêu dữ liệu cho phépbáo cáo và phân tích của bò tiến độ, lấy hiệu quả hơn thông qua việc lưu trữcủa HTTP bộ nhớ đệm dữ liệu.
đang được dịch, vui lòng đợi..