Tài liệu Lấy từ các nguồn như Wikipedia hoặc hội đồng quản trị trực tuyến thảo luận Usenet thường cólựa chọn từ các chủ đề được thảo luận, ví dụ, từ "cụm" phản ánh rất nhiềunhiều khả năng để hiển thị trong một tài liệu về khoa học máy tính"" hơn một về các chủ đề xe máy.Đưa ra bộ sưu tập của các từ trong một tài liệu, nên có thể để dự đoán những gì tiêu đề nóchứa trong.-Dữ liệu: Usenet bộ dữ liệu, số liệu nhỏ Wikipedia.-Công việc: Tìm kiếm các bài viết tương tự như một ví dụ, hoặc phân chia bộ dữ liệu thành các cụm.-Phương pháp: không có giám sát học tập, k-có nghĩa là, cấp LDA cải, quang phổ clustering.
đang được dịch, vui lòng đợi..