Tài liệu Lấy từ nguồn như Wikipedia hoặc hội đồng quản trị trực tuyến thảo luận Usenet thường có lựa chọn từ phản ánh các chủ đề được thảo luận, ví dụ, các từ "kết cụm" là rất có khả năng xuất hiện trong một tài liệu về khoa học máy tính"" hơn một về các chủ đề xe máy.Đưa ra bộ sưu tập của các từ trong một tài liệu, nó nên có thể để dự đoán những gì tiêu đề nó được chứa trong.-Dữ liệu: Usenet bộ dữ liệu, số liệu nhỏ Wikipedia.-Công việc: Tìm kiếm các bài viết tương tự như một ví dụ, hoặc phân chia bộ dữ liệu thành các cụm.-Phương pháp: không có giám sát học tập, k-có nghĩa là, cấp LDA cải, quang phổ clustering
đang được dịch, vui lòng đợi..
