Nội dung
1 Giới thiệu 1
1.1 Động lực. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2 Vấn đề mô tả 3
sự cố 2.1 Dự án. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32,2 phương pháp tiếp cận hiện tại. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42.3 Cấu trúc luận án. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Phân tích 7
3.1 phần dự án. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73.1.1 Clustering khuôn khổ. . . . . . . . . . . . . . . . . . . . . . . . . . . 73.1.2 chức năng cách và phân tích văn bản. . . . . . . . . . . . . . . . . . . . 73.1.3 Cấu trúc dữ liệu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83.1.4 Interoperability mã. . . . . . . . . . . . . . . . . . . . . . . . . . . . 83.1.5 Giao diện người dùng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83,2 Clustering. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93.2.1 Các thuật toán. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93.2.1.1 K-means. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93.2.1.2 phân nhóm thứ bậc. . . . . . . . . . . . . . . . . . . . . . 113.2.1.3 Fuzzy C-means. . . . . . . . . . . . . . . . . . . . . . . . . . 123.2.1.4 Kết luận. . . . . . . . . . . . . . . . . . . . . . . . . . . . Trường hợp 133.2.2 dữ liệu đại diện. . . . . . . . . . . . . . . . . . . . . . . 143.2.3 khoảng cách đo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.2.4 tin nhắn email. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.2.5 Tài liệu clustering. . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.2.5.1 tokenization. . . . . . . . . . . . . . . . . . . . . . . . . . . Bảng xếp hạng kỳ 173.2.5.2 và TF-IDF. . . . . . . . . . . . . . . . . . . 173.2.5.3 Cosine biện pháp. . . . . . . . . . . . . . . . . . . . . . . . . 173.2.6 eM Client. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4 Thiết kế 21
4.1 Cấu trúc phân nhóm agglomerative. . . . . . . . . . . . . . . . . . . . . . . 214.2 tin nhắn email. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234,3 liệu tính năng chẳng hạn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234,4 Tiêu phân tích. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 VII
đang được dịch, vui lòng đợi..