Phương pháp này giải quyết được vấn đề thứ hai ở trên bằng cách cắt tỉa đi những bộ nhãn xảy ra ít hơn một ngưỡng người dùng định nghĩa và thường thay thế chúng bằng cách giới thiệu tập con rời nhau của các nhãn bộ mà là thường xuyên hơn (lớn hơn ngưỡng) trong data.is
đang được dịch, vui lòng đợi..
