Sự tăng trưởng của người sử dụng điện thoại di động đã dẫn đến một kịch tính
ngày càng tăng của thư rác tin nhắn SMS. Trong thực tế, chống thư rác điện thoại di động là rất khó bởi nhiều yếu tố, bao gồm cả
tỷ lệ thấp hơn của SMS đó đã cho phép nhiều người sử dụng và dịch vụ
cung cấp để bỏ qua vấn đề này, và sự sẵn có hạn chế về
điện thoại di động phần mềm lọc thư rác. Mặt khác,
trong môi trường học thuật, một cản trở lớn nhất là sự khan hiếm của
các tập dữ liệu thư rác tin nhắn SMS nào, mà vô cùng cần thiết để xác nhận và so sánh các phân loại khác nhau. Hơn nữa,
như tin nhắn SMS là khá ngắn, các bộ lọc thư rác dựa trên nội dung có thể có hiệu suất của họ bị suy thoái. Trong bài báo này,
chúng tôi cung cấp một bộ sưu tập thư rác thực, công khai và không được mã hóa tin nhắn SMS mới là lớn nhất một xa như chúng ta biết. Hơn nữa,
chúng tôi so sánh hiệu suất đạt được nhiều thành lập
các phương pháp học máy. Kết quả chỉ ra rằng Support Vector Machine nhanh hơn so với phân loại đánh giá khác
, và do đó, nó có thể được sử dụng như một cơ sở tốt để biết thêm
so sánh
đang được dịch, vui lòng đợi..
