Bảng 1 cho thấy các giá trị tương quan trong mọi trường hợp. Chúng tôi nhận thấy rằng việc tăng kích thước của vector từ cải thiện khả năng của họ để nắm bắt tính chất ngữ nghĩa của các từ. Các kết quả trên cho thấy ít hơn d = 200 chiều sẽ có thể là một lựa chọn không tồi cho bất kỳ nhiệm vụ NLP. Do khả năng tính toán hạn chế, chúng tôi không thể hoàn thành thí nghiệm của chúng tôi với 500 và 1000 đại diện vector chiều. Chúng tôi cũng đã tính toán sự tương quan Spearman và Kendall-Tàu trong từng
trường hợp và đã quan sát các xu hướng tương tự trong tất cả các trường hợp
đang được dịch, vui lòng đợi..
