Hầu hết các nghiên cứu variational quy mô lớn trước đây bằng cách sử dụng phương tiện truyền thông xã hội đã tập trung vào biến thể chính tả và từ vựng đánh dấu của phương ngữ. Chúng ta là không có ngoại lệ. Tuy nhiên, biến thể ngôn cũng thể hiện ở mức độ hình Thái, cú pháp. Để tìm hiểu sự thay đổi này, chúng tôi cũng chú thích một số dữ liệu với một phần của bài phát biểu (POS) thẻ, bằng cách sử dụng hai NLP hệ thống. Cách tiếp cận này cho thấy một thách thức nghiêm trọng của phương pháp luận: câu có tính năng AAVE được kết hợp với giảm đáng kể trong hiệu suất tagger.
đang được dịch, vui lòng đợi..
