GIỚI THIỆU
Hầu hết các nghiên cứu corpus dựa trên dựa ngầm hay rõ ràng về khái niệm thể loại hoặc các khái niệm liên quan đến đăng ký, loại văn bản, tên miền, phong cách, sublanguage, hình thức tin nhắn, và vv. Có rất nhiều rắc rối xung quanh các điều khoản và sử dụng của họ, như bất cứ ai đã làm bất kỳ số lượng nghiên cứu ngôn ngữ biết. Mục đích của bài viết này là do hai lần. Đầu tiên tôi sẽ cố gắng để phân biệt giữa các điều khoản bởi vì tôi cảm thấy nó quan trọng là chỉ ra những sắc thái khác nhau về ý nghĩa và định hướng lý thuyết nằm đằng sau việc sử dụng chúng. Sau đó tôi mô tả một nỗ lực nhằm phân loại 4,124 văn bản trong Quốc Corpus Anh (BNC) về nghĩa rộng của thể loại, để cung cấp cho các nhà nghiên cứu và giáo viên ngôn ngữ một con đường tốt hơn về cách tiếp cận với BNC để làm tất cả các loại ngôn ngữ và nghiên cứu sư phạm.
phân loại nội dung: thể loại, Sổ đăng ký, Tên miền, Styles, các loại văn bản, & Nhầm lẫn khác
Tại sao nó quan trọng để biết những điều khoản khác nhau có ý nghĩa, và tại sao nên Corpus văn bản được xếp vào thể loại? Câu trả lời ngắn gọn là giáo viên dạy tiếng và các nhà nghiên cứu cần phải biết chính xác những gì loại ngôn ngữ mà họ đang kiểm tra hoặc mô tả. Hơn nữa, hầu hết thời gian chúng tôi muốn để đối phó với một thể loại cụ thể hoặc một tập thể quản lý được các thể loại, để chúng ta có thể xác định phạm vi của bất kỳ khái quát, chúng tôi thực hiện. Cảm giác của tôi là thể loại là mức độ phân loại văn bản mà là về mặt lý thuyết và sư phạm hữu ích và thiết thực nhất để làm việc với hầu hết, mặc dù phân loại của miền cũng rất quan trọng (xem thảo luận bên dưới). Có như vậy, là một nhu cầu thực sự cho corpora chung quy mô lớn như BNC dán nhãn rõ ràng và phân loại văn bản trong một cách tạo điều kiện mô tả ngôn ngữ và nghiên cứu, ngoài
đang được dịch, vui lòng đợi..