3.2 Xác định đạo văn trong văn bản bằng văn bản Xác định đạo văn của sinh viên trong văn bản bằng văn bản là bình thường xuống các gia sư khóa học hoặc người giám sát học sinh. Nếu họ đã quen thuộc với phong cách viết của học sinh, họ có thể xác định những bất thường trong công việc của học sinh so với công việc trước đây, hay sự khác biệt bất thường trong ngôn ngữ hay từ vựng được sử dụng. Ban đầu bằng cách xác định mâu thuẫn trong quyền tác giả, đạo văn tiềm năng có thể được nêu bật. Tìm kiếm thêm sau đó có thể được thực hiện để tìm ra nguồn.
Một số phương pháp đã được thảo luận để phát hiện đạo văn nói chung. Yếu tố khác mà có thể được sử dụng để phân biệt tác giả của văn bản được viết và phát hiện đạo văn bao gồm:
• Sử dụng các từ vựng - phân tích các từ vựng được sử dụng cho việc chuyển nhượng đối với từ vựng trước có thể giúp xác định xem một học sinh đã viết văn bản. Tìm một số lượng lớn các từ vựng mới (đặc biệt là vốn từ vựng nâng cao hơn) có thể giúp xác định xem một học sinh đã viết một cách hợp pháp văn bản. • Những thay đổi của từ vựng - nếu các từ vựng được sử dụng thay đổi đáng kể trong một văn bản duy nhất, điều này có thể chỉ ra một cắt-và-dán có thể đạo văn. • văn bản rời rạc - nếu dòng chảy của một văn bản không phù hợp hoặc mịn, điều này có thể chỉ ra các tác giả đã hoặc không bằng văn bản với tư tưởng hay nhất quán hoặc một phần của văn bản không phải là công việc của riêng mình. • Dấu phân cách - nó không chắc rằng hai tác giả sẽ sử dụng dấu chấm câu trong cách chính xác như nhau (thậm chí nếu dạy ngữ pháp tiếng Anh tương tự). • Số tiền giống nhau giữa các văn bản - sẽ luôn có một số tiền nhất định của sự tương tự giữa các văn bản viết về cùng một chủ đề như tên, thuật ngữ miền cụ thể, vv Tuy nhiên, nó không chắc rằng bản văn viết độc lập sẽ chia sẻ số lượng lớn cùng một hoặc văn bản tương tự. • lỗi chính tả thông thường - một tính năng rõ ràng để sử dụng. Nó là rất không chắc rằng bản văn viết độc lập sẽ có những lỗi chính tả giống nhau, hoặc cùng một số sai lầm. • Phân phối các từ - không chắc rằng việc phân phối sử dụng từ khắp các văn bản độc lập sẽ là như nhau. Ví dụ, có giá trị tham số cho cùng một phân bố thống kê được sử dụng để mô tả sử dụng lâu. • Cấu trúc cú pháp của văn bản - đó có thể là dấu đạo văn mà đã xảy ra nếu hai văn bản chia sẻ chính xác các cấu trúc cú pháp tương tự. Có khả năng là các quy tắc cú pháp phổ biến nhất được sử dụng bởi các tác giả riêng biệt sẽ là khác nhau. • chuỗi dài của văn bản thông thường - nó là không có văn bản được viết một cách độc lập (thậm chí về cùng một chủ đề) sẽ chia sẻ chuỗi dài của ký tự liên tiếp hay nói cách chung. • Trình tự tương đồng giữa văn bản - nếu thứ tự của từ hoặc cụm từ phù hợp giữa hai văn bản là như nhau trong cả hai văn bản này có thể chỉ đạo văn. Mặc dù đã dạy để trình bày các sự kiện một cách nào đó (ví dụ như giới thiệu, cơ thể thì kết luận), nó ít có khả năng là các sự kiện tương tự sẽ được báo cáo trong cùng một thứ tự. • Sự phụ thuộc vào các từ và cụm từ nhất định - một tác giả có thể thích sử dụng những từ hoặc cụm từ cụ thể. Phù hợp sử dụng các từ và cụm từ trong một văn bản được viết bởi một người nào đó khác với ưu đãi từ khác nhau có thể chỉ đạo văn. • Tần số của từ - nó không chắc rằng những lời từ hai văn bản độc lập sẽ được sử dụng với các tần số tương tự. • Ưu tiên cho việc sử dụng / câu ngắn dài - tác giả có thể mà không biết có một chiều dài câu ưa thích đó sẽ là không bình thường kết hợp với các tính năng khác. • Khả năng đọc của văn bản văn bản - bằng cách sử dụng các số liệu như các chỉ số Gunning FOG, các Flesch Reading Dễ Formula hoặc chỉ số khói có thể giúp xác định một số điểm dễ đọc cho một tác giả cụ thể. Một lần nữa, không chắc rằng tác giả khác nhau sẽ chia sẻ cùng một số điểm.
đang được dịch, vui lòng đợi..
