Các văn bản chú thích, chúng tôi lại xuyên lated vào XML để tạo thuận lợi cho việc tạo ra nhiều ws vie của xt te, cho Ví điện tử xam, phân loại theo nguồn cate đẫm máu, hoặc làm c ume nts mo de lc ONC EPT. Se NTE nc es là ces pro trước se d bởi rem oving punc tuation và ngăn chặn từ (bằng cách sử dụng t sẵn lis Clef Englis h từ vô nghĩa từ http://members.unine.ch/jacques.savoy/clef/englishST.txt) và loại bỏ những từ mà chỉ xảy ra trong một tài liệu. Chúng tôi không sử dụng xuất phát. Tất cả các từ được upcased.
đang được dịch, vui lòng đợi..
