CorpusPedia
Bước đầu tiên của phương pháp của chúng tôi bao gồm trong việc chuyển đổi các
tập tin nguồn của Wikipedia để một bộ các tập tin với một nhiều
cấu trúc XML thân thiện và dễ sử dụng: CorpusPedia. Đối với
mục đích này, chúng tôi phát triển các công cụ nhằm mục đích để tự động
tải về Wikipedia trong các ngôn ngữ được yêu cầu và sau đó
áp dụng các quá trình chuyển đổi các tập tin XML đã download
vào các tập tin XML mới của CorpusPedia. Trong phần tiếp theo,
chúng ta sẽ so sánh cấu trúc của hai định dạng.
đang được dịch, vui lòng đợi..
