Trong phần này, chúng tôi mô tả cách chúng tôi sử dụng phương pháp tiếp cận CODA để giải quyết hài hoà dữ liệu và hội nhập cho các HTSdatasets của phần II. Để thực hiện dự án này hài hòa,chúng tôi bắt đầu bằng cách điều tra cung cấp tài liệu dữ liệu đểxác định bản chất của các dữ liệu khác nhau có sẵn, xem cóbất kỳ commonalities ở dữ liệu ví dụ như miền địa phương và nhân khẩu học,những gì các phương pháp thu thập và làm thế nào họ khác nhau, tìm thấy bất kỳthiếu các trường dữ liệu, kiểm tra mức độ kết hợp và điều traNếu có bất kỳ sự khác biệt trong các thuật ngữ được sử dụng cho mỗisố liệu (bước 1 trong hình 1). Bước này đã đóng góp cho số lượng lớnchúng tôi chuẩn bị dữ liệu đối với nhiệm vụ làm sạch, tức là xác định vàloại bỏ bất kỳ mâu thuẫn. Đó là một bước quan trọng như là sự thành công và thất bại của dữ liệu tích hợp khung phụ thuộctrên sự hiểu biết ý nghĩa context-sensitive các dữ liệu và cácchất lượng của các dữ liệu [21]. Quá trình làm sạch này có thể đôi khiđi lên đến 80 phần trăm của tác phẩm [22].
đang được dịch, vui lòng đợi..
