Mục đích của nghiên cứu thực hiện trong luận án này là để giải nén bệnh và rối loạn têntừ văn bản lâm sàng. Chúng tôi sử dụng có điều kiện Random Fields (CRF) là phương pháp chính đểnhãn bệnh và các rối loạn trong lâm sàng câu. Chúng tôi sử dụng một số công cụ khác chẳng hạn nhưMetaMap và Stanford lõi NLP công cụ để trích xuất một số tính năng rất quan trọng. MetaMap công cụđược sử dụng để xác định tên của bệnh/rối loạn là đã có trong UMLSMetathesaurus. Một số tính năng quan trọng khác chẳng hạn như lemmatized Phiên bản của từ, vàPOS tags được chiết xuất bằng cách sử dụng công cụ Stanford lõi NLP. Một số tính năng thêmchiết xuất trực tiếp từ UMLS Metathesaurus, bao gồm ngữ nghĩa các loại từ. Chúng tôitham gia vào cuộc thi SemEval 2014 nhiệm vụ 7 và sử dụng dữ liệu được cung cấp để đào tạovà đánh giá hệ thống của chúng tôi. Đào tạo dữ liệu chứa văn bản 199 lâm sàng, dữ liệu nghiên cứuchứa văn bản 99 lâm sàng, và dữ liệu thử nghiệm chứa văn bản lâm sàng 133, những bao gồmxả tóm lược, lớn, x-quang, và báo cáo ECG. Chúng tôi thu đượccạnh tranh kết quả về công việc khai thác tên bệnh/rối loạn. Chúng tôi tìm thấy thông quacắt bỏ học rằng trong khi tất cả các tính năng đóng góp, MetaMap phù hợp với, thẻ POS, vàtừ này trước và tiếp theo là các tính năng hiệu quả nhất.
đang được dịch, vui lòng đợi..
