Ghi chú: Các 'lemmatize' của NLTK không chỉ được sử dụng để chuyển đổi từ số nhiều thành ít, nó còn được sử dụng trước khi truy vấn ConceptNet, vì vậy mà các truy vấn có nhiều khả năng để thành công. Sau đó, các thiết lập bắt nguồn từ được chịu các phân tích cú pháp Stanford NLTK , đó là một phần của bộ nguồn NLTK mở. để phân tích tài liệu tham khảo thứ tự, chúng tôi sử dụng một ngữ pháp ngữ nghĩa tăng cường với các tính năng, phân tích của Earley phân tích biểu đồ tính năng từ NLTK. để đo các tỷ lệ, chúng tôi đã sử dụng một phần-of-speech tagger (pos-tagger) có sẵn trong bộ công cụ NLTK. Tuy nhiên, kể từ khi chúng tôi yêu cầu xử lý nghiêm khắc hơn của đầu vào, chúng tôi sử dụng gói NLTK (Ngôn ngữ tự nhiên Toolkit) để phân tích và POS-thẻ đầu vào. về mặt kỹ thuật, các bước sau (trừ người đầu tiên) được dựa trên thư viện mã nguồn mở và NLTK miễn phí (Bird et al. 2009) trong đó cung cấp nhiều tính năng xử lý ngôn ngữ và có giao diện với các cơ sở dữ liệu như WordNet (Fellbaum 2005) cũng như với các thư viện và các phần mềm của bên thứ ba như tagger ngữ pháp Stanford Tagger và tự động prover9 Prover. Ngoài ra, người dùng có thể truy cập vào Đại ngữ nghĩa thông qua một giao diện dòng lệnh, nơi hội nhập với Python và NLTK cung cấp thêm các lợi ích. Grapevine được xây dựng trong Python sử dụng Công cụ Ngôn ngữ tự nhiên Kit (NLTK). Đánh giá Corpus-Based của điệu tính Dự đoán cụm từ break Sử dụng Parser Chunk nltk_lite của phát hiện ranh giới cụm từ điệu tính trong Aix-MARSEC Corpus của Anh Nói lý do probablistic mô tả trong các phần trước đã được thực hiện với sự Ngôn ngữ tự nhiên Toolkit (NLTK). Chúng tôi ứng dụng công cụ tính toán để tạo ra các đại diện có cấu trúc của các hành động theo các thẻ bên ngoài (VISL) bên trong các gói Ngôn ngữ tự nhiên Toolkit (NLTK).
đang được dịch, vui lòng đợi..
