word2vec tạo ra từ vector bởi hai chương trình khác nhau của mô hình ngôn ngữ: liên tục túitừ (CBOW) và bỏ qua-gam (Mikolov et al., 2013a; Mikolov et al., 2013b). Trong phương pháp CBOW, mục tiêu là để dự đoán một từ được đưa ra từ xung quanh, trong khi ở bỏ qua-gam, được đưa ra một từ duy nhất, cửa sổ hoặc các bối cảnh của các từ được dự đoán. Chúng tôi có thể nói bỏ qua-gam mô hình là đối diện của mô hình CBOW. Cả hai mô hình là mạng nơ-ron dựa trên ngôn ngữ mô hình và mất corpus lớn như là một đầu vào và tìm hiểu vector đại diện foreach từ trong các văn thể. Chúng tôi sử dụng công cụ miễn phí có sẵn word2vec2 cho mục đích của chúng tôi. Ngoài sự lựa chọn của kiến trúc bỏ qua-gam hoặc CBOW, word2vec có một số thông số trong đó có kích thước của cửa sổ bối cảnh, kích thước của véc tơ, mà có hiệu lực tốc độ và chất lượng đào tạo
đang được dịch, vui lòng đợi..
