word2vec tạo ra từ vector của hai chương trình khác nhau của mô hình ngôn ngữ: túi liên tụccác từ (CBOW) và bỏ qua-gam (Mikolov et al., 2013a; Mikolov et al., 2013b). Trong phương pháp CBOW, mục tiêu là để dự đoán một từ được đưa ra từ xung quanh, trong khi ở skip-gam, được đưa ra một từ duy nhất, cửa sổ hoặc các bối cảnh của các từ được dự đoán. Chúng tôi có thể nói mô hình skip-gam là đối diện của mô hình CBOW. Cả hai mô hình là mô hình dựa trên ngôn ngữ mạng nơ-ron và mất corpus lớn như là một đầu vào và tìm hiểu vector đại diện foreach từ trong the corpus. Chúng tôi sử dụng công cụ miễn phí có sẵn word2vec2 cho mục đích của chúng tôi. Ngoài các sự lựa chọn của kiến trúc skip-gam hoặc CBOW, word2vec có một số thông số bao gồm kích thước của cửa sổ bối cảnh, kích thước của véc tơ, mà có hiệu lực tốc độ và chất lượng đào tạo
đang được dịch, vui lòng đợi..
