The most obvious resource to identi

The most obvious resource to identify candidate entities for a hashtag is via its tweets. We follow common approaches that use a lexicon to match each textual phrase in a tweet to a potential entity set (Shen et al., 2013; Fang and Chang, 2014).Our lexicon is constructed from Wikipedia page titles, hyperlink anchors, redirects, and disambiguation pages, which are mapped to the corresponding entities. As for the tweet phrases, we extract all n-grams (n ≤ 5) from the input tweets within
T . We apply the longest-match heuristic (Meij etal., 2012): We start with the longest n-grams and stop as soon as the entity set is found, otherwise we continue with the smaller constituent n-grams

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Các nguồn lực rõ ràng nhất để xác định thực thể ứng cử viên cho một hashtag là thông qua tweets của nó. Chúng tôi làm theo phương pháp phổ biến sử dụng một lexicon để phù hợp với mỗi cụm từ văn bản trong một tweet đến một thiết lập tổ chức tiềm năng (Shen et al., 2013; Fang và Chang, 2014). Lexicon của chúng tôi được xây dựng từ Wikipedia trang tiêu đề, siêu liên kết neo, chuyển hướng, và định hướng trang, mà được ánh xạ tới các thực thể tương ứng. Đối với các cụm từ tweet, chúng tôi trích xuất tất cả n-gam (n ≤ 5) từ các tweets đầu vào trongT. Chúng tôi áp dụng heuristic dài nhất phù hợp với (Meij etal., 2012): chúng tôi bắt đầu với n-gam dài nhất và ngừng ngay sau khi bộ thực thể được tìm thấy, nếu không chúng tôi tiếp tục với thành phần nhỏ hơn n-gam

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Các nguồn tài nguyên rõ ràng nhất để xác định các thực thể ứng cử viên cho một hashtag là qua tweets của nó. Chúng tôi thực hiện theo phương pháp thông thường mà sử dụng một từ vựng để phù hợp với mỗi cụm từ văn bản trong một tweet để một tập thực thể tiềm năng (Shen et al, 2013;. Fang và Chang, 2014) từ vựng của chúng tôi được xây dựng từ Wikipedia tiêu đề trang, neo liên kết, chuyển hướng, và các trang định hướng, được ánh xạ tới các thực thể tương ứng. Đối với các cụm từ tweet, chúng tôi trích xuất tất cả các n-gram (n ≤ 5) từ các tweets đầu vào trong
T. Chúng tôi áp dụng heuristic lâu nhất trận đấu (Meij etal, 2012.): Chúng tôi bắt đầu với dài nhất n-gram và dừng lại ngay khi tập thực thể được tìm thấy, nếu không chúng ta tiếp tục với các thành phần n-gram nhỏ

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.