Lấy mẫu Từ hashtags xu hướng, chúng tôi lấy mẫu 30 hashtags biệt để đánh giá. Từ nghiên cứu của chúng tôi tập trung vào xu hướng hashtags có mapable để các thực thể trong Wikipedia, lấy mẫu phải bao gồm một số lượng đủ các chủ đề "phổ biến" được nhìn thấy trong Wikipedia, đồng thời bao gồm các chủ đề hiếm ở đuôi dài. Để làm được điều này, chúng tôi áp dụng
một số heuristics trong lấy mẫu. Đầu tiên, chúng ta chỉ xem xét hashtags nơi từ vựng dựa trên liên kết (Phần 3.1) kết quả trong ít nhất 20 đơn vị khác nhau. Thứ hai, chúng tôi chọn ngẫu nhiên hashtags để trang trải các loại khác nhau của các chủ đề (sự kiện kéo dài, sự kiện phá vỡ, hashtags nội sinh). Thay vì kiểm tra tất cả các hashtags ở corpus của chúng tôi, chúng tôi theo Lehmann et al. (2012) và tính toán phần của tweets xuất bản trước, trong và sau đỉnh. Các hashtags sau đó được gom lại trong một không gian vector 3 chiều này. Mỗi cụm cho một nhóm các hashtags với một ngữ nghĩa khác nhau (Lehmann et al, 2012.). Sau đó chúng tôi nhận hashtags ngẫu nhiên từ mỗi cụm, kết quả là 200 hashtags trong tổng số. Từ mẫu thô này, ba thanh tra kiểm tra cẩn thận các tweets và chọn 30 hashtags nơi những ý nghĩa và các loại hashtag là nhất định để các kiến thức của thanh tra.
đang được dịch, vui lòng đợi..