Sự giống nhau thứ ba, ft, được tính bằng cách sử dụng tín hiệu thời gian từ cả hai nguồn - Twitter và Wikipedia. Đối với các hashtags, chúng tôi xây dựng các chuỗi thời gian dựa trên khối lượng tweets việc áp dụng hashtag h trên mỗi ngày trong T: T Sh = [n1, n2,. . . , N | T |]. Tương tự đối với các thực thể, chúng tôi xây dựng các chuỗi thời gian của số lượt xem cho thực thể e
ở T: T Se = [v1, v2,. . . , V | T |]. Một thời gian tương loạt số liệu sau đó được sử dụng để tính toán ft. Một số số liệu có thể được sử dụng, tuy nhiên hầu hết trong số họ bị từ thời gian cũng như nhân rộng sự khác biệt, hoặc phải chịu chi phí tính toán đắt tiền (Radinsky et al., 2011). Trong công trình này, chúng tôi sử dụng một số liệu nhưng hiệu quả đơn giản mà là độc lập để mở rộng quy mô và thời gian trễ của chuỗi thời gian (Yang và Leskovec, 2011).
Nó đo khoảng cách giữa hai chuỗi thời gian bằng cách tìm chuyển tối ưu và nhân rộng các thông số cho phù hợp với hình dạng của hai chuỗi thời gian:
đang được dịch, vui lòng đợi..