4.2 Email messagesTo be able to work with emails and extract their con dịch - 4.2 Email messagesTo be able to work with emails and extract their con Việt làm thế nào để nói

4.2 Email messagesTo be able to wor

4.2 Email messages
To be able to work with emails and extract their content the framework must be able to parse them. Although basic functionality to do so is relatively easy to implements a full-featured,convenient library that will provide all necessary functions is a long-time effort.Thankfully, when integrated, the framework can make use of the library used in eM Client to work with email messages.For testing purposes this library might be used independently of eM Client.
4.3 Data instance features
The features being used as a base for the distance calculation are of the same, if not higher,importance, as the clustering algorithm itself. Large amount of features can be created from email messages properties. During analysis of what is important when deciding that items discuss the same topic, several obvious choices came up. We have also drawn from other research, mainly Cselle’s work[3]. Each of the properties has also specific method of comparison and calculation of the numeric distance value. We devised the calculation of each feature to express similarity on interval from 0 to 1. Following features participate inthe distance calculation:

Most email clients add headers for unique message identification and for items that are replies a header containing identification string of the message that is being replied to. The unique identification header is named
Message-Id
and the header in reply messages is
In-Reply-To
. Value of these headers has no specific meaning and is usually randomly generated. Its only use is as operand in string comparison to determine if message are related. It is probable that related messages will discuss same topic.Numeric feature value from these properties is 1 if one mail is a reply to the other(or vice versa) and 0 if there is no relationship between the messages.

Based on the same headers as above, we check whether two mails are replies to the same email. This would be a typical case when multiple users discuss a topic. When the mails share In-Reply-To value, this feature is 1, otherwise it is 0.

Sender also bears an informational value. It is stored in
From
header of an email.When the sender of compared mail is identical this feature is 1.

Recipient sets (present in header field
To
) of email messages are compared to determine how many recipients do emails share. Size of the intersecting set related to size of union of both recipient sets is calculated.

Each email also has an origination date in header
Date
. Emails relating to the same topic will often be near each other on a time line. We have decided to normalize the time distance to an interval of two months. The feature value calculation computes time difference in hours divided by total hours in 2 months and performs normalization and inversion, so that value of 1 represent items not differing in time and value 0 items that are further away than 2 months.
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
4.2 thưĐể có thể làm việc với email và trích xuất nội dung của các khuôn khổ phải có khả năng phân tích họ. Mặc dù các chức năng cơ bản để làm như vậy là tương đối dễ dàng để thực hiện một thư viện đầy đủ, thuận tiện mà sẽ cung cấp cho tất cả các chức năng cần thiết là một thời gian dài effort. Rất may, khi tích hợp, khuôn khổ có thể làm cho việc sử dụng các thư viện được sử dụng trong eM khách hàng làm việc với thư điện tử. Cho mục đích thử nghiệm thư viện này có thể được sử dụng độc lập với eM khách hàng.4.3 dữ liệu ví dụ tính năngCác tính năng được sử dụng như một cơ sở cho việc tính toán khoảng cách là như nhau, nếu không phải cao hơn, tầm quan trọng, như là các thuật toán kết cụm chính nó. Số lượng lớn các tính năng có thể được tạo ra từ các thuộc tính thư email. Trong phân tích của những gì là quan trọng khi quyết định các mục thảo luận về chủ đề này, nhiều sự lựa chọn rõ ràng đã đưa ra. Chúng tôi cũng đã rút ra từ nghiên cứu khác, chủ yếu là công việc của Cselle [3]. Mỗi người trong số các thuộc tính cũng có các phương pháp cụ thể so sánh và tính toán giá trị số khoảng cách. Chúng tôi đưa ra các tính toán của mỗi tính năng để thể hiện sự tương đồng về khoảng thời gian từ 0 đến 1. Tính năng sau đây tham gia trong các tính toán khoảng cách:•Hầu hết các khách hàng email thêm tiêu đề cho thông báo duy nhất identification và cho các mục mà trả lời một tiêu đề có chứa identification chuỗi thư được trả lời. Tiêu đề nhận dạng độc đáo này được đặt tênId thông báovà các tiêu đề trong trả lời tin nhắnTrong-lời-cho. Giá trị của các tiêu đề đã không có ý nghĩa cụ thể và thường ngẫu nhiên được tạo ra. Sử dụng duy nhất của nó là operand trong chuỗi so sánh để xác định nếu bài viết có liên quan. Nó là có thể xảy ra liên quan đến tin nhắn sẽ thảo luận về các chủ đề tương tự. Giá trị số tính năng từ các thuộc tính là 1 nếu một thư trả lời khác (hoặc ngược lại) và 0 nếu không có mối quan hệ giữa các tin nhắn.•Dựa trên các tiêu đề tương tự như ở trên, chúng tôi kiểm tra cho dù hai thư trả lời các email tương tự. Điều này sẽ là một trường hợp điển hình khi nhiều người dùng được thảo luận về một chủ đề. Khi các thư chia sẻ trong-lời-cho giá trị, tính năng này là 1, nếu không nó là 0.•Người gửi cũng mang một giá trị thông tin. Nó được lưu trữ trongTừtiêu đề của email. Khi người gửi thư so sánh là giống hệt nhau tính năng này là 1.•Nhận bộ (xuất hiện trong tiêu đề quấnĐể) email thư được so sánh để xác định có bao nhiêu người nhận email chia sẻ. Kích thước của các thiết lập giao nhau liên quan đến kích thước của công đoàn của cả hai bộ nhận được tính.•Mỗi email cũng có một ngày nguyên trong tiêu đềNgày. Email liên quan đến cùng một chủ đề thường sẽ gần nhau trên một dòng thời gian. Chúng tôi đã quyết định để bình thường hóa cho một khoảng thời gian hai tháng thời gian, khoảng cách. Các tính năng giá trị tính toán tính thời gian difference trong giờ chia cho tổng số giờ trong 2 tháng và thực hiện bình thường hoá và đảo ngược, do đó giá trị là 1 đại diện cho hàng không khác nhau trong thời gian và các mặt hàng giá trị 0 thêm đi hơn 1 tháng.
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
4.2 điệp Email
Để có thể làm việc với email và trích xuất nội dung của khung phải có khả năng phân tích chúng. Mặc dù chức năng cơ bản để làm như vậy là tương đối dễ dàng để thực hiện một, thư viện thuận tiện đầy đủ tính năng mà sẽ cung cấp tất cả các chức năng cần thiết là một thời gian dài e ff ort.Thankfully, khi tích hợp, khuôn khổ có thể sử dụng các thư viện sử dụng trong eM Client để làm việc với mục đích thử nghiệm messages.For email thư viện này có thể được sử dụng độc lập của eM client.
4.3 dữ liệu ví dụ tính năng
các tính năng được sử dụng như một cơ sở cho việc tính toán khoảng cách là như nhau, nếu không cao, tầm quan trọng, như các thuật toán phân nhóm chính nó. Số lượng lớn các tính năng có thể được tạo ra từ các tin nhắn email tài sản. Trong phân tích của những gì là quan trọng khi quyết định rằng các mục thảo luận về cùng một chủ đề, nhiều sự lựa chọn rõ ràng đã đưa ra. Chúng tôi cũng đã rút ra từ nghiên cứu khác, chủ yếu là công việc của Cselle [3]. Mỗi phòng trong số tài sản cũng có phương pháp cụ thể để so sánh và tính toán các giá trị khoảng cách số. Chúng tôi đã phát minh ra các tính toán của mỗi tính năng để bày tỏ sự giống nhau về khoảng thời gian từ 0 đến 1. tính năng sau tham gia inthe tính khoảng cách:

Hầu hết các khách hàng email thêm tiêu đề cho thông điệp độc đáo identi cation fi và cho các chỉ trả lời một header chứa identi chuỗi fi cation của thông điệp đó là được trả lời. Các tiêu đề nhận dạng duy nhất được đặt tên là
Message-Id
và các tiêu đề trong thông điệp trả lời là
In-Reply-To
. Giá trị của những tiêu đề không có ý nghĩa cụ thể và thường được tạo ngẫu nhiên. Sử dụng duy nhất của nó là làm toán hạng trong so sánh chuỗi để xác định nếu thông điệp có liên quan. Có thể là thư có liên quan sẽ thảo luận cùng giá trị tính năng topic.Numeric từ các đặc tính này là 1 nếu một mail là một trả lời khác (hoặc ngược lại) và 0 nếu không có mối quan hệ giữa các thông điệp.

Dựa trên các tiêu đề tương tự như trên, chúng tôi kiểm tra xem hai mail là trả lời cho cùng một email. Đây sẽ là một trường hợp điển hình khi nhiều người dùng thảo luận về một chủ đề. Khi các thư cổ phần In-Reply-To giá trị, tính năng này là 1, ngược lại là 0.

Tên người gửi cũng mang một giá trị thông tin. Nó được lưu giữ trong
Từ
tiêu đề của một email.When người gửi thư so sánh là giống hệt tính năng này là 1.

bộ nhận (hiện diện trong tiêu đề fi lĩnh
Để
) các tin nhắn email được so sánh để xác định có bao nhiêu người nhận làm thư cổ phiếu. Kích thước của bộ giao nhau liên quan đến kích thước của công đoàn của cả hai người nhận bộ được tính toán.

Mỗi email cũng có ngày khởi trong tiêu đề
ngày
. Email liên quan đến cùng một chủ đề thường xuyên sẽ được ở gần nhau trên một dòng thời gian. Chúng tôi đã quyết định bình thường hóa các khoảng cách thời gian để một khoảng thời gian hai tháng. Việc tính toán giá trị tính năng tính thời gian di ff erence trong giờ chia cho tổng số giờ trong 2 tháng và thực hiện bình thường và đảo ngược, do vậy giá trị của 1 đại diện cho các mặt hàng không khác nhau về thời gian và giá trị 0 sản phẩm được xa hơn 2 tháng.
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2024 I Love Translation. All reserved.

E-mail: