Defining what is a good answerBefor

Defining what is a good answer
Before we can train a classifier to distinguish between good and bad answers, we
have to create the training data. So far, we have only a bunch of data. What we still
have to do is to define labels.
We could, of course, simply use the IsAccepted attribute as a label. After all, it
marks the answer that answered the question. However, that is only the opinion of
the asker. Naturally, the asker wants to have a quick answer and accepts the first
best answer. If more answers are submitted over time, some of them will tend to be
better than the already accepted one. The asker, however, seldom gets back to the
question and changes his/her mind. So we end up with many questions with
accepted answers that have not been scored the highest.
At the other extreme, we could take the best and worst scored answer per question
as positive and negative examples. However, what do we do with questions that
have only good answers, say, one with two and the other with four points? Should
we really take the answer with two points as a negative example?
We should settle somewhere between these extremes. If we take all answers that
are scored higher than zero as positive and all answers with 0 or less points as
negative, we end up with quite reasonable labels as follows:
>>> all_answers = [q for q,v in meta.iteritems() if v['ParentId']!=-1]
>>> Y = np.asarray([meta[aid]['Score']>0 for aid in all_answers])

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Xác định những gì là một câu trả lời hayTrước khi chúng tôi có thể đào tạo một loại để phân biệt giữa tốt và xấu câu trả lời, chúng tôicó để tạo ra dữ liệu đào tạo. Cho đến nay, chúng tôi có chỉ là một bó của dữ liệu. Những gì chúng tôi vẫn cònphải làm là để xác định nhãn.Chúng tôi có thể, tất nhiên, chỉ cần sử dụng các thuộc tính IsAccepted như một nhãn. Sau khi tất cả, nóđánh dấu câu trả lời mà trả lời các câu hỏi. Tuy nhiên, đó là chỉ quan điểm củaasker. Đương nhiên, asker muốn có một câu trả lời nhanh chóng và chấp nhận đầu tiêncâu trả lời tốt nhất. Nếu câu trả lời thêm được gửi theo thời gian, một số người trong số họ sẽ có xu hướngtốt hơn so với đã được chấp nhận. Asker, Tuy nhiên, hiếm khi được trở lại cáccâu hỏi và thay đổi tâm trí của mình. Vì vậy chúng tôi đã kết thúc với nhiều câu hỏi vớiđược chấp nhận câu trả lời mà không được ghi bàn cao nhất.Ở cực khác, chúng tôi có thể có câu trả lời tốt nhất và tồi tệ nhất ghi cho mỗi câu hỏinhư ví dụ tích cực và tiêu cực. Tuy nhiên, những gì làm chúng tôi làm với câu hỏi màcó chỉ có câu trả lời tốt, nói, một với hai và khác với bốn điểm? Nênchúng tôi thực sự có câu trả lời với hai điểm như là một ví dụ tiêu cực?Chúng tôi cần phải giải quyết một nơi nào đó giữa những thái cực. Nếu chúng tôi có tất cả các câu trả lời đóđược ghi bàn cao hơn zero như là tích cực và tất cả các câu trả lời với điểm 0 hoặc ít hơn nhưtiêu cực, chúng tôi kết thúc với khá hợp lý nhãn như sau:>>> all_answers = [q cho q, v trong meta.iteritems() nếu v ['ParentId']! =-1]>>> Y = np.asarray ([meta [viện trợ] ['điểm'] > 0 cho viện trợ trong all_answers])

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Định nghĩa một câu trả lời tốt là những gì
Trước khi chúng tôi có thể đào tạo một phân loại để phân biệt giữa câu trả lời tốt và xấu, chúng ta
phải tạo ra các dữ liệu huấn luyện. Cho đến nay, chúng ta chỉ có một loạt các dữ liệu. Những gì chúng ta vẫn
phải làm là xác định nhãn.
Chúng tôi có thể, tất nhiên, chỉ đơn giản là sử dụng các thuộc tính IsAccepted như một nhãn. Sau khi tất cả, nó
đánh dấu câu trả lời mà trả lời các câu hỏi. Tuy nhiên, đó chỉ là ý kiến của
người đặt. Đương nhiên, Người hỏi muốn có câu trả lời nhanh và chấp nhận là người đầu tiên
trả lời tốt nhất. Nếu câu trả lời thêm được đệ trình theo thời gian, một số trong số họ sẽ có xu hướng
tốt hơn so với một trong những đã được chấp nhận. Người hỏi, tuy nhiên, hiếm khi được trở lại các
câu hỏi và thay đổi / trả của mình. Vì vậy, chúng tôi kết thúc với nhiều câu hỏi với
câu trả lời được chấp nhận rằng đã không được ghi bàn cao nhất.
Ở thái cực khác, chúng ta có thể đưa ra câu trả lời tốt nhất và tồi tệ nhất ghi bàn cho mỗi câu hỏi
ví dụ như tích cực và tiêu cực. Tuy nhiên, chúng ta làm gì với câu hỏi mà
chỉ có câu trả lời tốt, nói, một trong hai và khác với bốn điểm? Nên
chúng tôi thực sự có những câu trả lời với hai điểm là một ví dụ tiêu cực?
Chúng ta nên giải quyết ở đâu đó giữa hai thái cực này. Nếu chúng ta lấy tất cả các câu trả lời
được ghi điểm cao hơn so với số không như tích cực và tất cả các câu trả lời với 0 hoặc ít hơn điểm là
tiêu cực, chúng ta kết thúc với nhãn khá hợp lý như sau:
>>> all_answers = [q q, v trong meta.iteritems ( ) nếu v ['ParentId'] = - 1]
>>> Y = np.asarray ([meta [trợ giúp] ['Điểm']> 0 cho viện trợ trong all_answers])

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.