in a SVM you are searching for two

in a SVM you are searching for two things: a hyperplane with the largest minimum margin, and a hyperplane that correctly separates as many instances as possible. The problem is that you will not always be able to get both things. The c parameter determines how great your desire is for the latter. I have drawn a small example below to illustrate this. To the left you have a low c which gives you a pretty large minimum margin (purple). However, this requires that we neglect the blue circle outlier that we have failed to classify correct. On the right you have a high c. Now you will not neglect the outlier and thus end up with a much smaller margin.

Depending on your data set, changing c may or may not produce a different hyperplane. If it does produce a different hyperplane, that does not imply that your classifier will output different classes for the particular data you have used it to classify. Weka is a good tool for visualizing data and playing around with different settings for an SVM. It may help you get a better idea of how your data look and why changing the c value does not change the classification error. In general, having few training instances and many attributes make it easier to make a linear separation of the data. Also that fact that you are evaluating on your training data and not new unseen data makes separation easier.

Depending on your data set, changing c may or may not produce a different hyperplane. If it does produce a different hyperplane, that does not imply that your classifier will output different classes for the particular data you have used it to classify. Weka is a good tool for visualizing data and playing around with different settings for an SVM. It may help you get a better idea of how your data look and why changing the c value does not change the classification error. In general, having few training instances and many attributes make it easier to make a linear separation of the data. Also that fact that you are evaluating on your training data and not new unseen data makes separation easier.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

trong một SVM bạn đang tìm kiếm cho hai điều: một hyperplane với rìa tối thiểu lớn nhất, và một hyperplane một cách chính xác tách càng nhiều càng tốt. Vấn đề là rằng bạn sẽ không phải luôn luôn có thể để có được cả hai điều. Các tham số c sẽ xác định như thế nào hay mong muốn của bạn là cho sau này. Tôi đã rút ra một ví dụ nhỏ dưới đây để minh họa điều này. Bên trái, bạn có một c thấp mà cung cấp cho bạn một biên độ tối thiểu khá lớn (màu tím). Tuy nhiên, điều này đòi hỏi rằng chúng tôi bỏ qua outlier vòng tròn màu xanh chúng tôi đã không thể phân loại chính xác. Bên phải bạn có một c cao. Bây giờ, bạn sẽ không bỏ bê outlier và do đó kết thúc với một lợi nhuận nhỏ hơn nhiều.Tùy thuộc vào thiết lập dữ liệu của bạn, thay đổi c có thể hoặc có thể không tạo ra một hyperplane khác nhau. Nếu nó tạo ra một hyperplane khác nhau, mà không ngụ ý rằng loại của bạn sẽ xuất các lớp khác nhau của dữ liệu cụ thể bạn đã sử dụng nó để phân loại. Weka là một công cụ tốt cho visualizing dữ liệu và chơi xung quanh với các cài đặt khác nhau cho một SVM. Nó có thể giúp bạn có được một ý tưởng tốt hơn về cách dữ liệu của bạn nghe và tại sao thay đổi giá trị c không thay đổi phân loại lỗi. Nói chung, có vài trường hợp đào tạo và nhiều thuộc tính làm cho nó dễ dàng hơn để làm cho một tách tuyến tính của dữ liệu. Cũng rằng thực tế là bạn đánh giá trên của bạn đào tạo dữ liệu và dữ liệu không nhìn thấy không mới làm cho tách dễ dàng hơn.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

trong một SVM bạn đang tìm kiếm hai điều: một siêu phẳng với biên độ tối thiểu lớn nhất, và một siêu phẳng phân cách một cách chính xác như nhiều trường hợp càng tốt. Vấn đề là bạn sẽ không phải luôn luôn có thể có được cả hai thứ. Các tham số c xác định như thế nào tuyệt vời mong muốn của bạn là cho sau này. Tôi đã rút ra một ví dụ nhỏ dưới đây để minh họa điều này. Để bên trái, bạn có một c thấp mang đến cho bạn một lợi nhuận tối thiểu khá lớn (màu tím). Tuy nhiên, điều này đòi hỏi chúng ta bỏ qua các vòng tròn màu xanh outlier rằng chúng tôi đã thất bại trong việc phân loại chính xác. Ở bên phải bạn có một c cao. Bây giờ bạn sẽ không bỏ rơi các outlier và do đó kết thúc với một biên độ nhỏ hơn nhiều. Tùy thuộc vào dữ liệu của bạn, thay đổi c có thể có hoặc không sản xuất một siêu phẳng khác nhau. Nếu có sản xuất một siêu phẳng khác nhau, điều đó không có nghĩa là phân loại của bạn sẽ sản xuất các lớp học khác nhau cho các dữ liệu cụ thể mà bạn đã sử dụng nó để phân loại. Weka là một công cụ tốt cho việc hình dung dữ liệu và chơi đùa với các thiết lập khác nhau cho một SVM. Nó có thể giúp bạn có được một ý tưởng tốt hơn về cách dữ liệu của bạn trông và lý do tại sao thay đổi giá trị c không thay đổi các lỗi phân loại. Nói chung, có vài trường đào tạo và nhiều thuộc tính làm cho nó dễ dàng hơn để làm cho một tách tuyến tính của dữ liệu. Ngoài ra thực tế rằng bạn đang đánh giá trên dữ liệu huấn luyện của bạn và không phải dữ liệu vô hình mới làm cho tách dễ dàng hơn.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.