Ung thư vú WisconsinDự đoán thời gian để tái diễn (field 3 trong tái phát hồ sơ).Mỗi bản ghi đại diện cho các dữ liệu theo dõi cho một vú ung thư trường hợp. Đây là bệnh nhân liên tiếp được thấy bởi tiến sĩ Wolberg từ năm 1984, và bao gồm chỉ là những trường hợp trưng bày ung thư vú xâm lấn và có bằng chứng về di căn xa khi chẩn đoán. Các tính năng 30 lần đầu tiên được tính toán từ một hình ảnh số hóa của một aspirate Mỹ kim (FNA) của một vú khối lượng. Họ mô tả đặc điểm của nhân tế bào hiện diện trong hình ảnh. Một vài trong số những hình ảnh có thể được tìm thấy tại http://www.cs.wisc.edu/~street/images/Sự chia tách mô tả ở trên được thu được bằng cách sử dụng Multisurface phương pháp-cây (MSM-T) [K. P. Bennett, "Quyết định cây xây dựng thông qua tuyến tính lập trình." Thủ tục tố tụng của trí tuệ nhân tạo Midwest 4 và khoa học nhận thức xã hội, trang 97-101, 1992], một phương pháp phân loại sử dụng lập trình tuyến tính để xây dựng một cây quyết định. Tính năng có liên quan đã được lựa chọn bằng cách sử dụng một tìm kiếm đầy đủ trong không gian của tính năng 1-4 và 1-3 tách máy bay.Chương trình tuyến tính thực tế được sử dụng để có được máy bay tách trong không gian 3 chiều là mô tả trong:[K. P. Bennett và O. L. Mangasarian: "Mạnh mẽ tuyến tính lập trình phân biệt đối xử của hai tuyến tính không thể tách rời bộ", phương pháp tối ưu hóa và phần mềm 1, 1992, 23-34].Phương pháp xấp xỉ bề mặt tái phát (RSA) là một mô hình lập trình tuyến tính, dự báo thời gian để tái diễn sử dụng trường hợp tái phát và nonrecurrent.Cơ sở dữ liệu này cũng có sẵn thông qua hệ phục vụ ftp UW CS:ftp ftp.cs.wisc.eduCD toán-prog/cpo-số liệu/máy-tìm hiểu/WPBC /Thông tin thuộc tính1) ID số2) kết quả (R = tái diễn, N = nonrecur)3) thời gian (thời gian lặp lại nếu trường 2 = R, bệnh miễn phí thời gian nếu trường 2 = N)4-33) mười tính năng giá trị thực được tính cho mỗi nhân tế bào:a) bán kính (có nghĩa là khoảng cách từ Trung tâm để điểm trên chu vi)b) kết cấu (độ lệch chuẩn của giá trị màu xám quy mô)c) chu vid) khu vựce) êm ái (biến thể địa phương theo chiều dài bán kính)f) nhỏ gọn (chu vi ^ 2 / lá - 1.0)g) bề Lom (mức độ nghiêm trọng của phần lõm của các đường viền)h) lõm điểm (số phần lõm của các đường viền)i) đối xứng j) fractal kích thước ("bờ biển xấp xỉ" - 1)Các có nghĩa là, tiêu chuẩn lỗi, và "tồi tệ nhất" hoặc lớn nhất (trung bình của các giá trị lớn nhất ba) của các tính năng này đã được tính cho mỗi hình ảnh, kết quả là tính năng 30. Ví dụ, lĩnh vực 4 là có nghĩa là bán kính, lĩnh vực 14 là bán kính SE, lĩnh vực 24 là tồi tệ nhất bán kính.Giá trị cho các tính năng 4-33 được recoded có bốn chữ số quan trọng.34) kích thước khối u - đường kính của khối u excised trong cm35) tình trạng hạch – số lượng tích cực hạch bạch huyết nách quan sát thời điểm trong phẫu thuậtGhi chú cá nhân của tôi:-Tôi đã gỡ bỏ các trường hợp bốn với không biết giá trị của thuộc tính cuối-Tôi đã trao đổi vị trí thuộc tính của thuộc tính n.3 (thời gian) và n.35 (hạch).-Tôi đã gỡ bỏ thuộc tính kết quả như nó là thuộc tính lớp nếu vấn đề được coi là một phân loại một.Nguồn: UCI máy học tập kho.Đặc điểm: 194 trường hợp; 32 liên tục biếnTải về: wisconsin.tar.gz (1749 byte)
đang được dịch, vui lòng đợi..