GP [28] là một phần mở rộng của thuật toán di truyền (GA). Nó là một tìm kiếm
phương pháp thuộc họ tính toán tiến hóa. GP
ngẫu nhiên tạo ra một dân số ban đầu của các giải pháp. Sau đó, ban đầu
dân được chế tác sử dụng các nhà khai thác di truyền khác nhau để sản xuất
quần thể mới. Các nhà khai thác bao gồm sinh sản, crossover,
đột biến, tình trạng rơi, vv Toàn bộ quá trình phát triển từ
một dân với dân số kế tiếp được gọi là một thế hệ. Một Corporate
mô tả của thuật toán GP có thể được chia thành một số
bước tuần tự [14]:
• Tạo một dân số ngẫu nhiên của chương trình, hoặc quy tắc, bằng cách sử dụng
biểu tượng cung cấp như dân số ban đầu.
• Đánh giá từng chương trình, quy tắc bằng cách gán một giá trị thể dục theo
một chức năng tập thể dục được xác định trước đó có thể đo lường năng lực của
các quy tắc hoặc chương trình để giải quyết vấn đề.
• Sử dụng các toán tử sinh sản để sao chép các chương trình hiện có thành các
thế hệ mới.
• Tạo các dân cư mới với sự giao nhau, đột biến, hoặc các
nhà khai thác từ một bộ chọn ngẫu nhiên của cha mẹ.
• Lặp lại thứ hai đến bước thứ tư cho dân số mới cho đến khi một
tiêu chí chấm dứt được xác định trước là hài lòng, hoặc một số cố định của
các thế hệ được hoàn thành.
• Các giải pháp cho vấn đề là chương trình di truyền với sự tốt nhất
tập thể dục trong tất cả các thế hệ.
Trong GP, các hoạt động chéo đạt được bằng cách sinh sản của hai
cây mẹ. Hai điểm chéo sẽ được chọn ngẫu nhiên trong
hai cây con. Trao đổi cây con, được lựa chọn
theo các điểm giao nhau trên cây mẹ, tạo ra các
cây con thức. Các cây con thường khác với
cha mẹ của họ có kích thước và hình dạng. Sau đó, hoạt động đột biến cũng được
xem xét trong GP. Một cây cha mẹ duy nhất là lần đầu tiên tái tạo. Sau đó, một
điểm đột biến được lựa chọn ngẫu nhiên từ sinh sản, trong đó
có thể là một nút lá hoặc một cây con. Cuối cùng, các nút lá hoặc cây con
được thay thế bằng một nút lá mới hoặc một cây con được tạo ngẫu nhiên.
Chức năng tập thể dục đảm bảo rằng sự tiến hóa đi về hướng tối ưu hóa
bằng cách tính toán các giá trị thể dục cho mỗi cá nhân trong dân số.
Các giá trị thể dục đánh giá hiệu suất của mỗi cá nhân trong
dân số.
GP được hướng dẫn bởi các chức năng tập thể dục để tìm kiếm hiệu quả nhất
chương trình máy tính có thể giải quyết một vấn đề nhất định. Một biện pháp đơn giản
của thể dục [14] được áp dụng cho các vấn đề phân loại nhị phân và được
quy định như sau:
Thể ¼ số: mẫu phân loại chính xác
Không: các mẫu được sử dụng để đào tạo trong đánh giá
Các cân nhắc chính trong việc áp dụng GP để mô hình phân loại
là:
• kỹ thuật dựa GP được tự do về sự phân bố của dữ liệu, và do đó
không có kiến thức tiên nghiệm là cần thiết về sự phân bố thống kê của
các dữ liệu.
• GP có thể trực tiếp vận hành trên các dữ liệu ở dạng ban đầu của nó.
• GP có thể phát hiện các mối quan hệ cơ bản nhưng chưa biết rằng tồn tại
giữa các hạng mục dữ liệu và thể hiện nó như một biểu thức toán học.
• GP có thể khám phá các tính năng phân biệt quan trọng nhất của một
lớp trong suốt giai đoạn huấn luyện.
đang được dịch, vui lòng đợi..
