Thông thường, các bộ dữ liệu bao gồm các biến đầu vào mô hình đó là lớn trong phạm vi, dư thừa, hoặc ồn ào, mà cuối cùng có thể ẩn các biến có ý nghĩa cần thiết cho mô hình hiệu quả và tối ưu hóa. Trong trường hợp này, phương pháp dựa trên phân tích thành phần chính (PCA) cho dữ liệu tiền xử lý sử dụng mạng lưới thần kinh đầu vào thuận lợi. PCA làm giảm số lượng các biến quan sát được vào một số lượng nhỏ các thành phần chủ yếu (máy tính). Mỗi máy tính được tính bằng cách lấy một sự kết hợp tuyến tính của một vector riêng của ma trận tương quan với biến ban đầu. Kết quả là, các phương pháp PCA xác định tầm quan trọng của các giá trị riêng của ma trận tương quan kết hợp với các máy tính cá nhân đầu tiên của dữ liệu để chọn các tập hợp con của các máy tính cho các mẫu cung cấp các giá trị tổng quát tối ưu. Trong điều kiện của mô hình mạng neu-ral, các máy tính với giá trị riêng lớn hơn đại diện cho số lượng tương đối nhiều biến thiên của tập dữ liệu huấn luyện. Các máy tính lớn nhất có thể được áp dụng đầu tiên như là một biến đầu vào của một MLP tương ứng, với máy tính sau đó sử dụng như các bộ dữ liệu đầu vào MLP. Quá trình này tiếp tục cho đến khi tất cả các máy tính cá nhân đại diện cho đa số các biến thiên của tập dữ liệu huấn luyện có trong dữ liệu đầu vào thiết lập của MLP tương ứng.
đang được dịch, vui lòng đợi..