Hầu hết các lập trình viên nhận thức dựa, ít nhất ở một mức độ nào đó, trên các mô hình tâm lý học để giảm bớt các khiếm chủ quan của nhiễu lượng tử. Các bộ mã hóa phân tích các tín hiệu âm thanh đầu vào để xác định thông tin về mặt nhận thức quan trọng bằng cách kết hợp một số nguyên tắc của tâm lý học của tai người Zwicker và niên biểu, năm 1990. Một là phân tích quang phổ criticalband, chiếm phân biệt đối xử tai nghèo ở các vùng higherfrequency so với các vùng lowerfrequency. Điều tra đã chỉ ra rằng một lựa chọn tốt của độ phân giải phổ là khoảng 20 Hz, mà đã được thực hiện ở định dạng MPEG-2 AAC và MPEG-4. Hiện tượng mặt nạ là một hiệu ứng xảy ra bất cứ khi nào một tín hiệu mạnh mẽ (masker) làm cho một khu phố quang phổ hoặc thời gian của tín hiệu yếu hơn không nghe được. Để minh họa điều này, Hình 0,6 cho thấy một ví dụ về ngưỡng mặt nạ được sản xuất bởi một masker tâm tại 1 kHz. Các ngưỡng tuyệt đối (đường nét đứt) cũng được bao gồm để chỉ mức cường độ âm thanh tối thiểu trong một môi trường yên tĩnh. Chú ý rằng độ dốc của đường cong mặt nạ là ít dốc về phía tần số cao; nghĩa là, tần số cao hơn sẽ dễ dàng được che đậy. Việc bù đắp giữa masker và che ngưỡng được thay đổi liên quan đến việc thanh khiết của maskerit có một giá trị nhỏ hơn cho một masker noiselike (5 dB) hơn một masker tonelike (25dB). Các bộ mã hóa thực hiện việc phân tích tâm lý học dựa trên hoặc một phân tích sidechain FFT (trong MPEG) hoặc đầu ra của filterbank (trong AC3 và PASC). MPEG cung cấp hai ví dụ về mô hình tâm lý học, người đầu tiên trong số đó hiện chúng tôi mô tả. Việc tính toán bắt đầu với một phân tích quang phổ chính xác trên 512 (Layer I) hoặc 1024 (II Layer) mẫu đầu vào để tạo ra quang phổ độ lớn. Các vạch phổ này sau đó được kiểm tra để phân biệt giữa tonelike và noiselike maskers bằng cách lấy tối đa địa phương của cường độ quang phổ như một chỉ số
đang được dịch, vui lòng đợi..