Việc xem xét ngôn ngữ lập trình khác nhau khác
tính năng như phân cấp lớp [11], [16], generics [38],
[39], [40], và các mẫu thiết kế [41], [42]. Hầu hết các công trình
tập trung vào một tính năng ngôn ngữ duy nhất trong sự cô lập, và không
xem xét sự tương tác giữa các tính năng khác nhau.
Một cách thực dụng hơn trong việc nâng cao độ tin cậy của
công cụ sắp xếp được kiểm tra tự động. ASTGen [43] là một
công cụ tạo chương trình combinator dựa trên đã được
sử dụng để tìm các lỗi trong công cụ sắp xếp của Eclipse và
các chương trình đầu ra như là một chỉ thô về tính đúng đắn,
như chúng ta đã làm trong đánh giá định lượng của chúng tôi.
Gần đây, Soares et al. [24], [25] đã đề xuất
kỹ thuật để kiểm tra hành vi tự động tái cấu trúc
các công cụ. Họ cũng sử dụng một máy phát chương trình để tạo ra
các chương trình đầu vào để cấu trúc lại, nhưng thay vì sử dụng sấm specialpurpose, họ sẽ tự động tạo ra các đơn vị xét nghiệm để tìm thấy
sự khác biệt về hành vi giữa bản gốc và các
chương trình tái cấu trúc. Một vấn đề tinh tế ở đây là họ
không cấu trúc lại các đơn vị xét nghiệm cùng với các chương trình,
đang được dịch, vui lòng đợi..