Do đó, nói một cách dân dã vừa ngắn gọn vừa dễ hiểu: bảng xếp hạng giáo dục của OECD nói vậy mà thực tế không phải vậy.

Trong Phần 1, người viết đã phân tích để chỉ ra kết quả xếp hạng của OECD không phản ảnh chất lượng giáo dục, và không mang tính đại diện. Phần 2 sẽ đi vào những bất ổn trong phương pháp thực hiện.   

Có một sự thật rất quan trọng nhưng ít ai chú ý là vấn đề thiếu dữ liệu. Chỉ có khoảng 10% học sinh trả lời tất cả 28 câu hỏi đọc hiểu. Điều này có nghĩa là nếu một em học sinh có điểm khoa học là 500 (cũng là điểm trung bình của khối OECD) thì em này chỉ trả lời được 46% câu hỏi mà thôi. Một học sinh có điểm 400 nghĩa là em này chỉ trả lời 23% số câu hỏi. Nói cách khác, rất nhiều câu hỏi không được trả lời. 

Sự thật trên có nghĩa gì? Nó có nghĩa là khi PISA so sánh giữa các nước thì chẳng khác gì so sánh giữa trái cam và trái táo. Một ví dụ để minh họa: học sinh Việt Nam có thể trả lời câu hỏi 1-20, còn học sinh Trung Quốc có thể trả lời câu hỏi 15-28. Những câu hỏi mà học sinh Việt Nam trả lời có thể khó hơn những câu hỏi mà học sinh Trung Quốc trả lời. Do đó, khi so sánh giữa hai nhóm thì kết quả sẽ khó mà khách quan. 

Trong tình huống câu hỏi bị bỏ trống như thế, các nhà phân tích của PISA làm gì? Họ sử dụng một mô hình thống kê có tên là Rasch để khắc phục vấn đề. Rất khó giải thích mô hình Rasch trong bài này, nhưng phương pháp này dựa vào giả định rằng các câu hỏi có trọng số như nhau, và cách lấp vào khoảng trống các câu hỏi là dùng xác suất hậu định (posterior probability). Giả định này rất "mạnh" (hiểu theo nghĩa thiếu tính thực tế), bởi vì câu trả lời hay khả năng trả lời có thể còn tuỳ thuộc vào văn hoá của từng nước. 

Ngoài ra, họ sử dụng một phương pháp thống kê khác có tên là imputation để lấp vào những câu hỏi mà học sinh bỏ trống. Phương pháp này có thể giải thích nôm na như sau: dựa vào các câu trả lời mà các em học sinh đã làm, nếu các em học sinh trả lời tất cả các câu hỏi, thì kết quả sẽ xảy ra có thể ước tính.   

Nói cách khác, các nhà nghiên cứu tạo ra dữ liệu không có thật!  Đây là một phương pháp khá nguy hiểm vì nó tuỳ thuộc vào những câu trả lời mà các em học sinh đã nỗ lực trong test. Trong các công trình nghiên cứu quan trọng rất ít ai dám ứng dụng phương pháp imputation vì nó có thể dẫn đến sai lệch nghiêm trọng. 

{keywords}
Ảnh minh họa

Về mặt kĩ thuật, tất cả những câu hỏi của PISA rất tương quan với nhau. Dù thi 3 môn nhưng điểm 3 môn rất tương quan với nhau, nên chỉ cần biết một môn là giải thích 75% môn kia. Nói cách khác các môn học chỉ phản ảnh một yếu tố đơn thôi, nếu thiết kế tốt các môn học sẽ ít tương quan với nhau. Điều này có nghĩa gì? Nó có nghĩa là khi PISA xếp hạng giữa các nước chủ yếu là dựa vào yếu tố này, nhưng yếu tố này không đồng đều giữa các nước.  

Nói cách khác, thứ hạng của một nước trong bảng xếp hạng có thể thay đổi nếu xem xét đến yếu tố thứ 2 hay thứ 3. Nói cách khác nữa, bảng xếp hạng của PISA không nói gì về sự thông minh của học sinh Việt Nam. 

Vì những vấn đề về phương pháp, việc so sánh hay xếp hạng giữa các nền giáo dục có nền tảng văn hoá và triết lí giáo dục khác nhau càng làm cho vấn đề trở nên khó diễn giải. Ở đây, tôi phải mở ngoặc để nói thêm rằng ngoài PISA, còn có nhóm xếp hạng  dựa vào chương trình TIMSS (Trends in International Maths and Science Study – Xu hướng học toán và khoa học quốc tế) cũng là một nhóm xếp hạng giáo dục có uy tín.  

Nhưng kết quả xếp hạng của PISA và TIMSS không nhất quán với nhau. Chẳng hạn như Phần Lan có năm đứng đầu trong bảng xếp hạng của PISA, nhưng lại đứng hạng trung bình của TIMSS. Rất nhiều trường hợp như thế đã xảy ra trong quá khứ. Chúng ta phải rất thận trọng, không nên quá đặt nặng hay quá tin vào các chương trình đánh giá và xếp hạng như PISA hay TIMSS. 

Nói tóm lại, các phân tích trên đây cho phép tôi diễn giải kết quả xếp hạng giáo dục một cách khác với cách hiểu của giới báo chí, và có lẽ cũng khác với cách hiểu của OECD. Rõ ràng, kết quả hai môn toán và khoa học của một nhóm học sinh thiếu tính đại diện cho cả nước thì không thể nào phản ảnh chất lượng giáo dục của Việt Nam.  

Trong khoa học xã hội, người ta phân biệt cái gọi là tính hợp lí bề mặt và hợp lí nội tại. Kết quả xếp hạng của OECD về nền giáo dục Việt Nam dựa trên điểm kiểm định trong chương trình PISA nhìn bề ngoài thì có tính hợp lí vì nó được thiết kế một cách có hệ thống và được thu thập dữ liệu đúng qui trình. Nhưng những kết quả bằng con số thống kê đó không phản được cái phần "chất" của nền giáo dục, không biết đến con số hơn 100 ngàn học sinh Việt Nam đang "tị nạn" giáo dục ở nước ngoài, kể cả ở những nước như Úc và Mỹ mà bảng xếp hạng OECD cho là kém hơn Việt Nam.  

Chỉ có người ở trong chăn mới biết chăn có rận; con số thống kê của OECD không bao giờ nhận dạng được những bất cập trong nền giáo dục Việt Nam. Do đó, nói một cách dân dã vừa ngắn gọn vừa dễ hiểu: bảng xếp hạng giáo dục của OECD nói vậy mà thực tế không phải vậy.

Nguyễn Văn Tuấn