
Lý giải về những thắc mắc xoay quanh cách tính điểm thi đánh giá tư duy (TSA), PGS.TS Vũ Duy Hải, Trưởng ban Tuyển sinh - Hướng nghiệp, Đại học Bách khoa Hà Nội, cho hay từ trước đến nay, hầu hết các kỳ thi tại Việt Nam đều cộng cơ học điểm số của tất cả các câu làm kết quả đánh giá cuối cùng, hay còn gọi là điểm thô.
Chẳng hạn, với đề kiểm tra có 100 câu hỏi, mỗi câu hỏi trả lời đúng đạt được 1 điểm, thí sinh làm đúng 70 câu sẽ được 70 điểm.
Theo ông Hải, nhược điểm của cách tính này là khó phân biệt được khả năng của các thí sinh có cùng điểm thô khi làm cùng một đề thi ở một thời điểm. Ngoài ra, khi tính bằng điểm thô, năng lực của thí sinh sẽ thay đổi khi làm hai đề thi có độ khó khác nhau ở một thời điểm.
Đại học Bách khoa Hà Nội không sử dụng cách tính này mà áp dụng một lý thuyết đánh giá mới, đó là lý thuyết ứng đáp câu hỏi (IRT).
Lý thuyết này đưa ra giả thuyết là mỗi thí sinh trả lời một câu hỏi trong đề kiểm tra có một mức năng lực nhất định. Thí sinh có năng lực cao sẽ có xác suất trả lời đúng một câu hỏi bất kỳ cao hơn so với thí sinh có năng lực thấp. Dựa vào đó, nhà trường có thể định lượng được các tham số về độ khó và độ phân biệt của câu hỏi cũng như năng lực của thí sinh.
Đại học Bách khoa Hà Nội đang triển khai áp dụng mô hình lý thuyết IRT hai tham số (độ khó và độ phân biệt) ở bài thi TSA. Theo đó, thí sinh càng làm được nhiều câu hỏi khó thì điểm số TSA sẽ càng cao và ngược lại, nếu thí sinh chỉ làm được những câu hỏi dễ thì điểm số TSA sẽ thấp.
“Điều này dẫn đến việc các thí sinh có thể có điểm thô giống nhau hay nói cách khác là trả lời đúng được số câu hỏi như nhau nhưng sẽ đạt điểm TSA khác nhau”, ông Hải nói.

Tuy nhiên, để đảm bảo yếu tố chính xác và công bằng giữa các đợt thi, ông Hải cho biết trường còn áp dụng thuật toán chấm điểm theo nhiều công đoạn, xử lý trên dữ liệu thi chung trước đó để ước lượng các tham số, sau đó mới tính toán ra điểm số TSA cho từng thí sinh.
Quy trình 4 bước chấm điểm IRT hai tham số trong TSA như sau:
Bước 1: Căn cứ theo kết quả làm bài của toàn bộ thí sinh trong từng kíp thi, phần mềm chấm thi sẽ thực hiện ước lượng độ khó và độ phân biệt của từng câu hỏi trong đề thi hiện tại.
Bước 2: Phần mềm chấm thi thực hiện ước lượng điểm năng lực tư duy của từng thí sinh dựa theo kết quả làm bài thi và thang đo của đề thi hiện tại.
Bước 3: Phần mềm chấm thi thực hiện quy đổi thang đo của đề thi hiện tại về thang tham chiếu chung với các đợt thi trước để đưa điểm năng lực tư duy của thí sinh về cùng một thang đo.
Bước 4: Phần mềm chấm thi thực hiện quy đổi điểm năng lực tư duy của thí sinh đã tham chiếu sang thang điểm TSA.
Như vậy, với quy trình chấm điểm IRT hai tham số như trên, điểm TSA không chỉ được xác định từ số câu trả lời đúng của thí sinh mà là từ toàn bộ kết quả trả lời của thí sinh đó trên bài thi.
“Chính vì vậy, nếu thí sinh làm đúng nhiều câu hỏi ở dải khó và có độ phân biệt cao thì điểm TSA cũng sẽ cao. Ngược lại, nếu thí sinh chủ yếu làm đúng các câu dễ và trung bình thì điểm TSA sẽ thấp”, ông Hải chia sẻ.
