Tỉ lệ tốt nghiệp: địa phương nào đáng nghi ngờ nhất ?

Thống kê không đơn thuần là show ra các số liệu hoặc so sánh đơn giản sự hơn kém, mà quan trọng là các phương pháp thống kê khoa học để đưa ra các kết luận có sức thuyết phục cao. Bài viết của GS. Nguyễn Văn Tuấn (Sydney, Australia) liên quan đến chủ đề tỉ lệ học sinh VN tốt nghiệp PTTH là một ví dụ rất tiêu biểu về ứng dụng các phương pháp thống kê để đánh giá một cách khoa học về các con số học sinh tốt nghiệp so sánh giữa các tỉnh. Đây cũng là một đánh giá hết sức khoa học để nói được “bệnh thành tích” ở tỉnh nào “đáng nghi nhất”. Qua bài viết này, chúng ta có thể thấy rằng các phương pháp và bằng chứng khoa học luôn có sức thuyết phục lớn đối với mọi vấn đề. Xin chân thành cảm ơn GS Nguyễn Văn Tuấn đã cho phép đăng lại series bài viết này.

=============================================================

Tỉ lệ tốt nghiệp: địa phương nào đáng nghi ngờ nhất ? In Email
Liên quan đến vấn đề tỉ lệ thi tốt nghiệp trung học phổ thông quá cao, phó thủ tướng Nguyễn Thiện Nhân yêu cầu rà soát lại xem địa phương nào có “thành tích” đáng nghi ngờ. Có nhiều cách làm để “rà soát”. Cách nghiêm chỉnh là xem tỉ lệ tốt nghiệp của từng trường qua nhiều năm. Cách làm thứ hai không tốt lắm là phân tích tỉ lệ tốt nghiệp trung bình toàn tỉnh qua nhiều năm. Bài này muốn “offer” ngài phó thủ tướng một phương pháp có thể nhận dạng ra địa phương nào đáng nghi ngờ.

Thật ra, câu hỏi đáng lẽ phải là “Tỉnh / thành nào có tỉ lệ học sinh đỗ trung học phổ thông cao nhất?”. Đây là một câu hỏi chiếm khá nhiều thời lượng suy nghĩ của tôi. Để trả lời câu hỏi này, cần phải có dữ liệu về số học sinh tham dự thi tốt nghiệp trung học phổ thông (THPT) qua từng năm, của từng trưởng, trong từng tỉnh. Với số liệu như thế thì việc trả lời câu hỏi trên không khó mấy. Tuy nhiên, trong điều kiện thiếu thốn dữ liệu, tôi nghĩ chúng ta có thể dựa vào tỉ lệ tốt nghiệp THPT mà các tỉnh thành và Bộ Giáo dục & Đào tạo công bố để trả lời câu hỏi trên. 

Dễ mà không đơn giản !

Có lẽ đối với nhiều người, câu trả lời quá đơn giản: chỉ cần tìm tỉ lệ tốt nghiệp THPT của một năm nào đó (như năm 2010 chẳng hạn), và sắp xếp từ cao đến thấp, và nhận dạng địa phương có tỉ lệ tốt nghiệp cao nhất. Thật ra, đây cũng chính là phương pháp mà các quan chức trong Bộ Giáo dục và Đào tạo từng làm. Phương pháp này có lợi thế là đơn giản. Ai làm cũng được. Học sinh lớp 5 có thể làm được dễ dàng với software như Excel.

Nhưng phương pháp đơn giản đó có một khiếm khuyết lớn: đó là chưa tính đến độ tin cậy của một địa phương. Để thấy sai lầm của phương pháp đó, chúng ta có thể xem qua số liệu thực tế về tỉ lệ tốt nghiệp THPT của 2 địa phương Hải Phòng và Hải Dương trong 4 năm 2007 – 2010:

Địa phương

2011

2010

2009

2008

2007

Trung bình
Hải Phòng

98.46

98.86

93.66

90.40

76.90

91.6

Hải Dương

99.32

99.28

91.56

87.60

78.10

91.2

 

Tỉ lệ tốt nghiệp (trung bình) của Hải Phòng là 91.6%, và Hải Dương là 91.2%. Nhìn vào bảng trên, chúng ta có thể kết luận rằng Hải Phòng “giỏi” hơn Hải Dương? Cố nhiên là không. Bởi vì nếu nhìn kĩ, chúng ta sẽ thấy độ dao động của Hải Phòng cao hơn Hải Dương. Thật vậy, phương sai của Hải Phòng là 80.3, còn của Hải Dương là 78.9. Nói cách khác, tuy Hải Dương có tỉ lệ tốt nghiệp tương đối thấp hơn Hải Phòng, nhưng tỉ lệ của Hải Dương đáng tin cậy (hiểu theo nghĩa dao động ít hơn) Hải Phòng. Do đó, không thể xếp hạng bằng cách đơn giản dựa vào tỉ lệ trung bình, và càng không thể dựa vào tỉ lệ tốt nghiệp của một năm, bởi vì độ dao động khá lớn giữa các năm trong một địa phương.

Một khía cạnh khác cũng có phần phức tạp hơn là mối tương quan giữa tốc độ tăng trưởng tỉ lệ tốt nghiệp và tỉ lệ tốt nghiệp năm 2007 (năm đầu khi ông Nguyễn Thiện Nhân bắt đầu phong trào “Hai Không”). Tính trung bình cho cả nước, tỉ lệ tốt nghiệp THPT tăng 9% mỗi năm (tôi gọi đó là “tốc độ tăng trường”). Nhưng không phải tỉnh thành nào cũng có cùng tốc độ tăng trưởng, mà tốc độ này dao động từ dưới 0 đến 25% mỗi năm! Điều quan trọng hơn là tốc độ tăng trưởng có liên quan nghịch đảo với tỉ lệ tốt nghiệp năm 2007 (xem Biểu đồ 1 dưới đây). Theo biểu đồ này, những tỉnh có tỉ lệ tốt nghiệp thấp trong năm 2007 thì trong những năm sau tỉ lệ tốt nghiệp tăng rất nhanh; ngược lại, những tỉnh có tỉ lệ tốt nghiệp cao (như TPHCM, Nam Định, Hà Nam) thì tốc độ tăng trưởng khá chậm. Đây còn gọi là hiện tượng “regression toward the mean effect”, tức là ảnh hưởng hồi qui trung bình. Nói cách khác, tỉnh nào có tỉ lệ quá cao hay quá thấp co xu hướng quay về trung bình toàn quốc. Đây là một đặc điểm rất quan trọng, vì nó gợi ý rằng phương pháp phân tích đơn giản không thể giải quyết được vấn đề phương sai.

Biểu đồ 1: Mối tương quan giữa tỉ lệ tốt nghiệp năm 2007 (trục hoành) và tốc độ tăng trưởng tỉ lệ tốt nghiệp trong thời gian 2007-2010. Biểu đồ cho thấy địa phương nào có tỉ lệ tốt nghiệp cao vào năm 2007 thì tỉ lệ tăng trưởng thấp hơn so với các tỉnh có tỉ lệ tốt nghiệp thấp. Đây là hiện tượng “regression toward the mean effect” rất phổ biến trong đo lường, và cần phải được điều chỉnh để so sánh giữa các tỉnh thành khách quan hơn.

Phương pháp khách quan hơn

Do đó, phương pháp xếp hạng khách quan phải dựa vào hai chỉ số: trung bình và phương sai. Một phương pháp xếp hạng dựa vào 2 chỉ số đó là mô hình mà giới thống kê học gọi là Empirical Bayes (EB), có lẽ tạm dịch là “Phương pháp Bayes thực tế” (nghe ngô nghê quá, nhưng ai hay chữ hơn, xin góp ý). Thật ra, đây là phương pháp mà giới nghiên cứu về chất lượng giáo dục và xếp hạng trường học thường hay sử dụng và kết quả rất thành công. Có thể đọc một bài báo tiêu biểu về mô hình này của Nan Laird và Thomas Louis (Empirical Bayes ranking methods) đăng trên tập san J Educat Stat 1989; 1:29-46).

Nó một cách ngắn gọn, phương pháp EB dựa vào lí thuyết đo lường (theory of measurement), vốn hay áp dụng trong các xét nghiệm sinh hóa và lâm sàng. Có lẽ tôi phải giải thích về lí thuyết này. Hãy hình dung tỉ lệ tốt nghiệp THPT (tôi sẽ gọi tắt là Y) của một địa phương như Thành phố Hồ Chí Minh trong 4 năm 2007-2010 là 94.6%, 93.3%, 95.1%, và 96.1%. Như vậy, tính trung bình tỉ lệ tốt nghiệp của TPHCM trong 4 năm là 94.8%, với phương sai 1.36. (Xin nhắc lại, phương sai là một chỉ số đo lường độ dao động của một biến số. Phương sai cao có nghĩa là độ dao động hay biến chuyển cao, và đo lường có độ tin cậy thấp). Lí thuyết đo lường phát biểu rằng giá trị quan sát (observed value; trong trường hợp này là tỉ lệ tốt nghiệp THPT mỗi năm) của một địa phương là tổng số của giá trị thật (true value) và sai số ngẫu nhiên. Gọi Yj là tỉ lệ tốt nghiệp THPT của một năm j, trị số thật là T, và sai số ngẫu nhiên là E, phát biểu đó có nghĩa là:

Yj = T + Ej

Nói cách khác, tỉ lệ tốt nghiệp trong mỗi năm dao động chung quanh con số thật T với một độ khác biệt là E. Trong ví dụ của TPHCM, phát biểu trên có thể hiểu là:

Yj = 94.8 + Ej

Giả định rằng T E độc lập nhau (tức không có tương quan gì với nhau), chúng ta có thể phát biểu thêm rằng phương sai của Y bằng phương sai của T cộng với phương sai của E. Gọi phương sai của Y là S, phương sai của T là ST, và phương sai của E là SE, chúng ta có thể viết:

S = ST + SE

Từ đó, giới thống kê giáo dục định nghĩa hệ số tin cậy (coefficient of reliability, kí hiệu là R) là:

R = ST / S

Do đó, nếu R gần bằng 1 thì điều đó có nghĩa là độ dao động giữa các năm trong một địa phương rất nhỏ. Tuy nhiên, ở đây, chúng ta sẽ không mấy quan tâm đến R, vì mục tiêu là tìm một phương pháp để xếp hạng các tỉnh.

Nhưng trong thực tế, chúng ta có đến 63 tỉnh thành (tôi sẽ gọi chung là “địa phương”). Do đó, chúng ta có 63 giá trị T, và 63 giá trị E. Bây giờ, chúng ta phải thêm một kí hiệu tiếp ngữ i để chỉ từng địa phương (tức là i = 1, 2, 3, …, 63). Do đó, thay vì viết T E, chúng ta nên viết chính xác hơn là TiEi. Chúng ta giả định rằng tập hợp Ti tuân theo luật phân phối chuẩn với trung bình là m và phương sai là u, và tập hợp Ei tuân theo luật phân phối chuẩn với trung bình 0 và phương sai v. Bằng định lí Bayes, chúng ta có thể ước tính Ti như sau:

Ti = (m/u + Yi/v) / (1/u + 1/v)

Và phương sai là:

Wi = 1/(1/u + 1/v)

Công thức trên cho thấy tỉ lệ thật của một địa phương thực chất là một trọng số trung bình (weighted average) giữa tỉ lệ của địa phương đó và tỉ lệ trong quần thể (tức toàn quốc), với trọng số là số đảo của phương sai của địa phương và phương sai của quần thể. Như vậy, địa phương có phương sai cao sẽ có “tỉ lệ thật” (Ti) thấp hơn so với địa phương có phương sai thấp nhưng có cùng tỉ lệ quan sát (Yi). Do đó, phương pháp này vừa mang tính logic mà còn khách quan.

Nói cách khác, tỉ lệ tốt nghiệp trung bình về lâu về dài của một địa phương i Ti với phương sai là Wi. Vì chúng ta giả định rằng hai tỉ lệ tốt nghiệp tuân theo luật phân phối chuẩn, cho nên với 2 thông số TiWi, chúng ta có thể xếp hạng các tỉnh một cách dễ dàng. Các thông số m, u, v được ước tính từ số liệu thực tế từ năm 2007 đến 2010.

Số liệu về tỉ lệ tốt nghiệp THPT mà tôi và đồng nghiệp thu thập được. Số liệu này chỉ đơn thuần là tỉ lệ tốt nghiệp trung bình cho 65 tỉnh thành từ năm 2006 đến 2011. Bởi vì năm 2006 là “đỉnh” của bệnh thành tích, nên tôi chỉ dùng số liệu từ năm 2007 đến 2011 cho ước tính các thông số trên.

Cách tôi làm bắt đầu bằng một câu hỏi: xác suất mà một địa phương có tỉ lệ tốt nghiệp trên 90% là bao nhiêu? Dựa vào thông số TiWi, chúng ta có thể ước tính xác suất trên một cách dễ dàng. Tôi chọn ngưỡng 90% để làm ngưỡng “đỗ” chỉ vì thuận tiện, chứ trong thực tế, chúng ta có thể chọn bất cứ ngưỡng nào. Gọi xác suất trên là Z90, chúng ta có thể dựa vào Z90 mà xếp hạng. Nói cách khác, địa phương nào có Z90 càng cao thì đó là một chỉ số thể hiện học sinh địa phương đó học giỏi (=đỗ nhiều).

Kết quả

Nếu dựa vào tỉ lệ tốt nghiệp (tính trung bình từ 2007 – 2011) thì 5 địa phương đứng đầu bảng là: Nam Định, với tỉ lệ tốt nghiệp THPT 95.7%; kế đến là TPHCM với tỉ lệ trung bình 94.4; Hà Nam (92.5%); Hải Phòng (89.9%); và Bắc Ninh (89.1%). Năm địa phương đứng cuối bảng là: Bắc Kạn (48.6%), Sơn La (52.3%), Cao Bằng (55.6%), Sóc Trăng (62.1%), và Yên Bái (62.6%). Tuy nhiên, như tôi trình bày trên, cách xếp hạng này không khách quan, vì chỉ dựa vào chỉ số trung bình, mà chưa tính đến độ dao động trong mỗi địa phương.

Dùng phương pháp EB (Empirical Bayes), tôi có một kết quả khác và tôi tin là khách quan hơn. Chẳng hạn như Nam Định, mặc dù có tỉ lệ thực tế (trung bình 2007-2011) là 95.7%, cao hơn TPHCM 94.4%; nhưng vì phương sai của Nam Định là 17.75, cao hơn TPHCM (chỉ 0.59), cho nên tỉ lệ thật (hay tỉ lệ về lâu về dài) của Nam Định là 92.8%, thấp hơn TPHCM (94.3%). Chú ý tỉ lệ thật của TPHCM chẳng khác gì so với tỉ lệ thực tế, bởi vì độ dao động qua các năm của TPHCM quá thấp, và điều này chứng tỏ TPHCM không có bệnh thành tích nặng nề như các nơi khác. Kết quả cách xếp hạng này có thể xem trong bảng số liệu dưới đây.

Theo phân tích EB, thì TPHCM có tỉ lệ tốt nghiệp “thật” (true average) là 94.3%, và phương sai chỉ 0.58, tức rất ít dao động qua các năm, và xác suất mà TPHCM có tỉ lệ tốt nghiệp cao hơn 90% là 1. Do đó, TPHCM được xếp hạng số 1 trong bảng “học giỏi”. Nam Định tuy có tỉ lệ trung bình thực tế cao hơn TPHCM, nhưng vì độ dao động (phương sai) cao hơn TPHCM đến 26 lần, cho nên tỉ lệ thật chỉ 92.8% (tức thấp hơn TPHCM), và do đó, xác suất mà tỉ lệ tốt nghiệp trên 90% là 0.76. Nam Định được xếp vào hạng 2. Danh sách “top 10” và “bottom 10” có thể tóm lược trong bảng sau đây:

 

Top 10 Bottom 10
Thành phố Hồ Chí Minh

Nam Định

Hà Nam

Thái Nguyên

Hải Phòng

Hải Dương

Bắc Ninh

Lâm Đồng

Vĩnh Phúc

Đà Nẵng

Dak Lak

Đồng Tháp

Bến Tre

Bình Thuận

Sóc Trăng

Trà Vinh

An Giang

Kiên Giang

Tây Ninh

Ninh Thuận

 

Điều thú vị là trong danh sách top 10, có đến 7 tỉnh từ miền Bắc, chỉ có 2 địa phương từ miền Trung và Nam (Đà Nẵng, Lâm Đồng và TPHCM). Trong khi đó, trong danh sách bottom 10 có đến 6 tỉnh từ Đồng bằng sông Cửu Long, 1 tỉnh thuộc vùng Tây Nguyên (Dak Lak), và đặc biệt không có tỉnh nào thuộc miền Bắc. Điều đau lòng với tôi là Kiên Giang nằm trong danh sách “bottom 10” do chính phương pháp của tôi!😦

Tuy nhiên, bất cứ phương pháp xếp hạng nào cũng chỉ có giá trị khi số liệu được thu thập một cách tối ưu, và đáp ứng các giả định đặt ra. Như tôi đề cập trong phần đầu, những số liệu này chưa phải là tốt nhất, vì thiếu hai số liệu quan trọng là số học sinh thi. Phải có số liệu này thì tỉ lệ cho từng tỉnh thành sẽ chính xác hơn. Ngoài ra, một giả định rất quan trọng trong phân tích này là tỉ lệ tốt nghiệp trong mỗi tỉnh thành phải tuân theo luật phân phối chuẩn, nhưng chúng ta chưa có dữ liệu đầy đủ để kiểm tra xem giả định này đúng hay không. Trong bối cảnh tỉ lệ tốt nghiệp đều tăng theo thời gian, chúng ta có thể đặt câu hỏi về vấn đề giả định. Tuy nhiên, qua số liệu có được như hiện nay, có lẽ ảnh hưởng của giả định không nghiêm trọng bằng chất lượng của số liệu.

Nói tóm lại, tỉ lệt tốt nghiệp THPT của bất cứ tỉnh thành nào cũng đáng nghi ngờ. Nhưng vấn đề là mức độ nghi ngờ cao hay thấp mà thôi, và trong trường hợp này có thể áp dụng phương pháp EB để xem xét. Một điều chắc là không thể và không nên dựa vào tỉ lệ tốt nghiệp THPT trung bình hay của một năm vì một đặc điểm gần như là qui luật ở VN là độ biến chuyển về tỉ lệ tốt nghiệp qua các năm quá lớn, lớn hơn cả độ khác biệt giữa các địa phương. Vấn đề chủ yếu là “bệnh thành tích” nên tỉ lệ tốt nghiệp của bất cứ năm này cũng khó tin được. Do đó, điều chỉnh cho phương sai là một cách đánh giá công bằng hơn là dựa vào một số liệu thực tế.   Phương pháp tôi trình bày trong bài này thật ra có thể ứng dụng để xếp hạng các trường, nhưng số liệu đòi hỏi chi tiết hơn. Hi vọng rằng phương pháp này sẽ được sử dụng nhiều hơn nữa ở nước ta (thật ra thì các nước tiên tiến đều sử dụng phương pháp EB) để xếp hạng các trường hay tỉnh/thành một cách khách quan hơn.

An Giang có tỉ lệ tốt nghiệp THPT năm 2011 đáng nghi ngờ nhất

Bây giờ chúng ta sẽ cố gắng trả lời băn khoăn của Phó thủ tướng Nguyễn Thiện Nhân về tỉnh thành có tỉ lệ tốt nghiệp tăng bất ngờ.  Tôi thì nghĩ đáng ngờ, hơn là bất ngờ.  “Đáng ngờ” ở đây có nghĩa là tỉ lệ tốt nghiệp năm 2011 có vẻ tăng hay giảm một cách bất bình thường. Vấn đề do đó là tìm ngưỡng thời gian để định nghĩa “bình thường”. Chúng ta biết rằng bệnh thành tích đã ăn sâu vào hệ thống giáo dục rất lâu, nên khó có thể nói năm nào là “sạch” hay bình thường được. Nhưng trong những năm bất bình thường, tôi thấy (qua quan sát dữ liệu về tỉ lệ tốt nghiệp THPT) năm 2006 đến 2009 là tương đối ổn định. Do đó, chúng ta sẽ so sánh tỉ lệ tốt nghiệp năm 2011 với tỉ lệ trung bình 2006-2009.

Về mặt phân tích, chúng ta có thể tiếp cận vấn đề một cách đơn giản như sau:

  • Ở mỗi địa phương, tính tỉ lệ tốt nghiệp “thật” (chỉ là ước tính thôi), và gọi đó là Ti như đề cập trong bài trước (chú ý i ở đây có nghĩa là mã số cho từng tỉnh, i=1 đến 63); chỉ tính trong thời gian 2006 đến 2009 vì đây là thời gian tỉ lệ tương đối ổn định;
  • Ở mỗi địa phương, tính độ lệch chuẩn trong thời gian 2006 đến 2009, và gọi là Si như đề cập trên; Si chính là chỉ số phản ảnh độ dao động về điểm thi qua 4 năm;
  • Nhưng Si có thể tùy thuộc vào Ti, cho nên ở mỗi địa phương, chúng ta tính chỉ số Zi cho năm 2011: Zi = (tỉ lệ năm 2011 – Ti) / Si. Chỉ số Z không có đơn vị, và vì thế cho phép chúng ta so sánh giữa các tỉnh thành. Nếu Z bằng 0, thì điều đó có nghĩa là tỉnh thành đó có tỉ lệ tốt nghiệp năm 2011 bằng tỉ lệ trung trung bình 4 năm; nếu Z > 0, tỉ lệ năm 2011 cao hơn trung bình; và nếu Z < 0, tỉ lệ tốt nghiệp năm 2011 thấp hơn trung bình. Z càng cao, chúng ta càng có lí do để nghi ngờ tỉnh đó có vấn đề.

Dùng tỉ lệ tốt nghiệp 2006 đến 2011, tôi có kết quả như sau (Bảng 1). Có thể rút ra vài điểm chính trong bảng này như sau:

Thứ nhất, điều đáng chú ý đầu tiên là tất cả các tỉnh thành đều có Z trên 0. Nói cách khác, tỉ lệ tốt nghiệp THPT năm 2011 của tất cả các tỉnh thành đều cao hơn so với trung bình.

Thứ hai, An Giang là tỉnh đáng nghi ngờ nhất. Tỉ lệ tốt nghiệp THPT năm 2011 của An Giang là 98.3%, nhưng tỉ lệ trung bình 2006 – 2009 của tỉnh này chỉ 76.15 và độ lệch chuẩn là 3.54% (tức tương đối thấp). Do đó, chỉ số Z = (98.3 – 76.15) / 3.5 = 6.27. Nói cách khác, tỉ lệ tốt nghiệp năm 2011 của An Giang cao gấp 6.3 lần độ lệch chuẩn của chính tỉnh này! Đó là một tỉ lệ rất đáng nghi ngờ. Nghi ngờ dựa vào chính chuẩn của tỉnh An Giang!

Thứ ba, dùng cách phân tích trên, tôi nhận ra các tỉnh sau đây cũng đáng nghi ngờ nhất: Sóc Trăng, Quảng Bình, Kiên Giang, Bạc Liêu, Hậu Giang, Phú Yên, Cà Mau. Các tỉnh này có chỉ số Z cao 2 hoặc trên 2. Chỉ có 6 tỉnh thành là có chỉ số Z thấp hơn 1.

Chúng ta có thể chia “mức độ nghi ngờ” thành 3 nhóm. Nhóm 1 (thấp nhất) nếu chỉ số Z thấp hơn 1; nhóm 2 có độ nghi ngờ trung bình nếu Z trong khoảng 1 và 2; và nghi ngờ cao nhất là những tỉnh thành có chỉ số Z cao hơn hoặc bằng 2. Với cách phân loại đó, chúng ta có thể xem các tỉnh / thành đáng nghi ngờ cho 3 miền như sau.

Số tỉnh thành phân chia theo mức độ nghi ngờ về tỉ lệ tốt nghiệp 2011

Miền

Độ nghi ngờ cấp 1

Độ nghi ngờ cấp 2

Độ nghi ngờ cấp 3

Bắc

9 (75.0)

16 (37.2)

0 (0.0)

Trung

2 (16.7)

13 (30.2)

2 (25.0)

Nam

1 (8.3)

14 (32.6)

6 (75.0)

Tổng cộng

12

43

8

Số trong ngoặc là tỉ lệ cho từng nhóm

 

Trong số 63 tỉnh thành, phần lớn có độ nghi ngờ cấp 2 (43 tỉnh thành, chiếm 68%) và cấp 3 (8 tỉnh thành, hay 13%). Trong nhóm 8 tỉnh thành có độ nghi cờ cấp 3, 75% là các tỉnh thành miền Nam, đặc biệt là vùng Đồng bằng sông Cửu Long (miền Tây). Tuy nhiên, trong nhóm có độ nghi ngờ cấp 2 thì phân bố khá đều giữa 3 vùng. Trong số 12 tỉnh thành có độ nghi ngờ cấp 1, phần lớn (75%) là các tỉnh phía Bắc.

Nói tóm lại, để trả lời câu hỏi của Phó thủ tướng Nguyễn Thiện Nhân là tỉnh thành nào có tỉ lệ tốt nghiệp THPT đáng nghi ngờ nhất, tôi xin trả lời: đó là An Giang. Ngoài An Giang ra, các tỉnh trong vùng Đồng bằng sông Cửu Long (và Quảng Bình) là những địa phương có tỉ lệ tốt nghiệp THPT năm 2011 đáng nghi ngờ nhất. Cần nói thêm rằng An Giang từng được xem là nơi học giỏi nhất nhì ở miền Tây (thua Tiền Giang), từng có đại học trước 1975, mà bây giờ thì … 🙂.

Cũng cần nói thêm rằng những phân tích trên đây vẫn còn “thô”, vì chưa xem xét đến tỉ lệ từng trường qua nhiều năm. Nếu có số liệu từ Bộ Giáo dục và Đào tạo tôi có thể trả lời cụ thể trường nào đáng nghi ngờ nhất, và sẽ làm phân tích miễn phí cho Bộ.

NVT

Có thể xem thêm vài bài cũ:

Nhận diện các địa phương “siêu thành tích”

Nhận diện địa phương “học giỏi” nhất

Vài nhận xét từ kết quả thi tốt nghiệp trung học phổ thông 2009

Kết quả thi tốt nghiệp THPT 2009

 

===

Bảng 1. Tỉ lệ tốt nghiệp trung học phổ thông 2011 và chỉ số Z

Tỉnh / thành

Tỉ lệ tốt nghiệp năm 2011

Tỉ lệ trung bình 2006-2009

Độ lệch chuẩn 2006-2009

Chỉ số Z cho năm 2011

An Giang

98.30

76.15

3.54

6.27

Soc Trang

90.74

62.02

9.82

2.93

Quang Binh

99.29

76.26

7.94

2.90

Kien Giang

97.34

67.57

12.06

2.47

Bac Lieu

96.00

66.57

13.16

2.24

Hau Giang

97.94

70.36

13.14

2.10

Phu Yen

92.76

72.80

9.78

2.04

Ca Mau

93.16

75.21

9.03

1.99

Khanh Hoa

96.61

84.36

6.73

1.82

Ninh Thuan

91.85

75.23

9.38

1.77

Long An

90.70

84.88

3.30

1.76

Dien Bien

95.65

68.98

15.76

1.69

Can Tho

97.74

84.58

7.87

1.67

Son La

97.00

51.72

27.70

1.63

TPHCM

96.67

94.77

1.17

1.63

Dong Thap

94.60

75.10

12.13

1.61

Dong Nai

95.34

80.41

9.34

1.60

Thua Thien

97.00

77.52

12.36

1.58

Ba ria – Vung tau

97.21

79.52

11.51

1.54

Ha Tinh

99.14

82.75

10.92

1.50

Cao Bang

93.73

54.86

26.10

1.49

Binh Duong

90.70

72.85

12.04

1.48

Dak Lak

88.36

65.50

15.85

1.44

Lang Son

96.80

75.54

14.89

1.43

Tra Vinh

91.87

82.19

6.81

1.42

Ha Giang

94.11

63.23

23.36

1.32

Tay Ninh

88.70

79.40

7.18

1.30

Kon Tum

97.31

77.18

15.73

1.28

Quang Ngai

98.65

83.34

12.09

1.27

Vinh Long

86.58

79.26

5.84

1.25

Ninh Binh

99.87

82.90

13.55

1.25

Binh Phuoc

94.57

75.30

15.56

1.24

Yen Bai

98.91

62.24

29.68

1.24

Quang Nam

97.84

78.39

15.76

1.23

Gia Lai

88.33

70.84

14.25

1.23

Binh Dinh

96.84

84.37

10.19

1.22

Hai Duong

99.18

89.02

8.63

1.18

Quang Ninh

97.70

82.69

12.78

1.17

Bac Kan

88.70

53.91

29.91

1.16

Da Nang

97.20

86.69

9.06

1.16

Tien Giang

90.95

85.98

4.29

1.16

Lai Chau

92.00

70.62

18.50

1.16

Thanh Hoa

99.23

79.85

16.78

1.16

Vinh Phuc

96.10

87.10

7.97

1.13

Dak Nong

81.95

67.05

13.27

1.12

Binh Thuan

88.06

80.11

7.15

1.11

Bac Giang

99.37

82.14

15.68

1.10

Hoa Binh

97.04

66.96

27.78

1.08

Hung Yen

97.05

84.37

11.73

1.08

Ha Noi

97.79

85.06

11.81

1.08

Nghe An

97.83

72.71

23.64

1.06

Tuyen Quang

99.64

62.80

35.57

1.04

Ha Nam

99.69

92.31

7.15

1.03

Hai Phong

99.85

90.07

9.52

1.03

Phu Tho

99.21

77.65

21.18

1.02

Thai Binh

99.71

83.37

16.14

1.01

Bac Ninh

99.62

89.01

10.50

1.01

Nam Dinh

99.89

95.72

4.25

0.98

Quang Tri

94.74

72.44

23.10

0.97

Lam Dong

93.44

87.40

6.52

0.93

Ben Tre

84.15

82.30

3.20

0.58

Thai Nguyen

93.70

90.55

6.65

0.47

Lao Cai

82.00

76.33

16.84

0.34

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s