医学部合格率の男女差はおかしいのか?学部別男女合格率のデータ分析

2018年9月17日月曜日

データ分析

t f B! P L
東京医科大学が女性受験者を入試で一律減点していたことを受けて全医学部調査の男女合格率が波紋を呼んでいます。
そこで、学部別男女合格率を基に、医学部合格率の男女差が外れ値や異常値といえるのか?データ分析してみました。

医学部合格率の男女差はおかしいのか?学部別男女合格率のデータ分析1

医学部入試合格率の問題点

日本経済新聞 2018/9/4














文部科学省は9月4日、東京医科大の入試不正を受けて全国の医学部を対象にした調査で、過去6年間でいずれの年度も、男子の合格率が女子を上回っていたとする結果を公表しました。
各年度で男子優位だった大学の割合はそれぞれ6~7割。同省は「他の学部と合格率に違う傾向がある」として、大学側に詳しい説明を求めています。

医学部医学科を置く、防衛医科大を除く全国の81国公私立大に2013~18年度の入試において、全大学の合格率はいずれの年度も男子が高く、女子しか学生がいない東京女子医大を除いて算出すると、男子が上回った大学の割合は58~72%で推移しています。
同省は男子優位の原因は数字だけでは分析できないとしたうえで「他の学部学科で男女の合格率が同等か女子が多少優位な傾向にあるなか、医学部は違う傾向だ」と説明しました。

日本経済新聞 2018/9/4
文部科学省が毎年行っている学校基本調査によると、平成28年の大学入試における合格率(合格者/受験者)は、男性13.85%、女性16.39%です。
学部別では、女性の合格率が最も高いのは歯学部(22.72%)、ついで教育学部(22.1%)、医学部と看護学部を除く医学系学部(21.47%)、看護学部(17.41%)と続きます。
もともと「女性は文系が強く、男性は理系が強い」というイメージがありますが、ダイバーシティによるイノベーションを期待する意味で理系での女性活躍は国の男女共同参画の課題とされています。このような流れの中、男性が多いイメージが強い工学部でも、女性の合格率は男性より高くなっています。
 一方、理学部は女性の合格率が11.37%と男性(11.4%)をわずかに下回り、医学部については男性の合格率6.85%に対し、女性5.91%と他の学部に比較し極端に低いのが特徴的です。
女性医師を「増やさない」というガラスの天井 ~医師・医学生の女性比率に関する分析 ①~JAMP理事 種部恭子さん/一般社団法人 日本女性医療者連合
JAMP理事 種部恭子さん/一般社団法人 日本女性医療者連合

学部別男女合格率のデータ分析


仮説:医学部合格率の男女差は誤差の範囲にすぎない。


上記グラフを見ると、農学系では男女差が1.74%、歯学系では3.33%、教育系で3.08%あり、医学部系の0.94%の差は外れ値や異常値ではない、と思われます。

前提:男性受験者と女性受験者には学力の差がないことと、仮定します。

 外れ値とは、実験や調査で観測された値の中で、真の値の推定値*1からの残差*2が異常に大きい観測値のことです。
同じ本の中で、外れ値と異常値を使い分けていることがありますが、この場合、外れ値の中でも外れ値となった理由があるものを異常値としています。
例えば、子供の平熱を調べていたら風邪で熱を出している子が紛れ込んでしまったような場合です。
 さて、どれくらいだと異常に大きいとみなすのかというと、正規分布するような値であれば、残差が標準偏差の 2倍から3倍以上あるときとすることが多いですね。
確率的には、残差が標準偏差の 2倍以上とするなら4.6%程度、3倍以上とするなら 0.3%程度の出現率ということになります。
エクセル統計では外れ値検定に含まれる「スミルノフ・グラブス検定」という手法を使って外れ値を検出できます。スミルノフ・グラブス検定では平均値から最も離れた観測値を選び、その残差をσで割った値を検定統計量とします。
外れ値が見つかったら、これを除外して検定をやり直すということを続けていくと、外れ値の無いデータセットを作ることができます。
統計WEB より

このデータは外れ値であると判定する方法
極端に値が大きなデータ、または小さなデータがあったとき、「これは外れ値だろうから除去してしまえ」と分析者が主観で判断するわけにはいきません。
外れ値であると判断する方法としては、
  • スミルノフ・グラブス検定をつかう方法
  • 四分位範囲(IQR)を利用した方法
があります。
統計学入門 より

スミルノフ・グラブス検定を使って外れ値や異常値でないことを証明する

医学部合格率の男女差はおかしいのか?学部別男女合格率のデータ分析2

p=0.369368398
になりました。
よって、5%水準での有意性が認められたことになります。

したがって、医学部合格率の男女差0.94は、外れ値や異常値として処理しても文句がつきにくい、ということがいえます。

四分位範囲(IQR)を使って四分位範囲に含まれていることを証明する

四分位数はデータを最小値から最大値まで順に並べて4分割(25%ずつ)した時、
第1四分位数(Q1):25%の値
第2四分位数(Q2):50%の値(中央値)
第3四分位数(Q3):75%の値
となります。

四分位範囲、すなわち第3四分位数(点)から第1四分位数(点)を引いた値が中央値を含めたデータの50%の範囲、というわけです。

医学部合格率の男女差はおかしいのか?学部別男女合格率のデータ分析

医学部合格率の男女差は0.94%であるため、中央値である第二四分位数に近く、四分位範囲の中にある、といえます。
したがって、医学部合格率の男女差は中央値を含めたデータの50%の範囲にあるといえ、外れ値や異常値として処理しても文句がつきにくい、ということがいえます。

医学部合格率の男女差の原因を考察


それでは医学部合格率の男女差は、どうして生じたのでしょうか?

看護や医学その他、歯学では逆に女性の合格率の方が、男性の合格率を上回っていました。
考えられる要因の一つとしては、看護などの第一志望者が「記念受験」として医学部を受験したのでは?と考えました。

参照

外れ値や異常値を判断する統計処理をエクセルでやる方法

四分位数(点)、四分位範囲、四分位偏差についてまとめてみた。Excelと数学Ⅰの違いは? / データ分析の解説

医科大・医学部入試の男女差をPythonで仮説検定する/Qiita

このブログを検索

Translate

QooQ