テストの良し悪しを数字で見る — α係数・S-P表・得点分布
テストは、採点して点数を出したら終わり、ではありません。 「このテストは信頼できる出来だったか」「どの設問でどんな生徒がつまずいたか」を あとから振り返ると、次のテスト作りや指導に生かせます。 一括採点の結果出力に、クロンバックα係数・S-P表・得点度数分布という 3つの分析が加わりました。追加の入力や設定はいらず、採点データからそのまま計算されます。
クロンバックα係数 — テストの信頼性を測る
クロンバックα係数(クロンバックのアルファ)は、 テスト全体がどれだけ「安定して測れているか」を表す数値です。 0から1の間の値になり、1に近いほど信頼性が高いとされます。 目安として、0.8を超えていれば十分に信頼できるテスト、といった見方をします。
少し噛み砕くと、「よくできる生徒はどの設問でも点を取り、 苦手な生徒はどの設問でも取りにくい」というように、 設問どうしが同じ方向を向いているほどα係数は高くなります。 逆に、まぐれ当たりが多かったり、他とかみ合わない設問が混ざっていたりすると、値は下がります。
低いからといって「悪いテスト」と決まるわけではありません。 設問数が少ない、難易度がかたよっている、といった原因が考えられます。 設問ごとの識別力(下で説明するD値)とあわせて見ると、 どの設問が足を引っ張っているかの見当が付きます。
あわせて、設問ごとのD値(識別力)も出力されます。 これは「その設問が、できる生徒とできない生徒をうまく見分けられているか」を表す数値です。 部分点も比例して反映して計算し、値の大きさに応じてセルが色分けされるので、 表を見ればひと目で「よく効いている設問」「見直したい設問」が分かります。 識別力の考え方は、別記事の識別係数の解説でくわしく紹介しています。
S-P表 — 生徒と設問の「気になるところ」を見つける
S-P表(エス・ピーひょう)は、 S(Student=生徒)を縦に、P(Problem=設問)を横に並べ、 正解・不正解を一覧にした表です。 生徒は得点の高い順、設問は正答率の高い順に並べ替えられるので、 表の左上に正解が、右下に不正解が集まるのがふつうの姿になります。
この「ふつうの姿」から外れているところが、注目したいポイントです。 たとえば、よくできている生徒が易しい設問を落としていたり、 苦手な生徒が難しい設問だけ正解していたりすると、表の中で目立ちます。 こうした「引っかかり」を数値にしたのが、佐藤の注意係数です。
- 注意係数の高い生徒— 得点のわりに答え方にばらつきがある生徒。ケアレスミスや理解のムラ、勘での正解などが疑われます。
- 注意係数の高い設問— 正答率のわりに正解・不正解の分かれ方が不自然な設問。設問の書き方や選択肢を見直す手がかりになります。
S-P表は、点数だけでは見えない「どこでつまずいたか」を面で見せてくれます。 個別の指導や、次のテストの設問改善に役立てられます。
得点度数分布 — 点数のばらつきを見る
得点度数分布は、 「何点の生徒が何人いたか」を棒グラフ(ヒストグラム)で表したものです。 点数の範囲をおよそ10段階に区切って人数を数え、あわせて平均点と標準偏差も出力します。
標準偏差は、点数が平均のまわりにどれくらい散らばっているかを表す数値です。 山が1つで左右に広がっていれば素直な分布、 山が2つに割れていれば「できる層とできない層に分かれている」といったように、 クラス全体の傾向を形でつかめます。
専門ソフト向けの書き出し(R・exametrika)
もっと踏み込んだ分析をしたい方のために、 設問×生徒の正誤を記した表を、CSVやJSONの形で書き出せます。 統計ソフトのRや、テスト分析ツールのexametrikaに 読み込ませて、項目反応理論(IRT)などの高度な分析につなげられます。
この書き出しは、大学のユーザーからの要望で加わりました。 欠席や未採点は、0点ではなく「欠測(データなし)」として区別して出力するので、 分析ソフト側で正しく扱えます。ふだんの採点では、この機能を意識する必要はありません。
計算に含まれる生徒・含まれない生徒
これらの統計は、すべての設問を採点し終えた生徒だけを対象に計算します。 採点の途中で一部の設問しか点が付いていない生徒を混ぜると、 数値が実態からずれてしまうためです。 採点が進むにつれて対象の人数が増え、数値も落ち着いていきます。
採点が全員分そろっていない段階では、α係数などの数値が大きく動くことがあります。 最終的な値として見るのは、採点をすべて終えてからにしましょう。 なお、無解答や重複マークは0点として扱い、母集団に含めます(未採点・保留とは区別します)。
まとめ
一括採点の結果出力に、テストそのものを振り返るための統計分析が加わりました。
- クロンバックα係数で、テスト全体の信頼性を数値で確認できる
- 設問ごとのD値(識別力)を色分けで表示し、見直したい設問が分かる
- S-P表と佐藤の注意係数で、気になる生徒・設問を面で見つけられる
- 得点度数分布で、クラス全体の点数のばらつきを形でつかめる
- R・exametrika向けにデータを書き出し、高度な分析にもつなげられる
点数を出した先の「振り返り」まで、追加の入力なしで手元のデータから始められます。
関連記事
- 識別係数とは — テスト問題の良し悪しを数値化する - 設問の識別力の考え方
- 個人成績表で詳しいフィードバックを - 生徒一人ひとりへの帳票
- 成績分析機能 — 生徒と学級の傾向を可視化する - 成績の推移や分布の可視化