Google Classroom
GeoGebraGeoGebra Classroom

感度と特異度(と有病率)

検査問題の基本的な枠組み

感度(Sensitivity)と特異度(Specificity)というのは、主に医学分野で診断のための検査の精度を表すために使われる用語ですが、何かを検査によって二項分類するという問題の枠組み自体は、医学に限らずもっと一般的な問題にも適用できる枠組みです。 二項分類というのは、ある対象が、特定の集合(特定の疾患に罹患している人の集合など)に属しているかどうかを、検査によって判定することを言います。 実際にその集合に属しているかいないかと、検査の結果とが必ず一致するなら何も悩むことはないわけですが、実際にはそれほどうまくいくとは限らず、実際には属しているのに属していないと判定されたり(=偽陰性)、実際には属していないのに属していると判定されたり(=偽陽性)して、実際の所属と検査の結果がずれることは珍しくありません。 これを場合に分けてみると、実際の分類が属する/属さないの二通り、検査の結果が陽性/陰性の二通りなので、通りの場合があることになります。
属する属さない
陽性真陽性偽陽性
陰性偽陰性真陰性
検査が常に正しい答えを出すとは限らないとしても、実際の分類と検査の結果がまったく無関係(確率論の用語でいえば「独立」)では検査をする意味が全くないわけで、検査が一定の意味を持つためには、実際の分類と検査の結果が少なくとも「相関」していなくてはなりません。 言い換えれば、
  • 「属する」対象が「陽性」と判定される(真陽性)確率は、「陰性」と判定される(偽陰性)確率より高くなくてはならない
  • 「属さない」対象が「陰性」と判定される(真陰性)確率は、「陽性」と判定される(偽陽性)確率より高くなくてはならない
検査がこの二つの条件を満たしていれば、検査後の分類に対する確信度は、少なくとも検査前よりは高くなるわけです。 (厳密にいえば、真陽性と偽陽性の条件付き確率がまったく同じでさえなければ、なんらかの情報は得られるわけですが、それだと説明としてわかりにくいので、少し条件を狭めて説明しました。) そして、その確率は高ければ高いほど、検査の信頼性も高まります。確率が100%なら、絶対に誤判定のない理想の検査となるわけです。ですから、この2つの確率が、検査の精度の尺度になります。 この特定の集合に「属する」対象が「陽性」と判定される条件付き確率を、 真陽性/(真陽性+偽陰性)=感度 特定の集合に「属さない」対象が「陰性」と判定される条件付き確率を、 真陰性/(偽陽性+真陰性)=特異度 と呼びます。 一般に特定の検査の精度は、この感度と特異度の2つの尺度で表すことができます。

基準率の誤り

ところが、この枠組みに関連して、多くの人が間違いやすい問題が一つあります。それは、実際に特定の対象が真陽性とか真陰性とか判定される確率は、感度や特異度だけでは決まらないということです。