Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Select an option

  • Save genkuroki/5659eee91b0597ebd126482091781d58 to your computer and use it in GitHub Desktop.

Select an option

Save genkuroki/5659eee91b0597ebd126482091781d58 to your computer and use it in GitHub Desktop.

因果推論と統計的推論における手法論争:ブリーフィング・ドキュメント

ソース: https://link.springer.com/article/10.1007/s10654-017-0230-6

要旨(Executive Summary)

本資料は、因果推論および統計的推論における近年の手法論的論争を分析し、形式的な分析手法と経験に基づく直観の間の緊張関係を考察するものである。主な論点は、現代の「因果推論」運動を巡る誤解、帰無仮説有意性検定(NHST)に起因する統計的解釈の弊害、および形式的手法の限界である。

主要な結論として、いかなる形式的手法(因果モデリング、統計的推論、感度分析など)も、それ自体が「科学的方法」という唯一の絶対的な真理ではなく、推論を補助するための「技術(ツール)」として捉えるべきである。モデルの仮定が現実の文脈と完全に一致することはないため、形式的推論の出力に対する「過信」を避け、複数の視点からデータを検証する「多元的なアプローチ」が不可欠である。また、教育面においては、統計学的な計算手法だけでなく、論理学や認知心理学、モデルの背後にある暗黙の仮定を理解するためのトレーニングが強く求められている。


1. 手法に対する哲学的視点:制限付きアナーキズム

科学哲学におけるポール・ファイヤアーベントの「対抗手法(Against Method)」の概念に基づき、特定の手法に固執することの危険性が指摘されている。

  • 手法の限界: すべてのモデリングや統計手法には限界があり、いかなる手法もあらゆる用途に対して必要十分なものではない。
  • アプローチの統合: 既存の手法を批判なしに受け入れるのではなく、また不完全であるからといって即座に排除するのでもなく、複数の手法を相互チェックの手段として組み込む「自由主義的多元論(Liberal Pluralism)」が推奨される。
  • 技術としてのモデリング: 因果モデリングは推論の理論や哲学ではなく、推論を助けるための「技術」として見るべきである。

2. 因果推論運動とポテンシャル・アウトカム・モデル

「因果推論」運動は論理的誤謬を避けるための多くのツールを提供してきたが、同時に激しい抵抗や誤解も生んでいる。

2.1 ポテンシャル・アウトカム・モデルを巡る論争

ポテンシャル・アウトカム(反事実的)モデルは現代疫学の主流となっているが、以下の批判が存在する。

  • 操作可能性の制限: 原因を「操作可能な介入」に限定する厳格な介入主義的解釈(RPOA)は、貧困や人種、戦争といった介入として定義しにくい重要な因果要因を排除するリスクがある。
  • ランダム化比較試験(RCT)の神格化: 因果モデルがRCTを証拠の「ゴールドスタンダード」として過度に強調しているという懸念。実際にはRCTもまた、一般化可能性の問題や不完全なプロトコルといった独自の仮定に依存している。

2.2 識別条件(Identification Conditions)の再考

因果モデリングにおいて必要とされる「交換可能性」「ポジティビティ(正値性)」「整合性」は、必ずしも因果推論の絶対条件ではない。

条件 科学的推論における実態
交換可能性 曝露群と非曝露群の背景が異なっていても(非交換的)、既知の知識(例:非曝露群の方が喫煙者が多い等)と組み合わせることで因果推論は可能である。
ポジティビティ 特定の投与量(例:40mg)がデータに含まれていなくても、単調性の仮定などを通じてその効果を推論することは可能である。
整合性 測定誤差などで観測値がポテンシャル・アウトカムと一致しない場合でも、因果関係の推論自体は行われる。

3. 統計的推論の危機と「ゼロ主義」

伝統的な統計学、特に帰無仮説有意性検定(NHST)の誤用が、科学的知見の歪曲を招いている。

  • ゼロ主義(Nullism)の弊害: P値が0.05を超えた、あるいは信頼区間がヌル(効果なし)を含んだという理由だけで「関連がない」と結論づける「ゼロバイアス」が蔓延している。
  • 事例:スタチンと膠芽腫の研究: 3つの研究で一貫して逆の相関(OR 0.72~0.76)が示されているにもかかわらず、自身の研究結果が「統計的に有意でない」という理由だけで「関連はない」と報告するような、誤った解釈が医学文献に溢れている。
  • P値の誤解: P値は「結果が偶然による確率」や「帰無仮説が正しい確率」ではない。それは、採用されたモデル(仮定の集合)全体とデータとの相性の良さを測定する指標に過ぎない。

4. 形式的分析の限界と「過信」の回避

数学的な洗練さは、必ずしも正しい因果推論を保証しない。

  • 仮定の不確実性: すべての統計的推論は、モデルの仮定が正しいという前提に立った「仮説的推論」である。データの信頼性や報告の正直さといった暗黙の仮定が崩れれば、出力される結論の妥当性も失われる。
  • 感度分析とバイアス分析: 不確実な仮定を弱めるための有効な手段であるが、それ自体も「考慮したシナリオが妥当である」というメタ仮定に依存しており、万能薬ではない。
  • ベイジアン手法の罠: ベイジアン手法も、帰無仮説に極端な事前確率を割り当てる(ヌルスパイク)ことで、頻度論的な有意性検定と同様、あるいはそれ以上のゼロバイアスを生む可能性がある。

5. 教育と実践への示唆

現在の統計教育および研究慣習には、抜本的な改革が必要である。

5.1 教育内容の拡充

  • 論理学と認知心理学: 計算手法の習得だけでなく、推論における論理的エラーや、確証バイアス、不確実性への嫌悪といった心理的要因を学ぶべきである。
  • 因果から相関への順序: 統計的モデリングを教える前に、まず因果経路がいかにして相関(バイアスを含む)を生むかを教えるべきである。

5.2 実践における姿勢

  • 「過信」への警戒: 形式的な解析結果を絶対的な真実としてではなく、特定のシナリオ下での一時的な提案として扱うべきである。
  • 多元的な視点: 頻度論的、ベイジアン、因果モデル、そして文脈に基づいた非形式的な判断を組み合わせ、多角的に検証を行う姿勢が求められる。
  • 暗黙の仮定の明示: ランダム化や選択の独立性など、通常は無視されがちな「モデルが置いている仮定」を詳細に説明し、その妥当性を吟味することを重視すべきである。

結論

手法論争は手法を「哲学」として扱うことで悪化する。手法は「技術」であり、優れた職人のようにツールの限界を理解し、文脈に応じた適切な判断を介在させることが、健全な科学的推論には不可欠である。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment