根拠に基づいた医療
テンプレート:出典の明記 根拠に基づいた医療(こんきょにもとづいたいりょう、EBM:evidence-based medicine)とは、「良心的に、明確に、分別を持って、最新最良の医学知見を用いる」("conscientious, explicit, and judicious use of current best evidence") 医療のあり方をさす[1][2] 。エビデンス(臨床結果)に基づく医療とも呼ぶ。
治療効果・副作用・予後の臨床結果に基づき医療を行うというもので、専門誌や学会で公表された過去の臨床結果や論文などを広く検索し、時には新たに臨床研究を行うことにより、なるべく客観的な疫学的観察や統計学による治療結果の比較に根拠を求めながら、患者とも共に方針を決めることを心がける。
目次
背景
「根拠に基づいた医療」の発祥の地のアメリカでは勤務医の臨床結果(治療結果や珍しい症状のケーススタディなど)が論文として医学誌に発表され、業績として評価される制度が整っているため、膨大な数の医療データが医療現場から生産・蓄積され治療現場に活用されている。
このため治療法が日進月歩で進化するため、医者は常に自らの専門の分野の最新の情報を、関連の医学誌を購読することで熟知していなければならない。また、これを怠って最新の治療を行わず患者の容態が満足な結果に終わらなかった場合は、患者から訴訟で賠償を請求されるというだけでなく、このような医学誌を参照とすることで適切な治療が行われていたか、裁判で客観的に判断されるという側面を持つ。
また特定の数値基準に満たない外科医、誤診の多い内科医などは病院が訴えられる原因になるので、重要な業務からは外される。また重度の糖尿病の患者の場合に黒人の方が白人よりも足を切断する治療が適用される確率が高いとの調査結果が出たため政治問題になるなど、根拠に基づいた医療の影響は多岐にわたる。
これを最も端的にあらわすのが、2004年にハーバード大学教授の Donald Berwick によって始められた、病院での死亡率を減らすことを励行する「10万を救うキャンペーン」(100000 lives campaign)である[3]。Donald Berwick教授のチームは、これまでの最新の医療情報に基づいて明らかに改善が可能な六分野(救急隊・予後の医療情報のアップデート・病院内での感染症・手術室での感染・人工呼吸器の使用による肺炎・臨床結果に基づく心筋梗塞の治療)を特定し、それぞれの分野で改善案を掲示。国内の主要病院機構の参加を呼びかけた。
これには、臨床結果に基づく最新・最善の医療法の選択だけでなく、患者のカルテのIT化による統一・病院での薬剤師の役割の拡大による処方ミスの軽減など日本の工場や作業現場で使われるTQCを医療現場に適用するようなものであった。
これには医療現場での治療法の実績だけでなく、医療過失の内容までもが臨床結果として明確・適切に第三者の組織に報告される制度の存在が前提であることは言うまでもない。アメリカの3000以上の病院がこのキャンペーンに参加した結果、18か月で統計上の推定で12万人以上の死亡者の軽減が認められた[4][5]。
日本においては、学術的な特徴が顕著なドイツ流の医学(純粋科学としての医学)がかつて主流であった。ドイツ医学の科学性は、自然科学と同様に、観察と帰納と実験によって経験的事実を支配する法則を客観的に厳密に人類が認識する学問としての医学である。これに対して、英米系の臨床重視の医学では、科学とは広く対象への認識であると解することにより医学を学問となし、一定の目的を達成する手段の認識として医学を一つの技術とみなす。
根拠に基づいた医学とは、学術的(対象そのものの客観的な認識を主任務とする)医学とも捉えかねられない「純粋科学」たるドイツ医学から、生理学的裏付けはともかく臨床結果における裏付けを根拠にする英米型医術(応用科学や技術)への転換というニュアンスがある。
基礎概念
人体の生理反応や治療の効果・副作用には再現性は必ずしも認められず、同じ治療でも患者によって結果は異なる。しかしすべての医療行為は、目の前の患者にとって最良の結果をもたらすために医学的判断に基づいて選択されなければならない。最良の治療法を選ぶ方法論として従来は生理学的原則・知識が重視され、不足の部分を医療者の経験や権威者の推奨が補ってきた。
- 生理学的判断の例
- 「心筋梗塞後に薬で不整脈を減らすことができれば、不整脈による死亡を減らすことができるはずだ」
- 権威の例
- 「この治療法は当大学で100例以上の良好な成績を収めており、関連病院にも勧めている」
- 個人的経験の例
- 「私の経験では、ホルモン補充療法はどうやら心疾患を減らすようだ。同僚もそう言っている」
- 根拠に基づいた医療
- 「医学誌の救急医療ジャーナルの2005年9月刊行の論文によれば心筋梗塞後の治療法Aの250件と治療法Bの50件の比較調査では治療法Bの方が不整脈による死亡は8%ほど低いと言う結果であった。ただし同雑誌2008年の4月の論文における追跡調査では50歳以上の患者の場合は逆に治療法Aの方が2%ほど死亡率は低いとの結果である。この患者は高齢であるので生存率の観点からは治療法Aが最適な選択である。ただし治療法Aはホルモン補充療法であり、これには他の副作用が報告されている。よって治療法AとBの生存率およびもろもろの副作用の可能性を患者に掲示したのち最終的に治療法を選択するのは患者である。」(患者に選択権を与えるのはインフォームド・コンセントに基づく医療で根拠に基づいた医療とは直接の関係はない。)
これらの客観的な経験知を共有する手段は主に書籍・学会誌・論文発表に限られ、インターネットが発展する近年までは誰もが広く情報に触れることは難しく、国・地域・治療者が異なれば治療法もまたさまざまであった。しかし、1980年代になって米国国立医学図書館によるMEDLINEなど医学情報の電子データベース化が進み、また疫学・統計手法の進歩によりできるだけバイアスを排した研究デザインが開発されるに従って、治療法などの選択となる根拠は「正しい方法論に基づいた観察や実験に求めるべきである」という主張が現れた。カナダのマクマスター大学でDavid Sackettらにより提唱されたこの動きは1990年にGordon GuyattによりEBM(Evidence-based Medicine)と名づけられ、文献への初出は1992年[6]。日本では根拠に基づいた医療、中国語では、循証医学、実証医学、証拠医学などと訳される。
EBMはこのように、通常行われている診療行為を科学的な視点で再評価(「批判的吟味」と呼ばれる)した上で、患者の問題を解決する手法と位置づけられ、外部のエビデンス(=科学的根拠)を目の前の患者にどのように適用するかに最も関心がある。
成果
EBMの成果を端的に示すエピソードのひとつに、心筋梗塞後の抗不整脈薬の使用についてのCAST studyが挙げられる。心筋梗塞は急性期が過ぎてから合併する不整脈が時として致死的となるため、抗不整脈薬が有効であるという理論・予測があり、抗不整脈薬が予防的に投与されていた。しかし、最も有効な薬剤グループを調べるためにランダム化比較試験による臨床実験を行ったところ、中間報告で最も死亡率の低いのは薬剤非投与群だったことが判明。安全のために試験の一部が打ち切りとなり、以後は抗不整脈薬が一律に投与されることはなくなった。
勧告の強さの分類 / エビデンスレベルの分類
推奨の度合いは、研究方法によって決定されるエビデンスレベルと、勧告の強さであるグレードによって総合的に決定される。
勧告グレード | |||||
---|---|---|---|---|---|
テンプレート:Rh| A 強く勧められる |
テンプレート:Rh| B 勧められる |
テンプレート:Rh| C 勧められるだけの 根拠が明確でない |
テンプレート:Rh| D 行わないよう 勧められる | ||
エ ビ デ ン ス レ ベ ル |
テンプレート:Rh| I a システマティック・レビュー メタアナリシス |
||||
テンプレート:Rh| I b ランダム化比較試験 |
|||||
テンプレート:Rh| II a 非ランダム化比較試験 |
|||||
テンプレート:Rh| II b その他の準実験的研究 |
|||||
テンプレート:Rh| III 非実験的記述的研究 (比較研究・相関研究・症例対照研究など) |
|||||
テンプレート:Rh| IV 専門科委員会や権威者の意見 |
エビデンス分類
Level | 内容 |
---|---|
1a | ランダム化比較試験のメタアナリシス |
1b | 少なくとも一つのランダム化比較試験(RCT) |
2a | ランダム割付を伴わない同時コントロールを伴うコホート研究(前向き研究、prospective study, concurrent cohort studyなど |
2b | ランダム割付を伴わない過去のコントロールを伴うコホート研究(historical cohort study, retrospective cohort studyなど) |
3 | 症例対照研究(ケースコントロール, 後ろ向き研究) |
4 | 処置前後の比較などの前後比較、対照群を伴わない研究 |
5 | 症例報告、ケースシリーズ |
6 | 専門家個人の意見(専門家委員会報告を含む) |
Level | 内容 |
---|---|
1 | 新しい診断検査とgold standardとされる検査とを同時に行い、ブラインド(他方の検査結果を知らせない)で検査の特性(感度と特異度、ROC曲線)を評価 |
2a | 新しい検査法とgold standardの両方を同時に行うのではなく、2つの異なるグループにそれぞれの方法を施行して比較 |
2b | 新しい検査法とgold standardの両方を同時に行うのではなく、全員に新しい検査法を施行し、過去のデータと比較 |
3 | 新しい検査法のみを全員に施行し、比較はなし |
Level | 内容 |
---|---|
(1) | 対象者数が200人以上、平均(あるいはメディアン)追跡期間が5年以上、脱落率10%未満 |
(2) | 対象者数が中程度(100人以上200人未満)、平均(あるいはメディアン)追跡期間が5年以上、脱落率10%未満 |
(3) | 対象者数が200人以上、平均(あるいはメディアン)追跡期間が5年未満、脱落率10%未満 |
(4) | 対象者数が中程度(100人以上200人未満)、平均(あるいはメディアン)追跡期間が5年未満、脱落率10%未満 |
(5) | 対象者数が100人未満、平均(あるいはメディアン)追跡期間が5年以上、脱落率10%未満 |
(6) | 対象者数が100人未満、平均(あるいはメディアン)追跡期間が5年未満、脱落率10%未満 |
(7) | 対象者数、追跡期間によらず、脱落率が10%以上 |
推奨グレード
推奨の強さの分類と表示 テンプレート:Sfn | |
---|---|
グレードA | 強い科学的根拠があり、行うよう強く勧められる |
グレードB | 行うよう勧められる |
グレードC1 | 行うことを考慮してもよいが、十分な科学的根拠がない |
グレードC2 | 科学的根拠がないので、勧められない |
グレードD | 無効性あるいは有害性の科学的根拠があり、行わないよう勧められる |
「根拠の強さ」の分類と表示 | |
グレードA | 言いきれる強い根拠がある |
グレードB | 言いきれる根拠がある |
グレードC | 言いきれる根拠がない |
※グレーディングの根拠 | |
グレードA | 少なくとも1つのレベル1(1a/1b)の研究がある |
グレードB | 少なくとも1つのレベル2(2a/2b)の研究がある |
手法
EBMの手順として、次の5つのstepが提唱されている。
- Step 1 目の前の患者についての問題の定式化
- Step 2 定式化した問題を解決する情報の検索
- Step 3 検索して得られた情報の批判的吟味
- Step 4 批判的吟味した情報の患者への適用
- Step 5 上記1〜4のstepの評価
Step 1 目の前の患者についての問題の定式化
現在対処しなければいけない課題の中から、どのような情報が必要か、問題点を抽出する。
問題(クリニカル・クエスチョン)の定式化の基本形はテンプレート:Sfn、
- Patient:どんな患者が
- Intervention:どんな介入を行う・暴露を受けるのは
- Comparison:どんなものと比較して
- Outcome:どうなるか
のように、4つのパーツで構成される。そのため、"four parts question"と呼ばれることもある。また、それぞれのパーツの頭文字を取ってPICOと呼ばれる。
PICOで定式化した問題は、どのような種類の問題かによって、疑問のカテゴリーが決められる。
問題のカテゴリーには、以下のようなものがある。
- 治療
- 予防
- 頻度
- 診断
- 予後
- 病因、危険因子
- 害、副作用
- 治療法・予防法に関する問題の場合のPICOの例
- もともとの問い
- 「糖尿病を合併した山田太郎さんの高血圧には、どの薬を使えばよいだろうか」
- 定式化したPICO
- P: 糖尿病を合併した高血圧症に罹患した50歳男性の山田さんが
- I: 薬剤Aで治療するのは
- C: 薬剤Bで治療するのと比べて
- O: より脳卒中や心疾患を予防できるだろうか
- 問題のカテゴリー:予防
- 診断に関する問題の場合のPICOの例
- もともとの問い
- 「胸痛を訴える糖尿病の山田太郎さんは、狭心症だろうか」
- 定式化したPICO
- P: 胸痛を訴える糖尿病に罹患した50歳男性の山田さんが
- I: 負荷心電図を検査するのは
- C: 狭心症の正しい診断と比べて
- O: どれくらい正しい診断に迫ることができるだろうか
- 問題のカテゴリー:診断
- 予後に関する問題の場合のPICOの例
- もともとの問い
- 「糖尿病を合併した山田太郎さんの高血圧をこのまま放っておくと、どうなるだろうか」
- 定式化したPICO
- P: 糖尿病を合併した高血圧症に罹患した50歳男性の山田さんが
- I: このまま無治療で経過観察をすると
- C: (なし)
- O: どれくらい脳卒中や心疾患になるだろうか
- 問題のカテゴリー:予後
- 病因、危険因子に関する問題の場合のPICOの例
- もともとの問い
- 「糖尿病である山田太郎さんは、血圧が高いと心筋梗塞を起こしやすくなるだろうか」
- 定式化したPICO
- P: 糖尿病性に罹患した50歳男性の山田さんが
- I: 血圧が高いと
- C: 血圧が高くないのと比べて
- O: どれくらい心筋梗塞が増えるだろうか
- 問題のカテゴリー:病因、危険因子
Step 2 定式化した問題を解決する情報の検索
上記の問題を解決できる情報を収集する。
一般に、治療効果にはランダム化比較試験、病因や副作用の評価にはランダム化比較試験、コホート研究、症例対照研究、予後にはコホート研究、診断には横断研究、ランダム化比較試験など頻繁に用いられる研究デザインがある。上記の疑問を元に、その問題を解決できる適切な研究デザインを想定し、適切なデータベースを検索することでそのような研究結果が存在するかどうかを調べる。 一般的な医学研究には、MEDLINE・EMBASE(英語)、医学中央雑誌・メディカルオンライン(日本語)などが用いられる。看護に関連するテーマにはCINAHL(英語)、精神医学領域にはPsychInfo(英語)も対象となる。
また、上記の手間を節約するために、一般的な医学教科書・Clinical Evidence・UpToDateといった二次情報と呼ばれる資料集も存在する。またランダム化比較研究に特化したデータベースとしてCochrane Database of Systematic Reviews(CDSR)が挙げられる。
Step 3 検索して得られた情報の批判的吟味
具体的な情報(主に論文)を手にしてその評価を行う。
医学研究には、その計画からデータ収集、解析、報告に至るまで、さまざまな形で結果に影響する要因(バイアス)が存在する。その有無を適切に評価した上で、その研究結果をどれだけ信頼できるか(内的妥当性)、どれだけ他のケースに応用できるか(外的妥当性)を判断する。医学的な知識はもちろんのこと、臨床疫学や統計学の知識が求められる。
Step 4 批判的吟味した情報の患者への適用
問題の解決に向けて、得られた医学情報のほかに、一般常識や患者の希望を含めて、最良の選択肢を相談する。 治療法Aがもっとも長生きするとしても、患者は副作用の少ない治療法Bを希望しているかもしれない。このように、上で評価した研究の目的と、患者の望む目的が同一かどうかを検討しなければならない。 Step 4で考慮すべきことは、以下の4種が挙げられている[7]。このいずれが欠けてもいけないし、互いにバランスが取られていなければならない。
- リサーチエビデンス
- 臨床状況と環境
- 患者の嗜好と行動
- 臨床経験
Step 4は、EBMの実践において最も重要な段階である。
Step 5 上記1〜4のstepの評価
上記の判断が正しかったかどうかを事後評価し、今後のプロセス改善につとめる。
EBMにまつわる誤解
過去のEBM教育ではこのStep 1〜3の方法論を研ぎ澄ませることに重きを置き、またStep 4については必ずしも言葉で説明を尽くされて来なかったことから、医療者の中には「良い臨床研究を見つけて医療をマニュアル化することがEBMである」との誤解が広まった時期がある[8]。また、研修医の教育においても、EBMの考え方を取り入れることが、単にエビデンスをまとめた二次資料を読んでそこに書いてあることをそのまま実行することとして教えられているという憂慮すべき現実もある。
しかし、実際には最も重要でありかつ労力を要するのはStep 4である。手法の優れた臨床研究が見つかっても、そこでの推奨が目の前の患者にとって最善であるかどうかの判断には、個々の患者の特性を見極め、医療環境や医療チームの技術水準を評価し、さらに患者の価値観を適切に把握する必要がある。Step 1〜3までの方法論はほぼ確立し、人によってその結果が大きく異なることがないのに対して、このStep 4には患者や他の医療者との対話・状況判断・統合力など引き続き人間である治療者として高度な経験と技術が求められる。
また、100件のエビデンスのうち23件が2年以内に覆され、そのうち7件は出版された時点ですでに覆されていた[9]との報告を待つまでもなく、臨床研究による知見は常に覆されうる(科学的な結論は常に暫定的である:反証可能性も参照)ものであることを念頭に、最新の情報を当たることも重要である。
注意点
エビデンスに基づく医療では、各研究の質の判定が前提となる。
- 医学論文の主要評価項目と副次評価項目の明確な区別を行なっての採用か?(通常、副次評価項目は主要評価項目に対して参考程度の価値しかない)。
- 評価項目のすりかえはないか?
- 選択基準と除外基準は明記されていなければ不適切な研究である(設定の対象者は母集団か、また最後まで母集団の代表であるか?必要十分な対象者で研究されたか?)。
- ランダム比較研究か?(コントロールグループの設定は適切か?対象者と研究者は盲検化されているか?)。
- P値は主要評価項目のそれか?副次評価項目のそれではないのか?
- 統計上の有意差と臨床上の有意差は同じではない(臨床的判断は信頼区間で判定する)。
- 検出力あるいはβエラーが明記されているか?
臨床研究
テンプレート:Main EBMを実践する上で十分なエビデンスが見つからない場合、もしその疑問が臨床上重要なテーマであり、倫理上の問題がなく、資金的・人員的に実際に行える規模の研究であれば、臨床研究として掘り下げることができる。
展望
「根拠に基づいた医療」に則った考え方は徐々に浸透し、有効な臨床結果を集積した論文集や教科書が出版されるようになった。当初は臨床結果の情報による裏づけが十分な治療法はごく少数しかなかったが、現在では3割を超えたという報告もあり、医療機関における治療方法の差も縮まってきている。またEBMの手順を経て過去にデータが得られない疑問は即ち臨床研究の対象となる潜在性を秘めており、EBMは臨床研究の普及にも大きな役割を果たしている。
また、第1〜3段階の成果を診療ガイドラインとしてまとめることでEBMをより普及させようとする試みも、日本・海外を問わず広がっている。
アメリカでは国家事業としてNGC(National Guideline Clearinghouse)がEBMに沿った診療ガイドラインをウェブサイトで公開している。
日本では日本医療機能評価機構がMindsというサービスでEBMに沿った診療ガイドラインをウェブサイトで公開している。これは厚生労働科学研究費で作成された診療ガイドラインであり、厚生科研EBM福井班による「診療ガイドラインの作成の手順」に則って作成されている。
電子カルテが普及している国々では、入力された患者データに基づいて推奨される治療の選択肢が示され、患者を中心とした治療方針の決定を支援する判断支援ソフト(decision aid)と呼ばれるツールも開発されつつある。
さらに、EBMの有用性が認められるにつれて、医学の周辺領域にも根拠に基づいた判断を目指す動きが広がっている。
- 例: Structure-construction evidence-based rehabilitation(SCEBR), Evidence-based health policy (EBHP), Evidence-based nursing (EBN), Evidence-based midwifery (EBM)
脚注
参考文献
- テンプレート:Cite (Minds 医療情報サービス)
関連項目
- 医学 / 疫学 / 統計学 / プラグマティズム
- 臨床疫学
- 臨床研究 - 治験
- 健康情報学 - 臨床情報学
- 英国国民保健サービス - コクラン共同計画
- ジョアンナブリッグス研究所
- 判例に基づいた医療 (JBM: Judgement-Based Medicine)
- 相関関係と因果関係
外部リンク
- The SPELL:EBMと生涯学習の広場
- CASP Japan
- NGC - National Guideline Clearinghouse EBM診療ガイドラインを公開(アメリカの国家事業)
- Minds 医療情報サービス(マインズ) EBM診療ガイドラインの公開(日本医療機能評価機構、厚生労働科学研究費補助金)