2012年9月27日木曜日

何を信じて何を疑えばいいですか? 第4弾:副作用は不確かでも考慮する

名郷先生との面談では,『CORE Journal 循環器』で検索された論文をその場でお見せして,「思いついたこと全部を教えて下さい」とお願いしています。本誌で掲載する各CQのミニコーナー「エビデンス解説」でもご紹介しますが,このブログでは,できるだけ先生の生の声をお伝えできたらいいなと思っています。(編集部員のセリフは,『できる編集者』に見えるように脚色していますが,どうかご容赦下さい。ほんとはついていくだけで必死です。)

今回は,治療介入による副作用の話題です。最近は,抗血栓療法の新しい話題が増え,ベネフィットがリスクを上回れば治療は正当化されると言われることが増えてきました。「出血は増えるが,心血管イベントは有意に抑制された」といった研究をみかけると,私たちは,「だから何?いいってこと?ダメってこと?」と,ここで完全に思考停止に陥り,「専門医の先生がいいって言ってたし」で済ませる,という何とも情けないことを繰り返していました。

クリアに判断できる秘訣なんてものはおそらく存在しないことは,わかっています。でも,もうちょっと読めるようになれないかな・・・と,名郷先生に聞いてみました。

有効性は疑いの目で厳しく吟味し,副作用は不確かでも考慮する

CORE Journal 循環器 no2 (2012年秋冬号)で取りあげる,
CQ6:心房細動合併の冠動脈疾患に対して,抗血小板療法に抗凝固療法を追加すべきか?
で検索した論文について伺っていたときのことです。

-有効性は疑いの目で厳しく吟味し,副作用は不確かでも考慮するのが,臨床的立場だと思うんですよ

↑名郷先生が常日頃おっしゃっていることですよね・・・。有効性に対しては,有意差があるか,デザインはどうか,などなど色々な吟味のポイントがあると思うのですが,副作用のデータのみかたってあるのでしょうか。

-ケースバイケースで説明は難しいですけど,一つ単純にいえるのは,95%信頼区間の悲観的なほうの数字をみることです。

↑経口抗凝固薬長期服用のステント留置例に,抗凝固薬+抗血小板薬2剤(3剤併用群)と抗血小板薬2剤(2剤併用群)を比較した研究のメタ解析では,大出血のオッズ比が2.12,その95%信頼区間が1.05-4.29になっています。先生がおっしゃっているのは,4.29のことですね。

-そう。大出血が4.29倍かもしれない。

↑でも,オッズ比の数値は2.12ですし,真実は4.29倍よりも2.12倍に近いのではないでしょうか。

-95%信頼区間は,95%の確率で,この幅のなかに真実が存在することを示すものであって,真ん中ほど真実に近いということではないのです。この区間ならどこに真実があってもおかしくない。だったら,大出血という危険な副作用は,4.29倍と思っておいたほうがよいと思いませんか?

↑私が患者だったらきっと,4.29倍という最悪の可能性が気になると思います。

-患者さんの価値観もあるでしょうけれど,少なくとも臨床医は,副作用に対しては最悪の可能性を考慮したほうがいい。

↑そう考えると,先生,大変です。脳梗塞のオッズ比は0.38,その95%信頼区間は0.12-1.22です。有効性はあるともないとも言えないのに大出血は4.29倍かもしれない。

-こういった場合は,オッズ比などの効果指標だけではなく,実際におきたイベント発生率を確認してみましょう。

↑ええと,脳梗塞発生率は3剤併用群0.8%,2剤併用群3.3%です。大出血発生率はそれぞれ4.1%,1.9%。

-2剤併用ではなく3剤併用にしたら,脳梗塞は100人中2.5人減って,大出血は2.2人増える。そういう見方もできますよね。

名郷先生は,単独の臨床試験データから「どちらの治療を選ぶべき」というお話は,あまりなさいません。名郷先生との面談後はいつも,Gordon H. Guyatt先生へインタビューしたときの,「エビデンスそのものは,医師が何をすべきかという臨床的判断を与えてはくれません」というの言葉を思い出してしまいます(詳しくはGuyatt先生へのインタビュー記事)。

次回も,「何を信じて何を疑うシリーズ」が続きます!これまでの更新内容については,ブログのもくじをご覧下さい。

2012年9月20日木曜日

何を信じて何を疑えばいいですか? 第3弾:傾向スコア(プロペンシティースコア)「これでもうRCTはいらない?!」



1弾「アヤシイ」メタ解析2NNT の「ツボ」に引き続き,今回もCORE Journal 循環器」第2についての名郷先生との面会での内容を一部ご紹介していきます!
 
今回は,「傾向スコア(Propensity Score;プロペンシティースコア)」についてです。「傾向スコア」って実際のところ何なのでしょう?

3弾:傾向スコア「これでもうRCTはいらない?!」

 誌2号CQ3:急性心不全での点滴強心薬の使用方法とは? で検索した,フィンランドの観察研究について伺っていたときのことです。

-う~ん。この論文は,t検定で解析をしているようです。多変量解析をしておらず,交絡因子の調整はされていませんね。

↑・・・つまり・・どういうことでしょう・・・。

強心薬を投与された患者は2割程度亡くなるが,それが薬の投与のせいなのかはわからない。単に強心薬を投与されるような人は重症な人が多かったということしかいえない,ということですね。

↑強心薬が投与された患者と,対照の患者では背景がかなり異なる可能性があるということですね。

-そうですね。ただ,このADHERE registry傾向スコアで解析しているので,とても参考になりそうですよ。

↑先生,最近傾向スコアってよく耳にするのですが,実際どういうものなんでしょうか。

観察研究の場合,それぞれの薬剤が投与された人の背景は均一ではないですよね。ですから,このように2群を比較していたはずなのに,背景が不均一であることによって結果が影響されてしまい,ともすれば誤った結論が導かれてしまうことがあります。
 ADHERE registryを例として簡単にいいますとドブタミンを処方されている患者の背景から,交絡因子を調べて,重み付けをして,ドブタミンの処方されやすさをスコア化します。そうして,ドブタミンを投与されていない人で同様の背景をもつ人を選び出し,比較する ということですね。

↑なるほど! そうすればある程度,背景が揃ったものとして2群を比較できるわけですね。では傾向スコアで解析さえすれば,もはやRCTは必要ない・・・?

-一時はそういう話もありました。ただ,観察研究とRCTでは異なる結果が出ている場合もあります。例えば,閉経後女性のホルモン補充療法に関する研究では,観察研究では心筋梗塞を減らすという結果が出たのに, RCTではむしろリスクを増やす結果が出ました。
 ただ,倫理的に,費用的に,他にも様々な問題があってRCTが行えない場合がありますよね。観察研究で傾向スコア解析が行われているかどうかというのは,その文献の信頼度を測るうえで重要なポイントであることは間違いないと思います。

 名郷先生との面会での目から鱗のお話,次回も続きます! お楽しみに!

2012年9月13日木曜日

何を信じて何を疑えばいいですか? 第2弾:NNTの「ツボ」 結局どう役立てる?

前回に引き続き,「CORE Journal 循環器」第2号についての名郷先生との面会での内容を一部ご紹介します! 
今回は,NNT(numberneeded to treat)についてです。(NNTは,治療必要数ともいう指標で,例えば「NNTが10」ということは,「1人の患者のイベントを抑制するのに10人への治療が必要と推定される」ということを意味します。)
 「CORE Journal 循環器」本誌でも,随所に登場するこのNNTについてどう解釈すべきなのでしょうか・・・。

第2弾 NNTの「ツボ」 結局どう役立てる?

CQ1:透析患者における心血管イベント抑制に脂質低下療法は有効か?
で検索した論文での“4.9年間のNNT(95%信頼区間)66(24 to -91)”という値について,それをどう解釈すべきか伺ってみたところ・・・

実際NNTだけで解釈するのは無理ですね!

↑ ええ?!!! だってそんな・・・ じゃあどうすればいいんだ(焦)。。

NNTの解釈は,副作用やコストとの兼ね合いだったりしますからね。例えば副作用が0で薬価がすごく安いとなったら,NNTがたとえ100でも1000でも投与は妥当化される,そう思いませんか?

↑ 確かに・・・。患者さんが受ける利益と害のバランスを考えなくてはいけないということですね。

―“NNTは,その臨床試験が置かれた状況の中でしか解釈できない”んですね。だから目の前の患者さんのリスクが小さい,仮に臨床試験対象者のリスクの0.5倍だとしたら,「NNT=66÷0.5=132」となり,記載のNNTより大きくなる,つまり効果サイズは小さくなるでしょう。

↑ なるほど。さらに,個別の患者さんに合わせて解釈していかなくちゃいけないんですね。。

― そうですね。だからNNT66という数字に対して害とかコスト,さらに患者さんのリスクなどを加味して判断するわけです。

↑ (なんだか少し気が遠くなってきた・・・。)

―実際に利益と害のバランスを判断するための指標はあります。LHH(likefood of being helped or harmed)というものです。NNTとNNH(何人治療すると一人有害なイベントが起こるか)の比をとって,患者の害と比較して何倍益になりそうか,を示す指標です。

“LHH=(1/NNT)/(1/NNH)=NNH / NNT ”

で表されます。
例えば,心筋梗塞のNNTが20,消化管出血のNNHが100とした場合,LHH=100/20=5ですね。

↑ なるほど! これは利益が害の5倍であるということでいいんでしょうか?

― そう単純には判断できません。それぞれのアウトカム(この場合は心筋梗塞と消化管出血)の重要性により重み付けも異なるでしょうし,前述した個別の患者さんのリスク,コストの問題なんかもあります。例えば・・・ACE阻害薬で心不全がどのくらい予防できるか,ということを検討した場合,心筋梗塞は重み付け10としたら,咳はまぁ0.3かな,,みたいな感じですね。結局NNTは絶対リスクから算出している指標ですから,治療効果を調整しなくてはいけないんですね。そこが相対リスクとは違うところです。

↑ むむむ。たしか絶対リスクと相対リスクは別々にみて評価しなくてはいけないんですよね,,,たしか本で読んだことがあります。。

―例えば,透析患者でアウトカムが動脈硬化性イベントというと大体15%とか起こりますね。これがある治療によって15%から10%に減るとなると,リスクが10分の1の集団で同じ治療を行っても,大体1.5%が1%に減るということになり,相対リスクは一貫しています。だからあまり状況に応じて解釈を変える必要がないんです。

このほかにも,まだまだ目から鱗 のお話がつぎつぎと。次回以降の更新でご紹介します!


2012年9月7日金曜日

何を信じて何を疑えばいいですか? 第1弾:「アヤシイ」メタ解析

「CORE Journal 循環器」も,第2号発行にむけて制作が佳境に入ってきました!
執筆をお願いした回答者の先生からは,続々と原稿が届いています。(第2号のCQはこちら)

昨日は,名郷先生にエビデンステーブル(文献概要)の内容確認をお願いするため,武蔵国分寺公園クリニックにお邪魔しました。先生の診療が終わった後,みっちり3時間・・・
(先生ごめんなさい)

今回も,先生の「これ,いい論文ですね」「この論文,あやしいですね」「このデータ,ほんとかな~」というお話がすごすぎて!詳しくは,本誌の「エビデンス解説」というミニコーナーで紹介しますので,ご覧いただけると嬉しいです。このブログでも一部を紹介していきたいと思います!

第1弾 「アヤシイ」メタ解析

CQ2:HDL-Cを上昇させる治療は,心血管イベントの抑制に有効か?
で検索した,5件の論文について伺っていたときのことです。

メタ解析がRCTよりエビデンスレベルが高いなんて,嘘ですよ

↑ええ?!!! だってそんな・・・ 色々な本に,メタ解析がいいって書いてありますし(焦)。。

― 分類上,エビデンスレベル「1a」がRCTのメタ解析,「1b」がRCTとされていていますが,aとbはあくまでも『分類』にすぎません。RCTのメタ解析とRCTに,デザイン上の優劣はないんです。

↑知りませんでした。いずれもレベルの高いエビデンス,ということなのですね。

― むしろ,深く考えずに「メタ解析」に飛びついてしまうのは危ないんですよ。メタ解析はさまざまな研究の寄せ集めですから,バイアスが入りやすい。専門的には,「内的妥当性が低い」といいます。たとえば,異なる薬剤を用いた試験を詰め込んだメタ解析からは,参考程度の答えしか得ることができません。

― そうですね。同様に「HDL-C上昇のための薬物介入」と「プラセボ」を比べたRCT44件(約11万人)のメタ解析もちょっとアヤシイですね。この研究では,両群のイベント発生の差が0.1%しかないのに,P値には有意差がついています。母集団が大きいと,このような結果が出ることがよくあります。このときは,「有意差があった」ことより,「差が0.1%しかなかった」ことに注目すべきでしょう。

↑そんな見方,したことなかった。。「メタ解析」+「有意差」=すごい,と思っていました。まぜこぜのメタ解析よりは,大規模のRCTのほうがよいのかなあ。

― まぜこぜのメタ解析の結果が大規模RCTで覆るということは,これまでもさんざん繰り返されてきました。メタ解析でも,どんな研究が集められたのかが大事なんです。
「RCTのメタ解析」と書かれていても,「RCTのサブグループのメタ解析」だったり,「RCT対象者全体の観察結果のメタ解析」だったりすることがあります。これはエビデンスレベル1aの「RCTのメタ解析」とは異なるものとして,読んでいく必要があると思います。

↑そうなんだ・・・ これは忘れないようにしなければ。

この記事の掲載号の詳細はこちら

このほかにも,目から鱗のお話がつぎつぎと。次回以降の更新でご紹介します!



2012年9月3日月曜日

こぼれ話☆ 臨床試験のp値がEBMのすべてではない

雑誌「CORE Journal 循環器」は,編集委員の先生方の絶大なるご協力により立ち上がりました。編集委員会では,次から次へと出てくる先生方のアイディアに・・・,編集部が圧倒されることもしばしば。

そんななか,ある先生がこんなことをおっしゃいました。
有意差がつかなければ,どちらの薬剤が好ましいかなんてことは言えないのでしょうけれど,現実に患者さんがいらして,二者択一で薬剤を選ばなければならないとき,少しでもイベント発生率が低かった薬剤を選びたくなるのは,臨床医の心理としてあると思います。
でも,患者さんの特性を良く把握していれば,「その患者さんでは」どちらがより好ましいのかが見えてくることがあるんです。臨床試験の数値がEBMのすべてではない。もっといえば,P値や信頼区間だけでEBMを実践することはそもそも不可能なのです。臨床試験の結果を,個々の患者さんに照らし合わせ,臨床上の意志決定に適切に生かす能力が必要で,それを下支えするのが臨床医としての「力量」や「経験」なんですね。
この雑誌では,「力量」「経験」ともに優れた専門医が,臨床試験の結果を自身の臨床に生かす過程を見せていきましょう。その論理展開から学べることは大いにあると思います。
なんだか胸にぐっときてしまいました。
これが「CORE Journal 循環器」の原点となりました。