医学のあゆみ
Volume 280, Issue 5, 2022
Volumes & issues:
-
【1月第5土曜特集】 現代の臨床研究のための統計学2022─洗練された研究デザインと統計解析を理解してみよう
-
-
- 臨床試験の方法
-
臨床試験デザインの基礎
280巻5号(2022);View Description Hide Description臨床試験は主として医薬品評価のために行われるものと認識されているかもしれないが,医薬品に限らず,新たな治療法・診断法などの有効性・安全性,臨床的有用性などを調べるための手段である.最近は人工知能(AI)を応用した診断技術などの評価を行う臨床試験もある.本稿ではそのような臨床試験も含め,立案時の留意点を取り上げ解説する. -
臨床試験のエンドポイントの設定─適切なエンドポイントに求められる性質
280巻5号(2022);View Description Hide Description臨床試験のエンドポイントの設定は,臨床試験の成否を左右する試験デザインの根幹をなす要素といえる.本稿では,実際にエンドポイントを決める際に考慮すべきと考えられるいくつかの視点について紹介する.とくに,これまで臨床試験の実施経験が少なく,確立されたエンドポイントの利用が限定的と考えられる領域では,これらの視点を参考にエンポイントを新規に提案し,新たに使用経験を蓄積していくことも必要になると考えられる.臨床試験のエンドポイントに関する判断は複雑であり,さまざまな視点を考慮する必要があると考えられることから,本稿では具体的な事例をあげつつ,これらの視点について述べる. -
ランダム化と解析対象集団
280巻5号(2022);View Description Hide Description臨床試験は,患者や健常な人を対象として,新しい薬や手術,放射線治療などを用いた新しい治療法の有効性や安全性に関する科学的エビデンスを構築するための手段である.臨床試験の実施にあたっては,試験計画から結果報告に至るまでのすべての過程においてバイアスが入る余地があり,臨床試験の目的を達成するためには,これらのバイアスを最小化させるとともに,精度の最大化(またはばらつきの最小化)を図ることが重要となる.そのため,有効性や安全性の確固たる証拠を証明する位置づけで実施されることが多いランダム化比較試験では,統計的な工夫や方策が求められる.本稿ではランダム化の手法,盲検化と解析対象集団に焦点を当てて概説する. -
研究設計に役立つ検定と信頼区間の基本知識─α,β,期待する群間差,優越性/非劣性試験,サンプルサイズ設計
280巻5号(2022);View Description Hide Description臨床研究の目的は,何らかの疾患に対する治療法の効果の評価であることが多い.これは治療法の因果効果を推測することを意味し,ランダム化比較試験では平均因果効果をバイアスなく推測できるが,観察研究では注意を要する.本稿では,臨床研究者が臨床研究を実際に計画する際に有益な検定や信頼区間の基本知識(αエラー,βエラー,片側・両側検定,検定と信頼区間の関係,優越性・非劣性などの仮説など)をコンパクトに要約する.これらの知識は,臨床研究者が生物統計家と一緒に質の高い研究をデザインする際に必要となる.とくに,検定のロジックや留意点を簡潔に整理し,優越性,非劣性,同等性の各仮説を図示し,その検証方法をわかりやすくまとめる.最後に検定の検出力を考慮したサンプルサイズ設定の方法について解説し,期待する効果の大きさや検出力とサンプルサイズの関係についてまとめる. -
臨床試験における多重性の問題
280巻5号(2022);View Description Hide Description複数,すなわち2 個以上のp 値を算出すると多重性の問題が生じる.多重性が存在すると,本当は差がないのに差がある,効果がないのに効果があるという種類の誤った判断に至る確率(αエラー)が上昇してしまうことが一番の問題である.臨床試験における多重性の典型例として,多重エンドポイント,中間解析,サブグループ解析の3 つを典型例としてあげることができる.多重エンドポイントは,エンドポイントが複数存在し,それぞれにおいてp 値を算出することによって多重性の問題が生じる.中間解析では,試験途中で何度も評価を行うことで複数のp 値が算出されることになり,これによって多重性の問題が生じる.サブグループ解析は,サブグループごとにp 値を算出して評価を行うことによって多重性の問題が生じる.多重性の問題が生じた場合,αエラーの上昇や検出力の低下など,臨床試験の特性に影響が生じるため,試験計画・解析において考慮が必要になる. -
これだけは知っておきたい臨床試験における中間解析の基礎
280巻5号(2022);View Description Hide Description中間解析とは,“試験が完了する前に行われる有効性または安全性に関する試験治療群間の比較を意図した解析”である1).中間解析を実施することで,試験途中で試験の継続可否や試験計画の変更が検討できるようになることから,数多くの臨床試験で中間解析が実施されている.しかし,臨床試験で中間解析を実施するためには,単に集めたデータを適宜解析すればよいというわけではない.試験の関係者が中間解析結果を知ってしまうと,試験にさまざまなバイアスを混入させる可能性があるため,試験関係者に中間解析結果を開示しないようにするための適切な試験実施体制を整えることが重要である.統計的にも,中間解析で通常の仮説検定を繰り返し行えば,いわゆる多重性の問題が生じてαエラー(第一種の過誤)の確率は名義的な有意水準よりも増大する.また,試験を早期に中止した場合には,その時点で算出した治療効果などの推定値にはバイアスが入ることもわかっている.このため,中間解析を実施する場合は,αエラーの確率の調整や治療効果の推定値のバイアス修正など,中間解析に対応した統計解析手法を適用する必要がある. -
サブグループ解析とその限界
280巻5号(2022);View Description Hide Descriptionサブグループ解析は,全体集団をいくつかのサブグループに分割し,各サブグループで治療効果を評価することで実施される.一般に,同一の介入であったとしても,患者サブグループが異なれば異なる反応を示す可能性や,同一の患者であっても異なる反応を示す可能性が十分考えられる.人口統計学的要因,環境的要因,ゲノム的要因,疾患要因,併存疾患・併用療法の状況などで説明できる状況は医学一般に広く受け入れられる考え方である.一方,サブグループ解析は真剣に結果を解釈しようとするほど大きなリスクが生じることが知られている.サブグループ解析の問題点は大きく分けて2 つあり,検出力の低下とαエラーの増加である.統計学的にも,臨床試験におけるサブグループ解析については,いまだチャレンジなトピックであり,残念ながら,適切な方法の適切な標準化には現状至ってない.臨床的に適切な解釈を行ううえで,その限界などについて十分に留意することが求められる. -
生存時間データの統計解析
280巻5号(2022);View Description Hide Description医学系研究において関心のあるイベントが発生するまでの時間をアウトカムとすることがある.このようなデータは生存時間データとよばれ,そのデータの特性に適した統計解析手法を用いる必要がある.本稿では,生存時間データの定義と特徴を整理した後,その代表的な解析方法であるカプラン・マイヤー法,ログランク検定,コックス比例ハザードモデルについて概説する. -
メタ解析の基礎と結果を解釈する際の留意点
280巻5号(2022);View Description Hide Descriptionメタ解析は医学論文のなかでも重要な地位を占める.一方で,その読解は大変なことが多く,メタ解析の基礎の理解と,ピットホールに対する意識をもって論文を読むことが重要である.具体的には,メタ解析を行うまでにそもそもどのような準備が必要であるのか,メタ解析では何をやっているのか,結果を統合して結果が有意であればそれでよいのか,その他に注意すべきバイアスとは何か,本稿では簡単な数値例とともにこれらのポイントをまとめた.近年は論文報告のガイドラインも公表されており,おおいに参考になる.計画段階から出版段階まで俯瞰する形で,メタ解析の基礎と結果を解釈する際の留意点について解説する. - 観察研究の方法
-
観察研究(コホート研究タイプ)の基礎と応用
280巻5号(2022);View Description Hide Descriptionコホート研究の主な目的は,関心のある要因(曝露)のアウトカム(疾患罹患や死亡などのイベント)に対する因果効果の推定である.本稿では,コホート研究として曝露が研究者の介入を伴わない観察研究を取り上げるが,より洗練された因果効果推定のデザインである,ランダム化比較試験(RCT)と比較することは理解の助けとなる.コホート研究では前向き,後ろ向きにかかわらず,交絡の調整やバイアスの低減が研究デザインや統計解析上,最も重要な問題のひとつとなる.コホート研究を実施する場合には,介入以外の部分をphase Ⅲ試験などの臨床試験にできるだけ近づけるようにすることが研究の質を高めるために重要である.本稿では具体的な例をあげることにより,臨床の場面における新たな前向きコホート研究実施の可能性を示し,新たな研究分野の開拓を促すことを目的としたい. -
観察分析疫学におけるバイアス
280巻5号(2022);View Description Hide Descriptionバイアスという単語は,妥当性の反意語として広く使用されている.バイアスの概念が多岐にわたり混乱しがちなのは,反意語である妥当性の意味が状況で変化することに一因がある.バイアスを考えるときは,それが阻害する妥当性が具体的に何であるかを考える必要がある.本稿では,疫学研究のデザインのなかでも,観察分析疫学に話を絞って解説する.分析疫学は“記述疫学”,“予防”とともに,疫学の定義の3 本柱のひとつであるが,関連因子や因果関係を担う分析疫学のなかでの妥当性は“比較妥当性”であり,これを損なうものが観察分析疫学におけるバイアスである.観察分析疫学から,偶然誤差(チャンス)と系統誤差(バイアス)が排除されれば,得られた結果は真実である.観察分析疫学のバイアスは,選択バイアス,情報バイアス,交絡に分けられる.これらが原因(要因,曝露)と結果(アウトカム,イベント発生)に同時に作用する場合にバイアスが生じる.本稿ではその説明と回避法について述べる. -
観察研究の報告において大事なこと─STROBE 声明より
280巻5号(2022);View Description Hide Description観察研究を報告することは,研究で得られたエビデンスを世の中に発信する重要な機会である.STROBE声明は観察研究の報告における質の向上を目指し,報告に含まれるべき推奨を提示している.本稿ではSTROBE 声明の内容や報告するときの留意点などを概説し,新型コロナウイルス感染症(COVID-19)の観察研究の報告例を用いてチェックリストの項目を確認する.また,多様な観察研究に合わせた報告についても述べる. -
リアルワールドデータを利活用した臨床試験のデザインと統計的留意事項
280巻5号(2022);View Description Hide Description希少疾患や再生医療等の領域では従来のランダム化比較試験の枠組みで開発することは容易ではなく,医薬品や医療機器等の開発・評価にリアルワールドデータ(RWD)を利活用するさまざまな取り組みが産官学で行われている.試験の実施可能性の検討や施設選定など,RWD の利活用の範囲は広いが,本稿では臨床試験の対照群の一部,あるいはすべてにRWD を用いる代表的な研究デザインを紹介する.一方で,そのような活用に際しては,試験の透明性ならびに種々のバイアスに十分に留意することが必要になるため,統計学的観点からの留意事項についてその一部を概説する. - 方法論の近年の発展
-
ベイズ流統計学の臨床試験への応用
280巻5号(2022);View Description Hide Description臨床試験の方法論が確立して以来,統計的評価の方法として,頻度流の仮説検定・推定が主に用いられてきたが,そのパラダイムは変わりつつある.ベイズ流接近法は,パラメータの不確実さを事前分布で表し,そこにデータを加えることによって事後分布および予測分布を導くという一連の過程に基づく.ベイズ流の考え方は,バスケット試験などのスクリーニング目的の試験と相性がよく,適応的デザイン,とくに中間モニタリングのツールとして有用である.多くの臨床試験において,過誤確率を制御することで仮説を正当化する頻度流統計学が有用である一方,ベイズ流統計学は探索的臨床試験に適し,柔軟性と拡張性が高いことから,頻度流統計学の限界を補うことができる. -
バスケット試験,アンブレラ試験,プラットフォーム試験─実例を交えて
280巻5号(2022);View Description Hide Description近年,がん免疫療法を中心に多くの臨床試験が実施されているなかで,より効率的な臨床試験デザインや臨床開発のあり方が求められている.単一または複数のがん種において,いくつかのバイオマーカーとその標的治療の組み合わせを評価する複数のサブ試験を共通のプロトコールで実施する,マスタープロトコールという考え方が広まってきている.マスタープロトコールで実施する試験を試験デザインからバスケット試験やアンブレラ試験に分類することができる.また,バスケット試験あるいはアンブレラ試験を導入した後で,激化する開発領域においてより柔軟な開発プラットフォームを用意して,新たな治療方法や対象患者の追加や中止を前提とした試験デザインをプラットフォーム試験という.本稿ではマスタープロトコールを中心に,バスケット試験,アンブレラ試験,プラットフォーム試験について,代表的な試験や最近の事例を取り上げ,試験の特徴や課題を解説する. -
アダプティブデザインの基礎─実例とともに
280巻5号(2022);View Description Hide Descriptionアダプティブデザインとは,「試験中で蓄積しているデータを用いて,妥当性と完全性を損なうことなく,実施中の試験のひとつ以上の特性を修正する機会を事前に計画に盛り込んだ臨床試験デザイン」と定義されている.アダプティブデザインによって,従来の固定デザインよりも安全で有効な治療をより早く提供できるようになることが期待されており,近年注目が集まっている.また,2020 年6 月にはランダム化比較試験の報告のためのガイドラインであるCONSORT のアダプティブデザイン拡張版が出版されており,アダプティブデザイン用のチェックリストが提供されている.本稿では,アダプティブデザインの基礎について実例を交えて解説する. -
抗悪性腫瘍薬の用量探索試験のためのベイズ流適応的デザイン─3+3 デザインからの脱却
280巻5号(2022);View Description Hide Description抗悪性腫瘍薬の早期臨床試験は,その後の後期臨床試験で用いる最適な用量を探索することから“用量探索試験”とよばれる.このためのデザインとしていわゆる“3+3 デザイン”が慣例的に用いられ,医師主導の試験の場ではいまなお根強く用いられている.ただし,3+3 デザインはいくつかの問題点を抱えており,これらの解決のために多くのデザインが開発されてきている.これらのいくつかは,ベイズ流学派の統計的推測方式に依拠しており,3+3 デザインよりも確固たる統計的論拠とともに優れた性能を誇る.さらに,デザインによっては3+3 デザインと同等の扱いやすさも有することから,最近では医薬品の承認申請のための治験の場で積極的に活用されている.本稿では,これらの代表的なデザイン,ならびにそれらに付随して設定されることの多い用量拡大コホートおよびそのデザインについて記述し,用量探索試験デザインの最近の発展についても言及する.臨床家と統計家の両者は,抗悪性腫瘍薬の最適用量を精確に探索かつ決定することを目指すならば,単なる扱いやすさを理由に3+3 デザインに安住することなく,よりよいデザインを用いるべきである. -
PRO/QOL を用いた臨床試験のデザインおよび統計解析─SISAQOL プロジェクトより
280巻5号(2022);View Description Hide Description近年,患者報告型アウトカム(PRO)を用いてhealth-related quality of life(健康関連QOL)をエンドポイントに組み入れる臨床試験の重要性が増してきている.PRO データは主観的な評価項目であり,欠測データが生じやすいという特性がある.そのため調査票の選択,プロトコール作成,仮説設定,統計解析,結果報告に至るまで客観的な評価項目と比較して注意しなければならないことが多い.すでに発出されているSPIRIT-PRO やCONSORT-PRO などの各種ガイドラインに加えて,統計解析手法のガイドライン策定のためのSISAQOL プロジェクトが進行中である. -
ログランク検定・Cox 比例ハザードモデルに代わる手法を用いるランダム化比較試験の計画と解析
280巻5号(2022);View Description Hide Descriptionがんや循環器では,生存時間変数を主要評価項目とするランダム化比較試験(RCT)が数多く実施される.解析手法はログランク検定,Cox 回帰が頻用されるが,これは比例ハザード性を仮定したもとで両手法がよい統計的性質をもつためである.しかし,計画の段階では実際のデータが比例ハザード性に従う保証はなく,比例ハザード性が成り立たない結果となる場面も少なくない.比例ハザード性の前提が崩れるとき,ログランク検定の効率は低下し,ハザード比の臨床的解釈は困難になる.本稿では,比例ハザード性が成立しない状況下での両手法の限界とその対処策について,臨床家向けに解説する. -
臨床研究におけるエスティマンド
280巻5号(2022);View Description Hide Descriptionエスティマンド(estimand)という用語が臨床研究の各分野で広まってきた背景には,医薬品開発・規制のための臨床試験の統計解析ガイドラインの整備が大きな影響を及ぼしている.エスティマンドという用語自体は専門用語としては古くからあるが,とくに近年の臨床研究における用法は“因果推論”からの理解が不可欠である.本稿では,上記ガイドラインの補遺における“エスティマンド”を軸に,その考え方を紹介する.医薬品開発以外の一般の臨床試験の文脈,および実験的介入を伴わない観察研究の文脈と対比させることで,上記ガイドラインの想定する医薬品の承認申請・規制の文脈でのエスティマンドの論点を整理する. -
複数の主要評価変数を用いる臨床試験の実際
280巻5号(2022);View Description Hide Description複数の主要変数を用いる臨床試験を特別なものとして位置づけるのはなぜか.通常の主要変数をひとつに絞った試験と比べて何が違うか.そのような試験を実施するにあたり統計的な観点から注意すべきことは何か.本稿では,複数の主要変数を用いる典型的な疾患領域の臨床試験,関連する米国食品医薬品局(FDA)や欧州医薬品庁(EMA)の規制ガイドラインの内容を紹介しながら,これらの疑問に回答する.さらに,新規治療の対照治療に対する有効性の検証を目的とする2 群比較臨床試験を俎上にあげ,複数の主要変数に基づく治療効果の評価の枠組みを整理する.最後に,複数の主要変数を用いる実際の臨床試験のデザインを通して,標本サイズ設計の仕方を概説する. -
臨床試験における多重性の調整
280巻5号(2022);View Description Hide Description仮説検定の本質的な性質から生じる問題として,多重性という問題が存在する.臨床試験における多重性の典型例としては,表1 に示したような多重エンドポイント,中間解析,サブグループ解析をあげることができる.それぞれに適切な統計手法を用いれば多重性を調整できる.多重性の調整法について大分類したものを表2 に示した.多重性の調整法について大分類すると,検証的解析と探索的解析を区別する,α分割法,階層法をあげることができる.臨床試験の目的に応じて,適切な調整法を選択すべきである.とくに近年よく用いられるようになってきた階層法については,α分割法に比べて必要症例数が少なくなるという点のみに注目するのは適切でない.階層法では実際に得ることができる結論のパターンが限定されてしまうため,臨床試験の目的を十分に整理してから使うべきである. -
後治療の解析─RPSFTM
280巻5号(2022);View Description Hide Description米国における抗がん剤アバスチンの乳がんに対する適応削除(2011 年11 月に削除,わが国では2011 年9 月に承認)については,まだ記憶にあるであろうか.E2100 試験,AVADO 試験,RIBBON1 試験など,承認時に評価された主要評価項目である無増悪生存期間(PFS)で差が認められたものの,その後のデータにおいて全生存期間(OS)で差が認められなかった.Cortés らはクロスオーバーや後治療の影響をこれらの原因として指摘している1).昨今,抗がん剤の承認申請においては,PFS などの代替エンドポイント(本特集・下川の稿参照)に基づく承認事例が増えているものの,OS を評価することは重要である2).しかし,増悪後に治療のクロスオーバーや後治療が実施されると,OS に対してその影響は否定できなくなる可能性がある.二次治療以降に有効な後治療が存在すれば,post-progression surviva(l PSS)が延長され,OSにおける群間差は縮まる可能性がある3).すなわち,PFS のOS に対する代替性は薄まる.PFS の改善が大きく優れたリスク/ベネフィットのプロファイルなら(さらに経済的に許容できるなら)PFS による承認はありうるであろうが,これら治療のクロスオーバーや後治療の影響を考慮したうえで,治療法を比較する方法論はないのであろうか. -
操作変数法
280巻5号(2022);View Description Hide Description観察研究では,治療効果の推定における交絡調整の目的で層別解析,回帰モデル,傾向スコア解析などが行われる.これらの交絡調整法に共通しておかれるのが,“未測定の交絡がない”という仮定である.本稿では,治療の因果効果を推定するための方法として,操作変数法(instrumental variable methods)を紹介する.操作変数法では,いくつかの仮定が満たされれば,“未測定の交絡がない(no unmeasured confounders)”という仮定が成立していなくても,正確な治療効果を推定することが可能である. -
臨床試験に基づく費用対効果評価
280巻5号(2022);View Description Hide Description新型コロナウイルス(SARS-CoV-2)の蔓延は,医療資源が無尽蔵ではないという事実を,重症病棟使用率やワクチンの確保数のような数字により可視化し国民に突きつけている.また,リスクに応じたワクチンの接種順決定などの施策は,医療においても資源の分配に関する議論が起こりうることを示している.これは極端な例であるが,医療資源は元来有限であるといえる.医療費にも当然限りがあり,その効率的な活用は国庫負担,健康保険のみならず,何より患者の負担を抑えるため重要な観点である.医療技術(治療,医薬品や医療機器)の費用対効果評価を用いて議論することで,医療費を適正配分して効率性を高め,よりよい治療成績を医療制度全体で達成することを目指すことができる1).本稿では,薬剤の費用対効果評価の方法論と活用について述べ,また費用対効果評価に特徴的に用いられる解析について説明する. -
治療経過に応じて決まる治療方針の因果効果
280巻5号(2022);View Description Hide Description医学研究は人を対象として行われる研究(ときには実験)であり,疾患に対する治療効果や何らかの物質・状態への曝露効果の推測が目標となることが多い.そのために反事実に基づく比較が現代では受け入れられているが,長期にわたる追跡のなかで治療や曝露も変化するため,教科書的な“治療を受けた場合”と“受けなかった場合”との比較では現実を表すモデルとして不十分である.そこで,“治療を受け続けた場合”と“一度も受けなかった場合”という繰り返し治療の枠組みの利用が増えてきている.しかし現実には治療後に副作用が生じたり,治療後の経過に応じて二次・三次治療が導入されたりして,上記の“治療継続”と“無治療継続”の比較であっても現実の医学研究に用いるモデルとしては限界がある.本稿では,実臨床で想定されているような治療経過に適応的な“治療方針”の効果の考え方を示し,仮想的な観察研究データを用いて効果を数値的に例示する. - バイオマーカー解析
-
バイオマーカーを用いた検証的臨床試験のデザイン
280巻5号(2022);View Description Hide Description本稿では,予後や治療効果の予測を目的としたバイオマーカーを用いた検証的臨床試験のデザインに焦点を当てる.代表的な試験デザインのアプローチとして,エンリッチメントデザイン,マーカー層別デザイン,ストラテジーデザインを紹介し,統計的側面について議論する. -
がんゲノムデータの探索とバリデーション
280巻5号(2022);View Description Hide Descriptionハイスループット測定技術の進歩により,がんゲノム全体を一度に測定し,その包括的なプロファイルが得られるようになった.患者ごとに異なるがんゲノム異常の情報は,最適化医療へとつながる有用なバイオマーカーの候補を提供する.一方で,膨大なゲノムデータから実際に臨床上の意思決定に役立つバイオマーカーを確立するには,各研究における偽陽性の制御,研究結果の再現性や一般化可能性の検討は不可欠な要素である.本稿では,バイオマーカーの探索とバリデーションを目的とした研究に焦点を当て,このような研究でおさえておくべき統計学的事項を紹介する. -
臨床試験における分子診断シグナチャーの開発と検証
280巻5号(2022);View Description Hide Description本稿では,臨床試験における分子データを用いた診断シグナチャーの開発と検証について考える.前半部分では分子診断シグナチャーの開発の流れと満たすべき妥当性の規準について整理し,後半部分では治療法開発の臨床試験においてとくに重要となる治療効果を予測する予測シグナチャーに焦点を当てて,統計的視点と方法を整理する. -
予測/診断アルゴリズムの性能評価に関する統計学的論点─Framingham Risk Score から人工知能技術を利用した診断支援まで
280巻5号(2022);View Description Hide DescriptionDeep learning による糖尿病網膜症検出に代表されるように,画像,音声,自然言語などを組み込んだ診断アルゴリズムが実用化されるようになった.ここで重要なのは,そのアルゴリズムによってどの程度の精度で疾患を予測でき,臨床的に有用なのかという性能評価の視点である.本稿では,予測/診断アルゴリズムの性能評価の枠組みについて述べた後に,新規バイオマーカーによってFramingham Risk Score の性能が向上するかを調べたケーススタディを紹介する. - 質の担保と有用なガイドライン
-
臨床試験におけるQuality Management
280巻5号(2022);View Description Hide DescriptionInternational Council for Harmonisation of Technical Requirements for Pharmaceuticals for Human Use(ICH)の主要な成果物であり,近年改正がなされた(なされる)ICH-E6 GCP(医薬品の臨床試験の実施基準)1)やICH-E8(臨床試験の一般指針)2)においては,QbD(計画に基づいた質の確保)やfit for purpose dataquality(目的に応じたデータの質)がキーワードとなっている.わが国においては,臨床試験に関する一連の不祥事を経て,「人を対象とする生命科学・医学系研究に関する倫理指針」3)の前身である「人を対象とする医学系研究に関する倫理指針」4)において,研究の信頼性を確保するための規定が追加され,続いて,未承認または適応外の医薬品・医療機器等を用いた臨床試験,医薬品・医療機器等の広告に用いられることが想定される臨床試験に対しては法規制が適用され(臨床試験法5)),臨床試験の質および透明性の確保が基本理念として掲げられた.本稿では,臨床試験の質のマネジメントについて概説する6,7). -
ランダム化比較試験の報告の質を担保するためのCONSORT ガイドライン
280巻5号(2022);View Description Hide DescriptionRCT はその特徴から質の高いエビデンスを「つくる」ための方法論として注目されることが多い.しかしながら,EBM の実装の観点からも,適切にデザインされ,実施され,報告されたときに最も質の高いエビデンスを提供することができることに留意すべきである.その報告の質を担保する統一基準であるCOSNORT声明は,EBM というフレームワークのなかで,臨床家や研究者,患者,査読者などの多くの読者からの要求に答えられる非常に有用なツールである.本稿では,EBM と臨床試験の関係から報告の質を考えるとともに,CONSORT 声明が公表されるまでの経緯とその使い方を概説する.また,CONSORT 声明を含め,数多く公表されている報告ガイドラインとそのチェックリスト等の入手方法についても紹介する. -
ランダム化比較試験の報告の質を担保するためのCONSORT ガイドライン
280巻5号(2022);View Description Hide Description試験治療が対照治療(標準治療あるいはプラセボなど)に比べて患者に利益(有効性/安全性など)をもたらすかどうかを検証するうえで,最も有効な臨床試験デザインのひとつがランダム化比較試験(RCT)である.RCT は被験者をランダムに試験治療群と対照治療群に割り付け,介入による効果を比較する.これにより臨床試験に伴う多くのバイアスを排除することが期待できることから,単一の臨床試験としては最も高いエビデンスレベルに位置づけられている.ただし,適切性を欠いたRCT では,これらのバイアスを十分に除くことができないため,誤った結論を導くおそれがある.そのためBeggs らは,RCT に関する論文の報告のためのガイドラインとして,CONSORT(Consolidated Standards of Reporting Trials)声明を発表した.その後,CONSORT 声明は2 度の改訂が行われている(現在の最新版は,CONSORT 2010 である),また非薬物介入研究に関しては,2017 CONSORT NPT Extension が公表されている.ここでは,CONSORT 声明に準拠したRCT の実施,ならびに論文の執筆を行うために必要な基礎的な内容について触れる. -
国際共同治験におけるガイドライン─考慮すべき4 つのポイント
280巻5号(2022);View Description Hide Description近年,医薬品の国際開発の必要性から,国際共同治験が増加傾向にある.国際共同治験に対しては,「国際共同治験に関する基本的考え方」,「国際共同治験に関する基本的考え方(参考事例)」,「国際共同治験の計画及びデザインに関する一般原則」という3 つの指針が出されており,独立行政法人医薬品医療機器総合機構が行う審査の際に利用されている.国際共同治験を実施するうえでは,①一貫性評価のための解析,②日本人(各地域)の必要症例数,③日本(地域)を層別因子とした割付と解析,④外因性・内因性の影響(民族的な要因の検討),の4 点をそのポイントとして整理することができる.ここでは,実際に行われた国際共同治験を実際の例に交えながら説明した.これらのポイントを念頭において国際共同治験をデザインすることが重要である. -
EMA によるサブグループ解析ガイドライン
280巻5号(2022);View Description Hide Description臨床現場では,同じ疾患をもつ患者であったとしても,年齢,重症度,病期,ゲノムプロファイルなどで定義される特徴に応じて日常診療を行うことが求められている.同じ疾患をもつ患者全体への効果を主として評価する通常の臨床試験とは大きく異なるところである.2019 年,欧州規制当局(European MedicinesAgency)はサブグループ評価に関するガイドラインを発効した.そこでは試験計画,統計解析,解釈にわたってのサブグループ評価の考え方が示され,特に,治療効果の一貫性,生物学的尤もらしさ,エビデンスの再現性という3 軸に基づいて階層的にサブグループ効果の信憑性評価を行うことに新規性を有する.サブグループ解析の統計的な問題を理解したうえで,できるかぎり系統的なかたちで,サブグループ解析の結果を解釈することは重要であり,その目的においてもこのEMA ガイドラインは非常に有用である. - 臨床家と試験統計家のよりよい協同に向けて
-
臨床研究デザイン・医療統計学のセンスとスキルをもった臨床医の育成
280巻5号(2022);View Description Hide Description多くの臨床医は,基本的なレベルの臨床研究方法論や統計学をきちんと学習せず,“劣化コピー”のやり方で臨床研究を実施している.米国では,臨床研究を実施している臨床医を対象とした臨床研究方法論の教育が系統的に行われているが,日本では大学院教育がその役割を担っている.しかし,臨床研究の大多数を担っている多くの臨床医が,長期間にわたって診療から離れて大学院教育を受けることは困難である.そのような臨床医を対象に,短期間で集中的に,臨床研究実施の基盤として最低限必要な臨床研究デザインと統計学のセンスやスキルを,シミュレーション形式で学習する臨床研究ワークショップを実施している.臨床研究ワークショップで学習したことをon-the-job training を行いながら,きちんとした指導のもとで臨床研究のスキルやセンスを身につける必要がある.普段から統計家と臨床医がフラットな関係でコミュニケーションを取っていくことが,質の高い臨床研究の実施やその基盤となる教育につながっていく. -
生物統計家育成事業─東京大学大学院での取り組み
280巻5号(2022);View Description Hide Description日本医療研究開発機構(AMED)生物統計家育成事業の育成拠点として,東京大学大学院と京都大学大学院の2 拠点が選定されている.東京大学大学院では,学際情報学府に“生物統計情報学コース”,医学系研究科に寄付講座“生物統計情報学”を新設し,現在まで35 名の学生が入学し(1 期生から4 期生),19 名が修了(1 期生と2 期生),そのうち16 名が全国の臨床研究実施機関に生物統計家として就職している.本稿では,東京大学大学院での実施体制,カリキュラム,キャリアパスとこれまでの実績などについて紹介する. -
日本計量生物学会・試験統計家認定制度
280巻5号(2022);View Description Hide Description日本計量生物学会は,2017 年4 月に試験統計家認定制度(以下,本制度)を開始し,試験統計家とよばれるにふさわしい統計家の認定を行っている.本制度では,試験統計家を「臨床研究の統計的デザインと解析,統計家の行動基準に関し深い知識を有し,実践している者」と規定し,①実務試験統計家(trial statistician)と,②責任試験統計家(senior trial statistician),の2 種類を認定する.ディオバン事件を教訓として,学会および大学・研究機関は社会的な責任を自覚した信頼できる試験統計家を育成し,その社会的地位を確立するという使命を担うべきと考える.そのうえで質が確保された臨床試験データに基づくエビデンスを社会に提供していく必要がある.
-