新着文献
一覧はこちら
文献紹介:2013年
<2013年12月 文献紹介>
EQ-5D-5L法の暫定的なスコアリング: EQ-5D-3Lへのマッピングによるもの
van Hout B, et al. Interim scoring for the EQ-5D-5L: mapping the EQ-5D-5L to EQ-5D-3L value sets. Value Health. 15(5):708-15. 2012.
背景: 5水準版のEQ-5D法の質問票(EQ-5D-5L)はすでに開発されているが、代表性のある一般集団から直接的に得られた 選好に基づくバリューセット[訳注: 得られた回答をQOL値に変換する一連の対応表]は、まだ利用できない。 本研究の目的は、現在利用可能な3水準のEQ-5D(EQ-5D-3L)バリューセットへのマッピング(あるいはクロスウォークとも呼ぶ)に よりEQ-5D-5Lのバリューセットを作成することにある。 方法: EQ-5D-3LとEQ-5D-5Lの質問票に同時に回答させた。EQ-5Dの各次元において、幅広い範囲の水準の回答を確保するため、 回答者は様々な重症度の人々を含めた。EQ-5D-5Lのバリューセットを作成するために4つのモデルを用いた。 それらは、線形回帰、ノンパラメトリック統計量、順序ロジスティック回帰、項目反応理論である。 より望ましいモデルの基準は、理論的背景、統計的あてはまり、予測力、単純性(parsimony)などであった。 結果: 回答者は全部で3691名であった。すべてのモデルは同程度の統計的あてはまりを示した。 予測力は、ノンパラメトリックと順序ロジスティックモデルがわずかに優れていた。 すべての基準を考慮すると、ノンパラメトリックモデルが、EQ-5D-5Lの値を作成するために最も適した方法として選択された。 結論: ノンパラメトリックモデルは、パフォーマンスはその他のモデルと類似していたものの、単純性の点で好ましかった。 [(訳注):どの国や地域で]使用されるバリューセットには関係なく、これはEQ-5D-3LのバリューセットをEQ-5D-5Lの値へと 変換するために使用することが可能である。この手法の強みは、3水準のバリューセットと比較可能性があることである。 一方で、クロスウォークの限界は、値の範囲がEQ-5D-3Lバリューセットの範囲に制限されてしまうことにある。
コメント
EQ-5D-3L法は選好に基づくQOL値測定において、最も汎用されている質問票であるが、一方で天井効果の存在や3水準であることの「目の粗さ」が指摘されることもあった。 そこで、5水準からなるEQ-5D-5L質問票の開発が進んでいる(日本語版も利用可能)。 上記報告にもあるように、本来は一般集団への調査を行うべきであるが、調査には時間等を要するため、 本研究に基づき、EuroQOL本部は暫定的なスコアリングを行っている。 ただし、マッピング法そのもの課題に加えて、質問票の表現が一部変わっており(例えば、移動の程度において「寝たきり」(3L)→「歩き回ることができない」(5L))、 このような手法の適応にはもちろん議論もあるところだろう。 我が国でも一般集団への調査を行う予定であるが、水準数が増加すると、水準の順序とQOL値の関係が逆転するinconsistencyなどの課題が生じることも考えられる。質問票については、日本語版がすでに利用できるが、 現時点(2013年12月)ではスコアリングアルゴリズムについてそのような状況であることを理解した上で、どちらのEQ-5D質問票を使用するか検討すべきであろう。日本における今後の研究の進展が待たれる。(ST)
<2013年11月 文献紹介>
医学研究における一般的なQOL測定:最も頻繁に用いられる効用測定法にみられる概念的問題
Pietersma S et al: Generic quality of life utility measures in health-care research: Conceptual issues highlighted for the most commonly used utility measures. INTERNATIONAL JOURNAL OF WELLBEING, 3(2), 173-181.2013
目的:医療介入の効果は一般的効用測定法(例:EQ-5D)によって測定されることが多い。 これらの測定法はQOLが医療介入によって影響を受ける事を予測できるQOLの側面に焦点をあてている。 伝統的な健康関連効用値測定はQOLの概念を比較的狭く捉えることに基づいていると言わざるを得ない。 依って医療介入の効果をより良く判定するには、伝統的健康関連QOL効用測定法を超えた方法が必要となってくる。 方法:5つの頻用される一般的効用測定法(EQ-5D, SF-6D, QWB-SA, HUI2, HUI3)の定義と質問文を分析した。 結果:伝統的 健康関連QOL効用測定法は、比較的狭い健康概念と健康関連QOLに焦点をあてていた。 この狭さを拡大して明らかにしたところ、a)ドメインの数を精選しすぎている。 b)各ドメインの部分となりうる様態の解釈が狭い という2つ問題が明らかとなった。 結論:異分野(例:主観的健康アプローチおよび、潜在能力アプローチ)の洞察を用いることで 健康および健康関連QOLのより完全な操作ができるようになり、 結果として人々のQOLを増加させるのに最も効果的な介入になるような医療資源の最適な配分に結びつくと信じている。
コメント
あまり質の高い論文ではないが、旧来の健康関連QOL効用値測定法の限界を検討し、 潜在能力アプローチによるより広い健康概念に基づくあらたな効用値測定法を提唱したところに新しさを感じた。 EQ-5Dは身体的ドメインが多い(5ドメイン中3ドメイン)、SF-6Dは身体・精神的ドメインしかないことといった ドメイン数が限られた上に偏っているという批判を行っている。 またQWB-SAも74項目中66項目が身体的ドメインであり、HUI2/HUI3もSF-6Dと同様の欠点を挙げている。 特に後者3つは機能的障害や特異的な症状がないことが健康であるという古い健康概念に基づいていることがよろしくない とのことである。一方ではそうした新しい健康関連QOL測定法を作成する方法については、なんら示唆はなされていない。 わが国でもアマルティア・センの唱える潜在能力アプローチを旧来の効用値によって算出されたQALY(質調整生存年)に 組み込む方法について議論が始まったところである。(SS)
非小細胞肺がん患者に対する早期緩和ケア
Temel JS, et al. Early Palliative Care for Patients with Metastatic Non–Small-Cell Lung Cancer. N Engl J Med 2010; 363:733-742
方法:新規に転移性の非小細胞肺がんと診断された患者を標準的がん治療群と早期緩和ケア併用群の2群に無作為に割りつけた。 患者のQOLと気分について、FACT-L(Functional Assessment of Cancer Therapy–Lung)と HADS(Hospital Anxiety and Depression Scale)という尺度を用いて、ベースラインと12週経過した時点で評価した。 主要アウトカムは12週の時点のQOLとした。結果:無作為に割りつけられた151人のうち、12週までに27人が死亡し、 生存者のうち107人(86%)が、評価可能であった。緩和ケア早期導入群は通常のがん治療を受けた群より有意にQOLが良好であった (FACT-Lスコアが98.1対91.5; P=0.03)。抑うつ症状があった患者も早期緩和ケア導入群の方が少なかった(16% 対 38%;P=0.01)。 通常のがん治療を受けた群より早期緩和ケア導入群の方が濃厚なエンドオブライフケアを受けた数が少なかったにもかかわらず、 生存期間の中央値は有意に延長していた(11.6カ月 対 8.9ヶ月; P=0.02)。 非小細胞肺がん患者においては早期に緩和ケアを導入することでQOLも気分も改善していた。 標準がん治療だけを受けた患者と比べて、早期に緩和ケアを導入した患者の方が濃厚なエンドオブライフケアを受けないにもかかわらず 生存期間は延長していた。
コメント
早期の緩和ケア導入が、QOLや抑うつ状態の改善に結びつくだけでなく、生存期間も延長したという画期的な論文である。 ここでいう早期の緩和ケア導入とは、緩和ケア外来に通い、医師もしくは専門看護師の診察を受けることであり、 通常緩和ケアという言葉から連想されるホスピス等における症状緩和とは異なる。 よって本論文の結果から、緩和医療が生存期間を延ばしたという解釈はミスリーディングである。 本論文を根拠に緩和医療そのものの延命効果を高らかに唱うものも多いが、それよりもサイコオンコロジー的な介入効果で あると理解した方が良い。むしろ濃厚な治療(死亡前2週間以内の化学療法あり)を受けた患者が早期導入群に少ない (24%対17.5%)ことから推測できるように、早期から治療法の自己決定(無益な化学療法を受けない等)を促すような 関わりをうけた患者が長生きした可能性が高い。肝心の主要アウトカムである12週目のQOLでは対照群に比しわずかな 改善がみられているが、ベースラインとの比較では、両群間で有意差を認めていない (標準治療群: −0.4±13.8;早期介入群: 4.2±13.8 )。(SS)
<2013年10月 文献紹介>
EORTC QLQ-C30スコアの意味がある変化に関する根拠に基づいたガイドライン
K. Cocks, et al. Evidence-based guidelines for interpreting change scores for the European Organisation for the Research and Treatment of Cancer Quality of Life Questionnaire Core 30. European Journal of Cancer. 2012;48:1713-1721
目的は、EORTC QLQ-C30スコアの臨床上で意味がある変化の推定値に関するガイドライン作成である。 スコアの推定値作成方法は、システマティック・レビュー、メタアナリシスとエキスパート・オピニオン(専門家の意見)による結果を統合した。 対象とした118本から得た1232のQOL平均値変化の結果として以下の推定値が提示された。 1)変化の大きさ(ほんの少し、少し、中程度)、2)各サブスケール、3)QOLが向上した場合と悪化した場合。 QOLが向上した場合の推定値は悪化した場合より小さかった。 本研究の結果から導かれたのは:1)QOLスコアの変化の平均値は、多くの臨床状況でレスポンスシフトのために小さくなる、 2)時間的な変化を観察したい場合には、計画段階で慎重に考える必要がある、 3)キーポイントは、フォローアップのタイミング、サンプル数の減少、QOL変化の方向、主なサブスケール等であった。 このガイドラインは、臨床的な変化の意味の検討とサンプル数算定に使用可能である。
コメント
本研究は、共同著者であるKingが1996年にQual Life Resで発表したEORTC QLQ-C30 (がん疾患特異尺度)の臨床で意味がある差についてのレビューの第2版ともいえる。 対象文献は以前の14本から118本となっている。 いわゆるMID(Minimally Important Difference: 臨床で意味がある最小差)の推定値を、先行研究から提示しており、EORTC QLQ-C30を使用する際には、本ガイドラインが臨床での評価結果の意味の参考となる。 また今後EORTC QLQ-C30を使用する臨床研究のサンプル数算定の参考にもなろう。 MIDの推定が統計学的分析と異なる点は、QOLの方向性、つまり改善の場合と悪化の場合では「人が感じる差」が違うことである。 QOL評価研究は、「測りたいものをきちんと測る」尺度開発から、レスポンスシフトやMIDも包含して「測ったものの意味(解釈)」へも 考察を深めてきていると考える。(MK)
がん臨床研究の健康関連QOL測定におけるEORTC QLQ-C30とFACT-Gの選択:問題、根拠、推奨
Luckett T, et al. Choosing between the EORTC QLQ-C30 and FACT-G for measuring health-related quality of life in cancer clinical research: issues, evidence and recommendations. Annals of Oncology. 2011; 22: 2179–2190.
目的は、がん特異的QOL尺度として世界的に広く使用されている2つの尺度、 the European Organization for the Research and Treatment of Cancer Quality of Life Questionnaire Core 30 (QLQ-C30)と the Functional Assessment of Cancer Therapy – General (FACT-G) の比較検討である。 Webサイトと各マニュアルを参考に、内容、スケールの構造、アクセスしやすさと有効性に関する情報が検討された。 結果として、計量心理学的に信頼性・妥当性ともに両者に顕著な違いはなかった。 スケールの構成では、QLQ-C30では健康関連QOL(HRQOL)に加えて身体的症状を問うているが、 FACT-GではHRQOLだけであるなどの特色がみられた。 社会性ではQLQ-C30が社会的活動をあげ、FACT-Gは関係性と支援をあげるという違いは重要なポイントである。 両者ともに多くの言語に翻訳されている。どちらを選択するかは、調査者の目的による。
コメント
QOL評価時に、どの尺度を使用するか迷った経験がある方は多いだろう。 このレビューは、臨床家が使いやすいシンプルなアルゴリズムを提示して、研究目的に応じたQOL評価票を選べるように整理してある。 QLQ-C30はヨーロッパの多国間で検討して開発され、FACT-Gは米国で開発された。 本レビューでは英語版のみを対象としているが、重要と指摘された両者の社会性のドメインで、文化的差異がどう関係するのか興味があるところである。 QOL評価票の選択では、かならず質問票の項目をチェックし、自分たちが調べたいことをきちんと調べられるのか検討することが必要である。(MK)
<2013年9月 文献紹介>
高齢者における死亡の予測因子としての健康関連QOL変化
Otero-Rodríguez A, et al. Change in health-related quality of life as a predictor of mortality in the older adults. Qual Life Res. 2010;19:15-23.
目的:健康関連QOLの変化がスペインの高齢者の死亡を予測するかどうかを検討した。
方法:研究デザインは前向きコホート研究である。施設に入所していない、60歳以上のスペイン人の高齢者2,373名を解析対象とした。 2001年から2003年にかけて、SF-36を用いて健康関連QOLを2回測定した。SF-36の身体的健康をあらわすコンポーネント・サマリースコア(PCS)および精神的健康をあらわすコンポーネント・サマリースコア(MCS)と2007年までの4年間における総死亡の関係を、コックス回帰モデルを用いて分析した。
結果:2003年から2007年の間に212名の死亡が確認された。 -5~5ポイントのPCS変化に対して、PCSが10ポイントより大幅に減少するハザード比(HR)は2.12(95%信頼区間[CI]:1.39-3.24)、 6~10ポイント減少は1.51(95%CI:1.01-2.28)、6~10ポイント増加は0.83(95%CI:0.51-1.34)、 10ポイントより大幅な増加は0.68(95%CI:0.42-1.09)であり、傾向性の検定においても有意な結果が得られた(P<0.001)。 MCS変化と死亡に関しては、PCSと同様の関連は認められたが、それらの関連は弱く、10ポイントより大幅に減少している群のみ有意であった(P<0.05)。
結論:健康関連QOLの変化は高齢者における死亡を予測した。 健康関連QOL低下は生命予後の悪化を警告するものであり、QOL低下の要因の探索に取り組むべきと考えられる。
コメント
今回の結果は先行研究を支持するものである。身体的健康の自己評価と死亡が関連することは妥当な結果と考えられる。 PCSの良好群(スコアが「50<」のまま)に較べて、悪化群(スコアが「50<」から「50≧」に変化)や不良群(スコアが「50≧」のまま)のHRが有意に上昇し、 改善群(スコアが「50≧」から「50<」に変化)は同様の傾向にとどまったことは、興味深い。 QOLを2回測定(調査)することができた者が解析対象になることから、一定以上の健康状態を維持している集団の結果としてとらえることは必要であろう(初回調査のみに協力した者が560名おり、解析対象から除外されている)。 追跡期間が4年と長くないことから、長期間の追跡でどのような結果が得られるのか、とりわけMCSと死亡の関連について今後の報告を待ちたい。(NM)
中高年女性における健康関連QOLの変化と死亡
Kroenke CH, et al. Prospective change in health-related quality of life and subsequent mortality among middle-aged and older women. Am J Public Health. 2008;98:2085-91.
目的:中高年女性における健康関連QOLの変化とその後の死亡について検討した。
方法:1992年時に46歳から71歳で、健康なNurses’ Health Study参加者40,337名のデータを分析した。 健康関連QOL評価は、SF-36を用いて1992年~1996年と1996年~2000年の2回おこなった。 身体的健康をあらわすコンポーネント・サマリースコア(PCS)および精神的健康をあらわすコンポーネント・サマリースコア(MCS)の変化と2004年までの死亡の関連を、コックス回帰モデルを用いて検討した。
結果:健康関連QOLの変化がほとんど認められない者に較べて、低いQOL(PCSとMCS)あるいは大幅なQOL低下を認めた者は、死亡リスクがより高かった。 PCSの4年間にわたる変化は死亡を予測していた。 -4~5ポイントのPCS変化群と比較して、20ポイント以上のスコア減少群の相対危険(RR)は3.32(95%信頼区間[CI]:2.45-4.50)、10~19ポイント減少群は1.44(95%CI:1.16-1.79)、5~9ポイント減少群は1.35(95%CI:1.12-1.63)、改善群は0.72(95%CI:0.56-0.91)であった。 MCSにおいても類似した結果が得られた。 PCSおよびMCSスコアの増加は生活習慣の改善、とくに身体活動の増加に関連していた。
結論:健康な集団において、健康関連QOLの変化はその後の死亡を予測することが示された。変化のパターンの決定要因について、今後の研究が必要である。
コメント
Otero-Rodríguez Aらの論文に引用されている、米国の看護師を対象とした大規模コホート研究からの報告である。 追跡期間の中央値が8年と長く、サンプルサイズも大きい。 スコア改善群はPCS、MCSともに死亡リスクが有意に低下しており、身体的健康および精神的健康の自己評価と死亡率が関連することが示された。 医療関係者が対象であることから、健康に対する自己評価の妥当性が高い集団の結果とも解釈できる。 地域住民を対象としたOtero-Rodríguez Aらの結果は本研究を支持するものであり、相対危険度も近い値が示されている。 生活習慣の変化に着目した分析は興味深く、身体面および精神面のQOL改善と身体活動増加の関連が数値として示された公衆衛生学的意義は大きい。(NM)
<2013年8月 文献紹介>
2つの構造方程式モデリングを用いたレスポンスシフトの評価
Pranav K, et al. Assessment of response shift using two structural equation modeling techniques. Qual Life Res 2013, 22:461-471.
冠動脈疾患をもつ高血圧患者909人がSF-36に回答したデータを用い、ベースラインと1年目の間のレスポンスシフトを解析した。 この研究はOortとSchmittが提唱した2つの構造方程式モデリング(SEM)を用いて、レスポンスシフトを特定することを目的として行われた。 観測値のスコアではPF(身体機能)に有意差はみられなかったが、2つのSEMを用いたアプローチではPFにrecalibration(内的基準の変化)が特定された。 Recalibrationのエフェクトサイズは-0.12(negligible)であった。
コメント
レスポンスシフトは人間の適応現象の一種であり、主に、内的基準の変化、価値の変化、意味の変化の3種類に分類されている。 これらは、臨床試験においてQOLなどの主観的健康アウトカムのスコアを解析する際のバイアスになる可能性があり、詳しく検出する方法が開発されつつある。 本論文では、実際に検出したレスポンスシフトの結果に加え、特にOortが提唱した解析法について、手順を含めて詳しく解説が行われている。 本論文の結果では検出されたレスポンスシフトが1種類であったが、複数の種類のレスポンスシフトが同時に起きた場合の解釈については今後の課題である。 今後、レスポンスシフトの検出を試みようと考えている研究者は一読されることをお薦めしたい。(NK, SK)
国際医薬経済・アウトカム研究学会(ISPOR)研究班報告-医療用製品の効能を証明する研究用の小児PRO尺度:子供と思春期評価のためのISPOR PRO Good Research Practices(正しい研究の実践)研究班の報告
Matza LS, et al. ISPOR Task Force Reports – Pediatric patient-reported outcome instruments for research to support medical product labeling: Report of the ISPOR PRO Good Research Practices for the assessment of children and adolescents task force. Value Health 2013, 16, 461-479.
子供や思春期のためのPRO尺度は、医療用製品の効能を証明する臨床試験にしばしば使われている。 本報告の目的は、小児PRO研究の正しい実践(Good Practice)方法を推奨することである。 本分野では得られるエビデンスは限られており、あらゆる状況に適応できる原則は多くないが、 小児用PRO尺度を使用する際に必要な研究デザインと考慮すべき要因、そして将来必要な研究について述べられている。 次の5つのGood Research Practicesについて議論が行われた。 1) 4つの年齢層(-4, 5-7, 8-11, 12-18)別の評価、2) 小児用PRO尺度の内容妥当性、 3) 情報提供者報告アウトカム(Informant-reported outcome)尺度、中でも代理人と観察者の報告アウトカムの比較、 4) PRO尺度のデザインとフォーマット、5) 交叉文化的課題、である。 1)では例えば、疼痛では5-6歳で9割、8-11歳でほぼ100%理解しているが、エネルギー、健康度、神経質さでは5歳で4-6割の理解度であった。 また、3)では、FDAでは効能証明には代理人よりも観察者報告の方を勧めているが、子供と親の報告の同時比較研究が重要かもしれないとしている。 全体的に8歳以下の研究が不足しており、今後の課題としている。
コメント
小児のPRO尺度の使用に関する推奨ガイダンスは従来見当たらない。 本報告は、小児用の医療用製品の効能を当局に申請する際に大変役立つと思われる。 米国FDAやドイツのIQWiG、フランスのHAS、EUの EUnetHTAなどの当局関連機関にも配布されているとのことである。 本報告の限界としては、医療経済評価で用いられる効用値測定尺度や最近話題になっている比較効果研究(Comparative effectiveness research: CER)について言及していないこと、小児を対象にランダム化比較試験を行う倫理性について議論されていないことなどがあげられている。(SK)
<2013年3月 文献紹介>
介護者QOL がんインデックススケール(CQoLC):フランスのがん患者の配偶者で妥当性を検証する確証的因子分析
Lafaye A, et al. The Caregivers Quality of Life Cancer index scale (CQoLC): an exploratory factor analysis for validation in French cancer patients’ spouses. Qual Life Res. 2013, 22(1), 119-122.
この研究は、フランスのがん患者の配偶者サンプルで、「介護者QOL がんインデックススケールCQoLCの信頼性と妥当性を評価することが目的であった。 配偶者300名(21–85歳)がCQoLC、包括的QOL 尺度SF-12、不安尺度STAI に回答し、カルテから患者の臨床データ(ガンの重症度、罹病期間など)を得た。 因子分析によって23 項目からなる1 因子(分散の38.76%を説明)が抽出され、QOL 障害と名付けられた。 この因子は、SF-12 身体的健康とは負の相関(ρ=-0.351、p=0.001)、精神的健康とは正の相関(ρ= 0.184、p=0.005)を示した。 STAI 得点によって分類した群では、不安が低い者は、不安が高い者よりもQOL が良かった(F[2、237]= 4.80、p=0.01)。 CQoLC はフランスのがん患者の配偶者のQOL 障害を評価するのに十分な妥当性と信頼性を持つ。
コメント
がん患者の介護者のQOL は、がんが与えるインパクトとして重要な指標の一つである。 本研究で検証されたCQoLC はがんの配偶者に特化した質問群を集めたユニークな尺度である。 しかし、本研究の妥当性・信頼性の検証は、1 因子性を確認して他の尺度との相関を見るにとどまっており、この尺度の特性の検証としては不十分であると感じる。 広く使われている包括的なQOL尺度ではなく配偶者に特化した尺度を使用することの利点と欠点を十分に検討することが必要であろう。(SY)
シンガポールのアジア多民族都市住民におけるSF-36v2シンガポール英語版とシンガポール中国語版の信頼性と妥当性
Thumboo J, et al. Reliability and validity of the English (Singapore) and Chinese (Singapore) versions of the Short-Form 36 version 2 in a multi-ethnic Urban Asian population in Singapore. Qual Life Res. 2013. [Epub ahead of print]
シンガポールの多民族都市において、健康関連QOL測定尺度として広く使われているSF-36の英語版と中国語版の信頼性妥当性を検討した論文である。4,917人のデータ(4,115人:英語、802人:中国語)解析の結果、信頼性を示すクロンバックのα係数は英語版では全ての下位尺度で0.70以上であったが、中国語版では社会機能の下位尺度が基準を満たさなかった。既知グループ妥当性では、英語版・中国語版とも、慢性病状がある者は得点が有意に低かった。確証的因子分析では、米国の2要因構造、日本の3要因構造よりもシンガポールデータに基づく3要因構造が適合した。これらの結果から、多民族都市の異なる言語版がどちらも有効であることが示された。
コメント
先行研究では、欧米データに基づいて求められたSF-36の2要因構造(身体/心理)は、日本を含む東アジアでは適合しないことが報告されている。そのため、2011年に日本においては役割・社会要因を加えた3要因構造が提唱された。本研究においてもシンガポール多民族に沿いて3要因構造が支持されたことは興味深い。(SY)