新着文献

文献紹介:2016年

＜2016年12月　文献紹介＞

MIDを中央にしない：平均への回帰は最小重要差の推定を縮小する

Fayers PM, Hays RD.: Don’t middle your MIDs: regression to the mean shrinks estimates of minimally important differences Qual Life Res. 2014; 23(1): 1-4. Doi: 10.1007/s11136-013-0443-4. .

PROのMID（Minimal important differences：最小重要差）は、アンカーによって推定される。臨床的な意味や重要性による臨床的なアンカーの変化は、PROの値に関する推定に用いられる。これらのMIDは、しばしば回帰分析により推定されているが、これらがバイアスの掛かった手法であり、使ってはならないことを提示する。
目的：発表された報告（論文）で使われたアプローチを調査して、目的とする変数にアンカーの変化を関連付ける正しい方法を推薦する。
結論：MID決定にアンカー変数を使っている研究では、回帰モデルを適用している。しかし、平均への回帰により、これらのモデルはMIDを決定するには不適切である。それらは分布の中央に収縮して正しい値より、より小さい結果になる。例えば、アンカーと目的の相関係数が0.33に近い場合、MIDの推定値は真の値のほぼ三分の一である。

2014年にFayersとHaysによって発表された、4ページ足らずのstudy noteである。「MID」が研究当初の試みより広く、安易とも思われる使われ方がされるようになった今日、MID推定方法に正面から向き合って、統計学的観点から汎用に警鐘を鳴らす一文であろう。 Noteではあるが、2015年のISOQOL（国際QOL研究学会）では、Quality of Life Research誌のoutstanding awardを受賞した。内容は、Cohenの”Statistical power analysis for the behavioral sciences”（1988）にも言及されており、統計学の知識が無いと少々読みづらいというのが、率直な感想である。 MID推定方法についての警鐘ではあるが、決してMID推定を否定しているものではない。むしろFayersの指摘にどう応えていくかで、将来的なMID研究の方向性の一つを示唆しているとも考える。 MID研究者には欠かせなない貴重なnoteであろう。（MK）

＜2016年11月　文献紹介＞

一般的な腰痛に対する理学療法の効果はどの程度か？　4597患者の多変量解析

Eleswarapu AS, et al.: How effective is physical therapy for common low back pain diagnoses? A multivariate analysis of 4597 patients. Spine 2016;41:1325-1329.

目的：腰痛に対する理学療法PTが、患者報告による痛みと機能的アウトカムにおいて臨床的に重要な改善をもたらすかどうかを評価すること。方法：腰痛の非手術治療としてPTを受けた患者4597人を対象とした。主要アウトカムは、オズウェストリー障害指数（ODI）、活動時と安静時の痛み評価スケール（NPRS）の治療前後スコアとした。各アウトカムの変化量がすでに報告されている臨床的最少重要差（MCID）に達した患者割合を算出した。各変数の開始時スコアがMCID以下であった患者は、分析から除外した。 PTの不成功を予測する危険因子を決定するためにロジスティック回帰分析を行った。結果：ODIにおいてMCID以上の改善を認めたのは、患者の28.5％であった。 ODIを指標とした際の治療不成功の予測因子は、夜間症状（寝汗・夜間の痛み）、肥満、喫煙であった。安静時NPRSにおいては、患者の59%がMCID以上の改善を認め、不成功予測因子は静脈血栓塞栓症、夜間症状、精神疾患、労災補償状況、喫煙、肥満であった。活動時NPRSにおいては、患者の60%がMCID以上の改善を認め、不成功予測因子は夜間症状、労災補償状態、喫煙であった。結論：腰痛に対するPT後に、痛みや機能の改善が最小重要差MCIDに満たない人が相当割合いることが示された。治療不成功の一般的な危険因子は、喫煙と夜間症状であった。

腰痛は日本においても有訴者の多い症状である。一部の原因となる疾患には外科的治療が有効であることが示されているが、多くの腰痛に対しては最適治療法が明らかではない。著者らは、米国において腰痛に対する医療費の17％が使われているPT（外科的治療は5%）が、実際に臨床的に意味のあるアウトカムをもたらしているのか？という疑問を明らかにしようとした。本研究は比較群を持たない観察研究であるが、患者報告指標のMCIDをアウトカムにして治療の臨床的意味を探ろうとした点に新規性がある。著者らは相当数がMCIDに満たないことに着目しているが、視点を変えればPTが有効である者も相当数いる。本研究はPTの内容や期間が多種多様、腰痛原因も多種多様であるので、おそらくはPTにおいても有効な手技や頻度、有効な腰痛原因などがあると考えられる。（SY）

＜2016年10月　文献紹介＞

費用効果分析の実施、方法論的実践及び報告に関する勧告－第２次「医療の費用対効果に関する委員会」－

Sanders GD, et al. Recommendations for Conduct, Methodological Practices, and Reporting of Cost-Effectiveness Analyses – Second Panel on Cost-effectiveness in Health and Medicine. JAMA. 2016; 316(10): 1093-1103.

背景:1996年の「医療の費用対効果に関する委員会」勧告の発表から今日まで、研究者らは費用効果分析の手法を発展させ、政策決定者はその利用を試みてきた。保健医療を効率良く提供する必要性と、健康を改善する戦略の臨床経済的な結果を理解するための分析手法を用いる重要性が、近年、高まってきている。
目的:費用効果分析の動向をレビューし、分析の質を向上する勧告の提供を目的とした。この委員会の参加者には、研究者、政策立案者、公衆衛生当局者、健康管理者、支払者、企業、臨床家、患者や消費者を含む。
方法:2012年に、2人の共同議長、13人のメンバーと、統率班から追加の3人の構成員を含む第２次「医療の費用対効果に関する委員会」が組織された。これらのメンバーは、費用効果分析の設計、実施と使用において、幅広い専門知識を提供できる経験者を基本に選んだ。この委員会は3年半の間、合意によって前回勧告を発展させ、外部のレビュアー、公開投稿手続きにより、勧告が吟味された。
結果:「レファレンス・ケース」の概念と、すべての費用効果分析が質及び比較可能性を改善するために従うべき一連の標準化した方法論的実践が推奨される。すべての費用効果分析は、2つのレファレンス・ケース分析の結果を報告するべきであり、１つはヘルスケア部門の視点、他方は社会の視点に基づく分析である。２つのレファレンス・ケース分析の結果の範囲と境界を明確にすることを意図した、結果を含む構造的な表である”impact inventory（筆者注：以下「影響一覧表」と仮訳する。）”の使用も推奨される。本稿は、これらの推奨やその他介入結果の推定、健康アウトカムの評価、費用効果分析の報告を概説する。
結論: 第２次委員会は、費用効果分析の動向をレビューし、新しい勧告を作成した。主要な変更として、２つのレファレンス・ケースの視点からの分析を行うこと、そして、結果を明確にする「影響一覧表」を提供することを推奨する。

医療経済評価における報告様式については、2013年にISPOR（国際医薬経済・アウトカム研究学会）のタスクフォースがCHEERS声明を出しているが、本論文は、JAMA（米国医師会雑誌）による費用効果分析の手法と報告に関する第２次勧告である。レファレンス・ケースに社会的視点に加え、ヘルスケア部門（支払者に相当）の視点を正式に加えたことは、費用効果分析の欧州からの影響の大きさを窺わせる。前回勧告同様、費用効果分析の効果指標にQALYを用いることとされているが、評価する対象にとって適切な測定手法を用いること及び、生産性損失が状況によって費用と効果の二重計上を生じさせる可能性を指摘した上で、その除外に関する研究の発展を求めている。更に、介入の機会費用の検討、疾患によるQALYの重みの違いに関する課題についてにとどまらず、将来の研究の鍵となる領域として、多基準意思決定分析（MCDA）の利用、イノベーションの動機付けと費用効果分析の関係性の課題にも言及している。本稿の勧告は、費用効果分析の報告のために参照する単なる勧告にとどまらず、アメリカにおける費用効果分析における課題の研究活性化に、一石を投じると考える。（MH）

＜2016年9月　文献紹介＞

ノルウェーにおける世界保健機関障害評価票の身体的リハビリテーションに特化した妥当性検証

Moen VP, et al.: Validation of World Health Organization Assessment Schedule 2.0 in specialized somatic rehabilitation services in Norway. Qual Life Res 2016; Aug 9. [Epub ahead of print]

WHO障害評価票WHODAS2.0は、6領域（認知・可動性・セルフケア・人との交わり・生活・参加）から障害を評価する包括的な尺度である。この研究は、身体的なリハビリテーションを受けている患者を対象にWHODAS 2.0（ノルウェー版）の信頼性、構成概念妥当性、反応性を検証することにより、モニタリングツールとしての可能性を調べることを目的とした。
再現性信頼性は、ランダムに選ばれたサンプルの級内相関係数（ICC）を用いて、内的一貫性信頼性は、Cronbachのアルファを用いて評価された。構成概念妥当性は、WHODAS 2.0と包括的健康関連QOL尺度であるSF-36との相関分析と、仮定された構造に対する確証的因子分析（CFA）の適合度によって評価された。反応性は、ランダムに選ばれた別のサンプルで、事前に設定された仮説を検証することによって評価された。
970人の身体的リハビリテーション患者が研究対象となった。そのうち、再現性は53人、反応性は104人の患者で評価された。 WHODAS 2.0のICCは、各領域0.63～0.84、総得点0.87であった。Cronbachアルファは、各領域0.75～0.94、総得点0.93であった。構成概念妥当性は、事前に設定した12の相関関係のうち6つが確認された。CFAの適合度は十分ではなかった。反応性の検証では、8つの仮説のうちの3つが確認された。
WHODAS 2.0ノルウェー版は、身体的リハビリテーション患者において十分な信頼性を示したが、妥当性は中程度であり、反応性に関しては限界がある可能性が示された。

WHODAS 2.0は、国際障害分類ICFのモデルが示す「活動と参加」の概念を測定することを目的に、世界保健機関（WHO）が開発した尺度である。自己記入版、面接版、36項目版、12項目版などが用意されている。ICFの概念を反映した尺度は少なく、障害の総合的理解や介入のモニタリングに使用可能な尺度として期待される尺度である。日本語版はすでに開発が終了し（Tazaki M, et al. 2014）日本語のマニュアルも昨年刊行された。本論文はノルウェー版を身体的リハビリのモニタリングに使用可能かどうかを検証しようとした研究の結果である。信頼性は高いものの、妥当性は中等度、反応性は低度であり、観測できた変化量は測定誤差に満たないものであった。また、並行して測定した包括的健康関連QOL尺度であるSF-36よりも反応性が低かった。妥当性と反応性の低さは他言語でも報告されており、現段階ではモニタリングツールとしての使用には限界があることが述べられている。日本のデータでは要介護度と高い相関が報告されている。本邦でのさらなる研究結果を待ちたい。（SY）

＜2016年8月　文献紹介＞

アルツハイマー病患者の良くない健康状態の自己評価はナーシングホームへの入居や死亡のリスクを高めない

Nielsen AB, et al. Poor self-rated health did not increase risk of permanent nursing placement or mortality in people with mild Alzheimer’s disease. BMC Geriatr. 2016; 16:87.

背景：健康状態の自己評価は多くの住民を対象とした研究で用いられており、例えば、病気の罹患率、ナーシングホームへの入居、死亡率といった良くない方の健康のアウトカムを予測する。しかしながら、高齢者におけるナーシングホームへの入居や死亡率を予測するための健康状態の自己評価には一貫性がない。これは認知障害によるものかもしれない。健康状態の自己評価の項目は広く用いられており、その評価が認知障害をもつ人々における異なった予測価値を持つかどうかについて知ることは重要である。われわれは軽度のアルツハイマー病患者を対象に健康状態の自己評価と終身のナーシングホームへの入居のリスク、死亡率の関係を調べることを目的とした。
方法：データはThe Danish Alzheimer Intervention Study（DAISY）という、3年間にわたる軽度のアルツハイマー病患者とその介護者への心理社会的な介入の大規模ランダム化比較試験からのものである。デンマークにある14の郡のうちの5つの郡が参加し、2004年と2005年に在宅で生活する軽度のアルツハイマー病（男性46.4％）の321人（平均年齢76.2歳）の高齢者が登録された。健康状態の自己評価に加え、認知機能（MMSE）、QOL（代理人評価のQOL-AD）、ADL（ADCS-ADL）、自己洞察、社会人口学的特性をベースライン時点で調べた。合併症とナーシングホームへの入居、死亡率については、登録から3年間のフォローアップで観察した。 Cox比例ハザード回帰分析を用いて、健康状態の自己評価（“とても良い”、“良くない”の2つに分類した）と、ナーシングホームへの入居、潜在的な交絡因子を調整した死亡率との関係を分析した。
結果：ベースラインでは自身の健康状態について、66％が“最高に良い”、“とても良い”と回答し、34％が“良い”、“あまり良くない”、“良くない”と回答した。 MMSEの平均は24.0（範囲20-30）であった。ナーシングホームへの入居と死亡の3年間のフォローアップ時点での割合はそれぞれ28.1％，16.5％であった。ベースライン時点で健康状態を“良くない”と自己評価したこととナーシングホームへの入居および死亡する割合の増加には多変量解析の結果、関連は認められなかった。ハザードレシオは完全に調整されたモデルで、それぞれ0.63と1.28であった．
結論：自己評価が良くない健康状態であっても、ナーシングホームへの入居や死亡のリスクを高めるわけではないことが明らかとなった。健康状態の自己評価は臨床現場や疫学研究において広く用いられる指標であるが、自己洞察の低下したアルツハイマー病患者においては、健康状態を示す有効な指標とはなりえないかもしれない。

これまでも、アルツハイマー病など認知症患者に対する本人評価と代理人評価の一致度や妥当性を調べた研究は多い。本論はDAISYと呼ばれる多施設のRCTの一部であり、単に本人回答と代理人回答の比較を行ったものではなく、ナーシングホームへの入居や死亡率といった3年後のアウトカムとの比較という点で新鮮味がある。また、アルツハイマー病患者はMMSEの平均が24点と軽度である点も興味深い。質問自体はSF-36の設問を利用したものであるが、結果として、本人による健康状態の評価は3年後のアウトカムを予測できなかった。筆者らはアルツハイマー病患者の自己洞察の障害（anosognosia）にその原因を求めているが、設問自体を理解できないことや選択肢の比較が難しいといった要因もあるかもしれない。いずれにしても、重症度が軽度であってもアルツハイマー病の診断がある対象者については、その健康状態、あるいは健康関連QOLの自己評価をそのまま他の研究や政策へ引用することには慎重にすべきである。とくに，資源配分を考える上では、代理人回答を尊重すべきであることを示唆している。本論の筆者らは，このDAISYでEQ-5D-5Lを用いた評価も実施しているようなので、その報告も確認してみたい。（NS）

＜2016年7月　文献紹介＞

進行性転移乳がんの健康関連QOL：ランダム化比較試験の方法論的・臨床的課題

Ghislain I, et al. Health-related quality of life in locally advanced and metastatic breast cancer: methodological and clinical issues in randomised controlled trials. Lancet Oncol. 2016 Jul;17(7):e294-304. doi: 10.1016/S1470-2045(16)30099-7.

背景：転移乳がんの治癒は困難であるため、治療の目的は生存期間の延長と、QoLの維持・改善である。このため、臨床試験では伝統的な評価項目（無増悪生存期間や全生存期間）に加えて、健康関連QOL（HRQoL）が評価されるようになった。 2002年、BottomleyとTherasseは、進行乳がんのランダム化比較試験におけるHRQoL評価のシステマティックレビューを報告し、以下を推奨した (Lancet Oncol 2002)。
・HRQoL評価の仮説，臨床課題を明確にすること
・適切な尺度を選択すること
・高いコンプライアンスが保たれること
・バイアスを最小とするため、適切な統計解析が計画されていること
・結果の解釈では、臨床的な意義が考慮されていること
本レビューでは、2001年から2014年に報告された転移乳がんのランダム化比較試験において、HRQoL評価方法が、前述した推奨にどの程度準拠しているかを検討した。
方法：システマティックレビュー
結果：49のランダム化比較試験が同定された。
・HRQoL評価の仮説が明記されていたのは、10試験（21%）のみだった。
・46%の試験でEORTC QLQ-C30（BR23使用試験を含む）が、40%の試験でFACT-Bが使用されていた。ヨーロッパの多施設共同試験ではEORTC QLQ-C30が、北アメリカ諸国ではFACT-Bが使用されることが多かった。尺度のvalidation studyを引用している研究は77%であった。
・ベースラインのコンプライアンスが報告されていた研究は66%であった。
・HRQoLの相違の臨床的意味付けについて言及されている研究は49%であった。
考察と結語：転移乳がんのランダム化比較試験において、HRQoLを評価項目とする研究は増加しており、より特異的な尺度選択が実施されるようになっている。欠測扱い、結果の解釈に関する臨床的意味付けについても、改善が認められる。しかし、HRQoL評価の目的や仮説が明記された研究が未だ少ない。また、臨床的な意味付けでなく、統計学的有意差を過剰に強調している研究も依然としてある。

比較臨床試験におけるHRQoL/PRO評価に関して，ガイドラインの確立と準拠の方向性は避けられず，注視する必要がある。（TN）

＜2016年6月　文献紹介＞

高次モデルの再現と妥当性確認によりEORTC QLQ-C30のサマリースコアがロバストであることが明らかになった

Giesinger JM, Kieffer JM, Fayers PM, et al. Replication and validation of higher order models demonstrated that a summary score for the EORTC QLQ-C30 is robust. J Clin Epidemiol. 2016;69:79-88.

目的：サマリースコアを作成するために、European Organisation for Research and Treatment of Cancer (EORTC) Quality of Life Questionnaire Core 30 (QLQ-C30)のより高次の測定構造を評価する。 研究デザインとセッティング：過去に評価された7つの高次モデルを検討するために、治療前のQLQ-C30データ(N=3,282)を用いて、検証的因子分析を実施した。もっともよい高次モデルによるサマリースコアと、腫瘍ステージ、performance statusと経時的変化(N=244)をグループ化変数(=独立変数)として用いたオリジナルのQLQ-C30スケールスコアと比較した。結果：すべてのモデルが受け入れ可能な程度の適合を示したが、単純化のために、単一の高次因子モデルから得られるサマリースコアを用いて既知グループにおける妥当性や反応性の解析を続けた。このQLQ-C30のサマリースコアの妥当性や反応性は、オリジナルのQLQ-C30スケールスコアと同等か、多くの場合は優れていた。結論：我々の結果は、単一のサマリースコアを計算するQLQ-C30の測定モデルについて、実証的に支持するものである。サマリースコアが利用可能であれば、質問票によって生じる15のアウトカムに基づく比較をする際に、多重検定による潜在的なタイプIエラー増加の問題を避けることができる。また、全体のサマリースコアが関連する主要評価項目である場合に、QLQ-C30を用いた健康関連QOL研究においてサンプルサイズを減少させるかもしれない。

EORTC QLQ-C30はFunctional Assessment of Cancer Therapy(FACT)とならび代表的な癌特異的健康関連QOL尺度である。全般的QOL 2項目、機能 15項目 (サブスケールとして、身体 5項目、役割 2項目、認知 2項目、感情 4項目、社会 2項目)、症状13項目 (サブスケールとして、疲労 3項目、嘔気・嘔吐 2項目、痛み 2項目、息苦しさ 1項目、不眠 1項目、食欲不振 1項目、便秘 1項目、下痢 1項目、経済的影響 1項目)の計30項目からなる。今までは全般的QOLと、5つの機能サブスケール、9つの症状サブスケールの計15スケールそれぞれにおいてスコアが算出されていたが、EORTCによれば全般的QOLと経済的影響を除く13サブスケールから1つのサマリースコアを算出することができるようになった。本論文はEORTCグループのメンバーによりその根拠となるデータについてまとめられたものである。サマリースコアの算出方法は下記参照(*)であるが、基本的には13のサブスケールのスコアを平均することにより得る。ただし、特に症状スケールにおいては1項目しかないサブスケールも多い中で、すべてのスケールを同じ重みで足しあわせることが適切であるかは議論のあるところだろう。実際にサブスケールでなく各質問項目を同じ重みとして取り扱う方法も過去には提案されている(Hinz et al. Eur J Cancer Care 2012;21:677-83)。また、全般的QOLとサマリースコアの関係性(例えば、両者で結果が異なるときはどのように解釈すればよいのだろうか?)についても気になるところである。サマリースコアの統計的有意差のみの議論ばかりに焦点が当たることは問題だろうが、一方でサマリースコアにより結果の解釈が容易になることも事実である。今後は使用経験を蓄積していくことにより、様々な局面におけるサマリースコアの妥当性について検討していく必要があるのだろう。 (*)http://groups.eortc.be/qol/sites/default/files/img/scoring_of_the_qlq-c30_summary_score.pdf （ST）

＜2016年6月　文献紹介＞

医療意思決定のための多基準意思決定分析－新たな実践基準：ISPOR MCDA 実践基準開発作業部会第二報

Marsh K, et al. Multiple Criteria Decision Analysis for Health Care Decision Making-Emerging Good Practices: Report 2 of the ISPOR MCDA Emerging Good Practices Task Force. Value Health 2016; 19(2):125-37

医療意思決定は複雑で、複数の競合する目的の間のトレードオフにしばしば直面する。複数の基準を含む構造化された明確なアプローチを使うと、意思決定の質を改善できる。多基準決定分析（MCDA）として知られる一連の技術はこの目的に有用である。2014年に国際医薬経済・アウトカム研究学会(ISPOR)はMCDA実践基準開発作業部会を設立した。その第一報では、MCDAを定義し、医療におけるその使用例を示し、重要なステップを説明、そして、MCDAの主たる方法の概観を示した。本論文（第二報）は、医療意思決定を支援するための、MCDAの実施についての実践基準を提供する。第二報は、デザイン、実施、批評を支援するためのチェックリスト；チェックリストの実施を支援するためのガイダンス；実施されるべきステップの順番；予算制約をMCDAに組み込む方法の説明；MCDAの実施に必要な手技、入手可能なソフトウェアを含む資源の概観の提供；今後の研究の方針を内容とする。

以前に紹介された第一報に引き続く形で公表されたものである。複雑な意思決定問題について、評価と意思決定支援の手法としてMCDAを活用する利点は、意思決定支援のための評価において、対象を多角的に捉え、多様さ、複雑さ、不確実性など、空間的にも時間的にも広範に影響が及ぶ可能性や、公平性、倫理性などの問題が生じることも考慮に入れつつ、評価の包括的な枠組みを示すことができることである。多くの要素を取り入れる分、要求は多くなるが、MCDAによる評価の利点を生かすには、構成するプロセスの正当性あるいは合理性をどのように担保していくかは重要な課題である。第二報では主に、MCDAの重要なステップに付随して、妥当性、正当性、報告といったチェック項目が示され、解説されており、MCDAを利用する際の考慮すべき点を提供している。しかし、意思決定においてMCDAを利用すること自体の評価や、不確実性や予算制約への対処方法などの課題も残されており、さらなる研究が求められる。（FM、SK）

＜2016年5月　文献紹介＞

PROMISを臨床にもたらす：通院がん患者における簡便かつ正確な症状スクリーニング

Wagner LI et al: Bringing PROMIS to practice: Brief and precise symptom screening in ambulatory cancer care. Cancer. 121(6): 927–934. 2015

背景：がん支持療法は、簡潔で妥当性のある電子PRO(ePRO)評価を、電子カルテ（HER）および臨床医の日常診療に組み込むことでより良いものになる可能性がある。方法：婦人科がんの通院治療中の636人の女性に、Epic MyChart, 患者コミュニケーション電子カルテポータルを用いて、症状アセスメントを行うように指示をした。 PROMISコンピュータ適応型テスト (CATs)は、倦怠感、疼痛障害、身体機能、抑うつ、および不安を評価するために用いられた。チェックリストは、心理的問題、情報ニーズ、栄養ニーズ、および不十分な栄養によるリスクファクターを識別した。重症閾値を記したPROMIS　Tスコアを含む結果のアセスメントは、電子カルテ上に即座に集計された。医師は、電子カルテのメッセージにより、臨床的に増加した症状を知ることができた。電子カルテの統合は、心理社会的問題にはソーシャルワーカーを、情報に対しては、健康教育家を、栄養に関連する問題には、栄養士を自動的に割り当てることが出来るようにデザインされた。結果：送付された4,042通のMyChartメッセージの内、3,203(79%)通は患者によって閲覧されていた。アセスメントは1,490(37％)の患者により開始され、いったん始めるとそのうちの93％(1,386人)が最後まで評価していた。初回のアセスメントだけを用いれば、MyChartメッセージを閲覧した患者のうち、49.8％がアセスメントを全て記入していた。平均PROMIS CAT T-スコアは、一般人に比べ、身体機能の低下と、不安の増加を示していた。倦怠感、疼痛、および抑うつスコアは、一般人と比べて同等であった。身体機能の障害は、最も多い基本的アラートであり、全患者の4％に見られた。結論：我々は、PROMIS-CATを通院がん患者に対する日常的ケアにおいて、よく見られるがんの症状を測定するために用いた。これを電子カルテ上に素早く統合することで、症状報告を心理社会的、支持的ケアへの照会のベースとして用いることが出来るようになった。

PRO(Patient Reported Outcome)の重要性は、本研究会の名称にもそれが冠されていることからも分かるように、本邦でもその認識が高まっている。これを電子化したePROの取り組みも、米国を中心に近年非常に盛んになっている。しかし、この論文によるとこれまで、PRO収集手法として電子的なものを用いたとしても、それを上手く臨床につなぐことが出来なかったことが問題であり、今回は、項目反応理論を利用したコンピュータ適応型テスト (CATs)を日常の電子カルテシステムに統合することで、その利便性向上を図ったとのことである。具体的には、これまでのePROは、単一項目別の報告の形となり、それが非常に冗長であることから、実際の臨床に役立たなかったものを、NIHが開発したPROMIS(Patient Reported Outcomes Measurement Information System)というシステムを電子カルテと統合することで、改善を図ったというレポートである。筆者らによれば、そうした試みは世界初とのことであるが、そうなのかもしれない。がん診療の質の要素の一つとしてのPROの統合化は、ICTの医療への活用と共に、がん患者からのデータをリアルタイムで解析することを可能にする（「ラーニング・ヘルスケアシステム」）ものとして、その重要性が強調されており、最近はIOM(米国医療研究書)の「質の高いがん診療」報告書にも取り上げられている。リアルタイムに解析されたPROは、PROMISのTスコア(偏差値のようなもの)に基づき、その重症度別にふるい分けられ、重症のものは、医師に対して、電子カルテ上でアラート表示がされる。また項目により、社会心理的課題はソーシャルワーカーに、栄養の問題は栄養士にと自動的に振り分ける仕組みも含まれている。抄録中のMyChartというのが患者用ポータルであり、そこにPROMISに答えてほしいというメールを表示することで、PROを得ているが、回答率は30％強と他のePROと比較して低いことが課題である。ただ他のePROはその場での記入を求めているが、今回のシステムは外来診療システムに組み込まれていることで、このような低い回答率になっている一方で、患者とのコミュニケーションに資するというメリットも大きいそうである。本文中の結論にもあるように、このシステムにより情報の「トリアージ」が可能になり、正確で有用で、揺らがない(robust)、がんの症状の評価システムを確立したとのことであるが、そのトリアージのアルゴリズムの妥当性の検証は今後の課題である。評者の感想では、トリアージの利便性に偏りすぎており、かなり粗いアルゴリズムのような気がしている。（SS）

＜2016年4月　文献紹介＞

選好に基づく尺度の日本人標準値：EQ-5D-3L、EQ-5D-5L、SF-6D

Shiroiwa T, et al. Japanese population norms for preference-based measures:EQ-5D-3L, EQ-5D-5L, and SF-6D. Qual Life Res 2016; 25:707–719. DOI 10.1007/s11136-015-1108-2

選好に基づく日本語版尺度のEQ-5D-3L、EQ-5D-5L、SF-6Dを用いて日本において初めて全国調査された研究で、一般の人々における「QOL scores」（効用値）と社会人口統計学的背景との関係性が検討されている。対象は、2013年時点で8地域の住民基本台帳から無作為に抽出された成人1143人から回答を得ている。健康状態をEQ-5D-3L、EQ-5D-5L、SF-6Dから得たれた回答を日本語版のタリフから効用値に換算した健康状態と、主観的な疾患・症状および社会的要因が検討されている。社会人口統計学的要因は、地方別、収入、婚姻状況、教育暦別割合、効用値と社会人口統計学的要因および主観的健康状態との関係性について検討された。効用値が有意に低かったのは、EQよりSF-6Dが、60歳以上、低所得者、学歴の低さであった。健康状態は、3L、5L、SF-6Dの順で悪かった。最後に、健康な状態と疾患・症状のグループに分けて、Minimal Important Difference (MID) が0.05-0.1と提示された。

選好に基づく尺度（効用型尺度・インデックス型尺度）であるEQ-5D-3L、EQ-5D-5L、SF-6Dは主に医療経済評価の研究に用いられる。 EQ-5D-5Lの効用値換算表（タリフ）が2016年4月現在で公表されているのは、英国、日本、カナダ、ウルグアイ、オランダ、韓国である。 EQ-5D-3Lでは5項目を3段階で記述していたがEQ-5D-5Lでは同じ5項目が5段階で記述され、訳語もEuroQolの承認を得て工夫したことで天井効果の一部を改善し、より一般の人々の現実社会を反映する尺度としての活用が期待されている。それ故に、いち早くEQ-5D-5L日本語版を用いた本研究論文を紹介することとした。今後の活用が期待されるが故ではあるが、グループ間のMIDの算出方法と、回答者本人ではなく一般の人々によって作成される効用値（utility scores）が「QOL値（QOL scores）」と表されていることについて、QOL/PRO（patient reported outcome）研究に携わる研究者のさらなる議論を待ちたい。（MK）

＜2016年3月　文献紹介＞

頭頚部扁平上皮癌の治療選択にかかわる評価指標としてのQOL

Licitra L, Mesía R, Keilholz U. Individualised quality of life as a measure to guide treatment choices in squamous cell carcinoma of the head and neck. Oral Oncol. 2016; 52:18-23. doi: 10.1016/j.oraloncology.2015.10.020.

進行した頭頚部扁平上皮癌の患者に対して、積極的な治療は効果的である一方で、健康関連QOLに著しく影響を与える可能性がある。とりわけ、嚥下、呼吸、会話などの機能面への障害が示唆される。基本的機能や社交面に影響を受ける患者に対して、長期間の精神的社会的なサポートが必要と考えられる。頭頚部扁平上皮癌患者を対象とした無作為化比較試験において、健康関連QOLは日常的に評価されていない。また、様々な評価ツールが使用可能でありながら、日常生活において患者が重要と考える評価指標を用いたデータは、臨床家に利用されていない。加えて、臨床試験以外での健康関連QOL評価も少ない。個別化医療の時代において、治療や経過観察中の個々のQOL評価は重要な意味を持つ。 QOLを考慮することで、臨床アウトカムや生存の質の意味ある改善につながる、適切な治療方法を選択することが可能となる。上記の背景をふまえて、本総説は、がん患者のQOL評価尺度および頭頚部扁平上皮癌患者を対象とした健康関連QOLに関する最近の研究報告を概説する。

頭頚部扁平上皮癌患者の健康関連QOLに関する総説である。がん研究に使用されるQOL尺度としては、EORTC QLQやFACTに加えて”Beck Depression Inventory (BDI)”や”Cancer Needs Questionnaire (CNQ)”など、14尺度が紹介されている。さらに、頭頚部扁平上皮癌患者のQOL評価に用いられる指標として、”MD Anderson Dysphagia Inventory (MDADI)”やUW-QOLなど、6尺度を取り上げている。 EORTC QLQやFACTなどを用いた8編の論文（PhaseⅢ study 6編、その他2編）が概説されており、治療選択時（治療中含む）にQOLを考慮する重要性について、文献を引用しながら考察が加えられている。系統的な総説ではないが、頭頚部癌患者のQOL評価に関して基本情報を得るには良い論文と思われる。 “Patient-Reported Outcomes Measurement Information System (PROMIS)”やSEIQoL-DWについても触れられており、ひとつひとつの情報量は限られているものの、幅広い内容が盛り込まれている。(NM)

＜2016年2月　文献紹介＞

医療意思決定のための多基準意思決定分析－序論：ISPOR MCDA 実践基準開発作業部会第一報

Thokala P, et al. Multiple criteria decision analysis for health care decision making – an introduction: report 1 of the ISPOR MCDA Emerging Good Practices Task Force. Value Health 2015; 19:1-13

医療決定は複雑で、複数の競合する目的の間のトレードオフにしばしば直面する。複数の基準を含む構造化された明確なアプローチを使うと、意思決定の質を改善できる。多基準決定分析（MCDA）として知られる一連の技術はこの目的に有用である。MCDAはすでに他の分野で広く使われているが、最近医療分野での応用が増加しつつある。 2014年に国際医薬経済・アウトカム研究学会(ISPOR)はMCDA実践基準開発作業部会を設立した。そこでは、医療決断におけるMCDAの共通の定義の確立と、医療決断を支援するMCDAの実践基準ガイドラインの開発が課せられている。本論文は、ISPOR MCDA作業部会の最初の報告であり、MCDAの序論を提供する。すなわちMCDAを定義し、様々な種類の医療における決断（利益・危険分析、医療技術評価、資源配分、ポートフォリオ決断分析、患者－医師協同決断、そして患者のサービスへのアクセスの優先順位付け、などを含む）の例と、MCDAの主たる方法の概観と重要なステップを説明する。この報告の吟味により、読者はMCDAの手法の中身と、その医療決断支援能力を把握できるに違いない。

医療政策や医療現場の意思決定において、健康アウトカムを含む異なる性質の情報を統合し、処理する需要が近年増えつつある。 MCDAが解決策の一つとして注目されており本論文を紹介した。 MCDAは元々、オペレーションズ・リサーチを起源とする方法論的アプローチであり、公的機関、教育、投資、環境、エネルギー、防衛分野などの意思決定に広く応用されてきたが、医療分野での応用は稀であった。 MCDAは、従来のステークホルダーによる単なる合意形成と比して、意思決定の説明責任や透明性の確保の観点で優れている。実践例としては、タイでは2009年から2年間、健康介入と技術評価プログラムに試行的に使われ、イタリアのロンバルディア州では2011年以来、医療技術の導入と、供給リストからの除外の判断に使われているとされる。 MCDAは技術的には主に階層分析法(AHP)と離散選択法(DCE)が使われており、８つのステップで行われる。すなわち、①課題の特定、②基準の選択、③成績の測定、④選択肢の得点化、⑤重み付けの基準、⑥総得点の計算、⑦不確実性の扱い、⑧所見の報告と精査、である。第二報では、より詳しく、手法の選択と実践基準ガイドラインのチェックリストや推奨が報告される予定である。(SK)

＜2016年1月　文献紹介＞

リハビリテーション中の脳卒中患者におけるEQ-5D-5Lの妥当性、反応性、最少重要差

Chen P, et al.: Validity, responsiveness, and minimal clinically important difference of EQ-5D-5L in stroke patients undergoing rehabilitation. Qual Life Res 2015; [Epub ahead of print].

【目的】脳卒中後にリハビリテーションを受けている患者において、EQ-5Dの5領域尺度（EQ-Index）とVAS（EQ-VAS）の基準関連妥当性、反応性、最小臨床重要差（MCID）を調べることを目的とした。【方法】脳卒中患者65名に、EQ-5D-5Lと4つの基準尺度（筋力：Medical Research Councils尺度、上肢機能：フューゲル-マイヤー指標、ADL：FIM、脳卒中特異的QOL：SIS）を、治療前と治療3～4週間後に実施した。基準関連妥当性は、スピアマン相関係数を使って推定した。反応性は効果量、標準化反応平均（SRM）、反応性基準によって分析した。MCIDは、アンカー・ベース法(AB)とディストリビューション・ベース法(DB)で測定した。MCIDを上回った患者の割合も算出した。【結果】EQ-Indexの表面的妥当性は、EQ-VASよりも良かった。EQ-Indexは、上肢機能尺度よりも日常生活活動の予後をよりよく予測した。 EQ-Indexは変化に適度に敏感（SRM = 0.63）であったが、EQ-VASは変化にあまり敏感でなかった。 EQ-IndexのMCID（括弧内はMCIDを上回った患者割合）は、AB・DBともに0.10（33.8%）であった。 EQ-VASはABでは8.61（41.5%）とDBでは10.82（32.3%）であった。【結論】EQインデックスは、リハビリテーション中の脳卒中患者の健康関連QOLを測定において十分な表面的妥当性、限定された予測的妥当性、許容可能な反応性を示したが、EQ-VASがそうではなかった。今後は、脳卒中後の異なる回復ステージを考慮した研究によって、本結果を確認する必要がある。

EQ-5Dは効用値を測定する尺度であり、治療介入のアウトカムとして患者の臨床的状態を把握するのには不適切であるとの意見がある一方で、脳卒中後の患者など質問紙への回答に困難さを抱える疾患の分野では、その簡便さゆえ、臨床把握の目的でも使用されているのが現状である。本研究は、３Lから５LになったEQ-5Dをこの分野において使用する妥当性を検証しようとしたものである。基準尺度として用いた4つの尺度は筋力・上肢機能・ADL・主観的QOLとさまざまであり、妥当性の基準として適切であったかどうか、疑問が残る。また、術前のEQ-5Dで術後のADLを予測することで予測的妥当性を検討しているが、その仮説も適当であったかどうかが疑問である。サンプル数も少ないことから、著者らも述べているように、脳卒中分野でのEQ-5Dの有用性についてはさらなる検証が求められる。（SY）

新着文献

文献紹介:2016年

＜2016年12月 文献紹介＞

MIDを中央にしない：平均への回帰は最小重要差の推定を縮小する

コメント

＜2016年11月 文献紹介＞

一般的な腰痛に対する理学療法の効果はどの程度か？ 4597患者の多変量解析

コメント

＜2016年10月 文献紹介＞

費用効果分析の実施、方法論的実践及び報告に関する勧告－第２次「医療の費用対効果に関する委員会」－

コメント

＜2016年9月 文献紹介＞

ノルウェーにおける世界保健機関障害評価票の身体的リハビリテーションに特化した妥当性検証

コメント

＜2016年8月 文献紹介＞

アルツハイマー病患者の良くない健康状態の自己評価はナーシングホームへの入居や死亡のリスクを高めない

コメント

＜2016年7月 文献紹介＞

進行性転移乳がんの健康関連QOL：ランダム化比較試験の方法論的・臨床的課題

コメント

＜2016年6月 文献紹介＞

高次モデルの再現と妥当性確認によりEORTC QLQ-C30のサマリースコアがロバストであることが明らかになった

コメント

＜2016年6月 文献紹介＞

医療意思決定のための多基準意思決定分析－新たな実践基準：ISPOR MCDA 実践基準開発作業部会第二報

コメント

＜2016年5月 文献紹介＞

PROMISを臨床にもたらす：通院がん患者における簡便かつ正確な症状スクリーニング

コメント

＜2016年4月 文献紹介＞

選好に基づく尺度の日本人標準値：EQ-5D-3L、EQ-5D-5L、SF-6D

コメント

＜2016年3月 文献紹介＞

頭頚部扁平上皮癌の治療選択にかかわる評価指標としてのQOL

コメント

＜2016年2月 文献紹介＞

医療意思決定のための多基準意思決定分析－序論：ISPOR MCDA 実践基準開発作業部会第一報

コメント

＜2016年1月 文献紹介＞

リハビリテーション中の脳卒中患者におけるEQ-5D-5Lの妥当性、反応性、最少重要差

コメント

＜2016年12月　文献紹介＞

＜2016年11月　文献紹介＞

一般的な腰痛に対する理学療法の効果はどの程度か？　4597患者の多変量解析

＜2016年10月　文献紹介＞

＜2016年9月　文献紹介＞

＜2016年8月　文献紹介＞

＜2016年7月　文献紹介＞

＜2016年6月　文献紹介＞

＜2016年6月　文献紹介＞

＜2016年5月　文献紹介＞

＜2016年4月　文献紹介＞

＜2016年3月　文献紹介＞

＜2016年2月　文献紹介＞

＜2016年1月　文献紹介＞