今日、医用画像(CT, MRI, PET,シンチグラフィー, Echo, OCT,写真等々)を用いた計量値、計数値の測定は、日常診療、臨床研究、医薬品・医療機器の開発等、様々な状況において頻繁に利用されています。
医用画像を使った測定は、他の測定(認知機能検査、血液学的検査、血液生化学的検査、尿検査など)と同様に、1つまたは複数の測定結果の組み合わせを利用して次のような評価を行います。
・測定対象の状態
・特定時点間の測定対象の状態の変化
・測定結果間の関連
測定は計量的な分析には欠かせない行為ですが、得られる値(以下「測定値」)には常に測定誤差が含まれるため、測定を行う際には適切な管理が必要です。
本記事では、臨床研究、医薬品・医療機器の開発等において利用されているImaging CoreLabでの医用画像を用いた測定の管理を念頭に、「測定の管理:パフォーマンス評価の概要」について解説しています。医用画像を用いた測定を利用する臨床研究や医薬品・医療機器の開発の際にすこしでも参考になれば幸いです。
この記事から得られること
・測定の管理についての基礎知識
測定のパフォーマンス評価に用いる用語の定義
本記事ではISO/TS 16949:2009, ISO 5725:1994,JIS Z 8402-1:1999, QIBATechnical Performance Working Group (RSNA)の論文等を参考(参考[1,2,3,4])に、測定のパフォーマンス評価に関して、表1に示す用語を使用します。
「測定」とは、「測定対象」に対して「測定値」を付与するための行為です。この測定は、「測定対象」「測定法」「測定機器」「測定環境」「測定担当者」からなる「測定システム」によって実施されます。
測定のパフォーマンスは、「測定値の期待値」と「参照値」との一致の度合いである「真度」と、測定値間の変動の幅である「精度」によってそれぞれ評価することができます。「真度」は、「偏り」「安定性」「直線性」の観点から評価し、「精度」は「繰り返し性」と「再現性」の観点から評価することができます。
表.1 本記事における用語の定義
用語 | 定義 |
---|---|
測定 | 「測定」とは、ある単位量との比較をもとに、測定対象量を数値と単位によってあらわす作業的な行為を指す |
測定システム | 「測定」を実施するために必要な、総体、「測定対象」「測定法・測定手順」「測定機器」「測定環境」「測定担当者」を指す |
測定値 | 「測定」によって表さられる値 |
真値 | 「測定」しようとする量の真の値 |
参照値 | 「測定」しようとする量の真の値として受け入れ可能な値。「真値」が概念上の定義であるとの考えの下、混乱を避けるため測定の比較対象として使用される実際の値は「参照値」と称する |
真度(正確さ) | 無限回の反復測定によって得られる測定値の平均と参照値との一致の度合い(偏りの大きさ) |
偏り | 測定値の平均値と参照値との差 |
安定性 | 指定された条件下で、同じ対象について、経時的に繰り返し測定したときの、測定値の傾向の変化 ドリフトとも称する |
直線性 | 測定値の測定範囲全体にわたる偏りの変化 |
精度(精密さ) | 指定された条件下で、同じ対象について、反復測定によって得られる測定値の間の一致の度合い(変動の幅) |
繰り返し性 | 完全に同一の条件下において、同じ対象について、反復測定によって得られる測定値の一致の度合い(変動の幅) |
再現性 | 一部異なる条件(測定者の違い、測定時期の違い、ソフトウェアの違い等)下において、同じ対象について、反復測定によって得られる測定値の一致の度合い(変動の幅) |
精確さ | 真度(正確さ)と精度(精密さ)を統合した概念 |
測定誤差 | 真値と測定値の差 |
医用画像を用いた測定の管理の特徴
図1には、被験者から医用画像を取得し、それを用いて測定を行う流れが示されています。医用画像を用いた測定では、尿や血液検体を対象とする測定と比較して、測定対象である医用画像を取得する際の機器の違いによるばらつきが大きいことが知られています。
医用画像を用いた測定の管理では、他の測定と同様に測定誤差の低減が重要ですが、さらに画像取得時の条件を必要に応じて管理することも重要だと分かります。
図.1 医用画像の取得から医用画像を用いた測定までの流れ
測定誤差の影響
Lokenら(2017)(参考[5])によると、測定誤差が大きい場合(測定の精度が低い場合)、測定誤差は統計的検定の結果に以下のような影響を与えると述べられています。
- サンプルサイズが十分に大きい場合: 「効果が存在する」ことが真である場合、測定誤差は効果を減衰させる。
- サンプルサイズが小さいか中程度である場合: 「効果が存在する」もしくは「効果が存在しない」いずれが真の場合でも、測定誤差により相対する結果を支持する結果が出てしまうことがある。
サンプルサイズが大きい場合の測定誤差による効果の減衰は、「測定誤差による必要症例数の増大」として一般的に知られている一方で、サンプルサイズが小さいか中程度である場合の測定誤差による試験結果の信頼性の低下についてはあまり認識されていないかもしれません。
検証的な試験の測定においては、必要症例数を低減するために、また、探索的な試験の測定においては結果の信頼性を向上させるために、可能な限り測定誤差の低減を図るべきでしょう。
Imaging CoreLabでの医用画像を用いた測定のパフォーマンスの評価と管理
臨床研究、医薬品・医療機器の開発等においてImaging CoreLabが実施する測定は、過去の報告の実績から直線性が保証されたものを利用することが多く、また、研究によっては参照値が得られないことも多いため、精度および安定性のみがパフォーマンス評価の対象となることが多いようです。
Imaging CoreLab において測定系の高精度化を目的とする場合、以下のような手順を踏むことになります。
マニュアルの整備
- 「測定対象」の取得条件を限定する。
- 「測定機器」「測定環境」を特定し、一定とする。
- 測定の真度に影響を及ぼさない範囲で、「測定法・測定手順」を明確に規定する。
- 規定された「測定対象」「測定機器」「測定環境」「測定法・測定手順」「測定担当者」を明確化する。
規定内容の周知
- 「測定対象」の取得条件を撮像施設に周知する。
- 「測定担当者」に対して適切な教育を行う。
パフォーマンスの評価
- 測定系の「再現性」「繰り返し性」を確認する。
「再現性」「繰り返し性」を基にした測定法・測定手順の決定
- 「再現性」「繰り返し性」を検討し、必要に応じて[マニュアルの整備]~[パフォーマンスの評価]までを繰り返す。
- 各医用画像の測定回数と測定担当者の割り当てを規定する。
測定系の「再現性」「繰り返し性」を確認すると、それぞれの低下の原因となっている測定者を特定できることもあり、そのような場合には、測定系の改善の足掛かりを得ることができるかもしれません。
測定誤差の多くが「再現性」に由来する場合、測定を複数の測定担当者で手分けして行うと、誤差の増大の原因となります。そのため、各医用画像の測定回数・測定担当者の割付を考える際には、「再現性」及び「繰り返し性」の大きさは有力な判断材料となります。
また、マニュアルや教育による改善により測定者間の「再現性」「繰り返し性」に関しての変動を可能な限り低減させた後、さらに測定誤差を低減させたい場合には、各医用画像に複数の測定担当者を割付け、その代表値(平均値等)を利用することは測定系の誤差低減の手法として有効です。
同一医用画像に対する複数の測定担当者の割付によるメリット
同一医用画像に対して複数の測定担当者を割り付ける手法は、抗がん剤の開発の盲検下独立中央判定時の2 Primary Readers and Adjudicatorのように、一般的に利用されている測定方式です。この方式を利用する場合、各医用画像に一名の測定担当者が割り付けられる場合と比べて、以下の3点のメリットを得ることができます。
1) 繰り返し性に由来する測定誤差の低減
2) 計量値の測定においては測定者間差のモニタリングによる測定手順逸脱の検出、および逸脱した結果の再測定による測定誤差の低減
3) 測定対象全例における測定者間の再現性の指標の取得
このように同一医用画像に対して複数の測定担当者を割り付けることで、「精度の向上」および「実データにおける精度に関する情報の取得」が期待できます。
まとめ
Imaging CoreLabにおける医用画像を用いた測定の管理に関して、以下の項目を解説いたしました。
- パフォーマンス評価に用いる用語の定義
- 医用画像を用いた測定の管理の特徴
- 測定誤差の影響
- Imaging CoreLabでの医用画像を用いた測定のパフォーマンスの評価と管理
- 同一医用画像に対する複数の測定担当者の割付によるメリット
臨床研究、医薬品・医療機器の開発等において医用画像を用いた測定を実施する際には、必要に応じた品質管理(参考[6,7,8])による測定の真度・精度の確保が重要です。
マイクロンでは、「イメージング技術を活用し、医療分野の研究開発に寄与することで、人々の健康と医療の発展に貢献する」の理念のもと、様々な角度から支援しています。
医用画像を用いた測定を利用する臨床試験において、中央判定の支援業務、Imaging CoreLab 業務への適切な品質管理を提供することにより、妥当な試験結果の導出を助け、健康と医療の発展に貢献してまいります。
参考
[1] 平井 昭司 「入門講座 分析の信頼性を支えるもの 総論:分析の信頼性」ぶんせき 2010年1月号
[2] 一般社団法人 日本計量振興会他 「計量士および計測技術者のための 計量管理の基礎と応用」 コロナ社
[3] 岩波 好夫 「図解 ISO/TS 16949 コアツール できるFMEA・SPC・MSA」
[4] QIBA Technical Performance Working Group. “Quantitative Imaging Biomarkers: A Review of Statistical Methods for Technical Performance Assessment.” Stat Methods Med Res. 2015 Feb; 24(1): 27–67.
[5] Eric Loken & Rew Gelman. “Measurement error and the replication crisis.” Science. 2017 Feb;355(6325): 584-585
[6] Micron’s ViewPoint 第9号 「血管内イメージング分野における業務実績紹介」
[7] Micron’s ViewPoint 第12号 「中央判定の方法論とImaging CRO の役割:概論」
[8] Micron’s ViewPoint 第16号 「中央判定の方法論とImaging CROの役割:中央判定の種類」