電子カルテ情報からの自然言語処理によるレジストリーおよび臨床試験情報入力支援システムの基盤構築
研究概要
昨今の臨床医学においては、それまでに行われた研究の中から個々の患者さんの診療に必要な結果を見つけ、それに基づいて理にかなった診療を行うことが求められています。診療に役立つ研究結果を生み出すためには、数多くの患者さんから得られた臨床情報をまとめる研究が非常に大切であり、レジストリー研究や臨床試験はその中でも重要な研究手法です。研究で最も時間のかかるプロセスの一つに、患者さんの健康上の情報や臨床転帰(臨床的結果のこと)の情報収集があります。この作業は基本的に、医療従事者がカルテ情報を読み込んで行なっています。これを、数多くの患者さんから、そして数多くの項目で行う必要があります。このため、臨床研究における情報収集には多大な人的労力を要している現状があります。
近年AI(人工知能)がめざましく発達し、人が普段使っている言葉(自然言語)をかなり'理解'できるようになってきました。これを自然言語処理と言い、これを用いたものを大規模言語モデル(LLM: Large language model)と言います。本研究開発では、患者情報や臨床転帰の情報収集作業、あるいはその一部を、LLMが行うことができるシステムを構築し、患者情報抽出作業を効率化することを目指しています。
6つの国立高度専門医療研究センター(NC)で研究開発を行うことにより、幅広い医学分野で対応可能なシステム構築を目指していることが本研究開発の特徴です。6つのNCで既に情報収集された研究データを正解データとして利用し、電子カルテに記載されたテキストデータからLLMが'正解'の情報を取得できるシステム基盤の構築を目指します。
また、研究参加への同意を患者さんご自身が管理していただくためのシステム基盤構築として耐改ざん性の高いブロックチェーン技術を使った臨床研究の参加同意管理システムの構築、および、患者さんがご自身の健康情報にアクセス可能なPHR (Personal Health Record)の開発も合わせて行います。
研究のイメージ図
期待される効果
- データ入力負担の軽減とデータの大規模化
- 臨床試験対象者のリクルート促進
- 希少疾患のヒストリカルコントロール作成の迅速化
- サンプルサイズ計算のためのイベント率や共変量情報の取得の迅速化
- ブロックチェーン技術利用による同意取得手続きの迅速化
- データ二次利用の促進
主任研究者
西村邦宏(国立循環器病研究センター 予防医学・疫学情報部長)
この研究により、臨床研究における人手不足を軽減するためLLMの進歩を取り入れて、臨床医および現場の負担と費用を削減し、職員の働き方改革につながるDXを促進させる効率的な基盤を開発します。臨床研究推進および学術論文の出版などの効率化、迅速化を進めることが可能となる一方で、PHRおよびブロックチェーン技術を利用することで、患者さんご自身の自己決定権と速やかで確実なモニタリングを行うことが可能になります。
分担研究者
国立循環器病研究センター
病院長 飯原弘二
副院長 野口輝夫
心臓血管内科部門 草野研吾
情報統括部 平松治彦、櫻井理紗
予防医学・疫学情報部 尾形宗士郎
医学統計研究部 芳川裕亮
国立長寿医療研究センター
研究所長 櫻井孝
先端医療開発推進センター 渡辺浩
国立国際医療研究センター
医療情報基盤センター 美代賢吾、西亮太
糖尿病情報センター 大杉満
国立がん研究センター
中央病院医療情報部 田中勝弥、向井まさみ
がん対策研究所 東尚弘
国立成育医療研究センター
救急診療部 植松悟子
医療情報部 野口貴史
国立精神・神経医療研究センター
臨床研究・教育研修部門 波多野賢二