多施設の読影レポートの構造化：辞書の有用性と精度向上検討

安藤, 裕; 二見, 光; 山岸, 宏匡; 川口, 修; 塚本, 信宏; 藤井, 博史; 笠松, 智孝; 長田, 雅和; 茂松, 直之; その他; 安藤 裕; 川口 修; 塚本 信宏

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

多施設の読影レポートの構造化：辞書の有用性と精度向上検討

https://repo.qst.go.jp/records/57629

Item type

一般雑誌記事 / Article(1)

公開日

2009-11-02

タイトル

多施設の読影レポートの構造化：辞書の有用性と精度向上検討

言語

jpn

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_6501

資源タイプ

article

アクセス権

metadata only access

アクセス権URI

http://purl.org/coar/access_right/c_14cb

著者

抄録

内容記述タイプ

Abstract

内容記述

はじめに
　読影レポートを利用した症例検索など、レポートシステムの応用的利用には、レポートを構造化することが有効である。構造化のためには専用の辞書が必要であるが、施設ごとに辞書を整備することは大変な労力を要する。整備された辞書が他施設でどのくらい有効であるかを検討した。
　これまでわれわれは電子的に記述された読影レポートを2次的に利用するための構造化を行うシステムを開発してきた。ここではテキストマイニング技術を利用して任意の文体の日本語で書かれた読影レポート（フリーテキストレポート）の構造化を行い、他施設のレポートについても正しく構造化できるかを検討した。構造化のためには専用の辞書が必要であるが、施設ごとに辞書を整備することは大変な労力を要する。そこで2施設のレポートを対象に、整備ずみ辞書の有用性と実運用における課題と対策について検討した。
\n方法および対象データ
１）構造化手法
　われわれは、テキストマイニング技術の中でもパターンマッチングを利用した構造化手法を提案してきた。その中で１つの意味単位をなす「記述単位」という概念を定義した。「記述単位」には大きく分けて２つの種類があり、それぞれ所見と診断を示すものとした。それぞれの構成要素として、「所見」もしくは「診断」、「部位」、「部位修飾」、「修飾」とそれらの存在の有無を示す「断定度」という５つの項目により定義した。システムは、整備された抽出ルールに従って、これらの項目に該当する単語（文字列を含む）を登録した辞書を参照しながら、一致した単語を記述単位の項目として抽出する。「所見」もしくは「診断」と「断定度」は必須項目で、まず断定度を決定づける単語ごとに文章を切り出す。「所見」または「診断」に相当する語句が辞書に登録されているかどうか検索する。記述単位として成立するセンテンスの中から「部位」、「部位修飾」、「修飾」に相当する単語を同様に抽出することで記述単位が生成され、XML形式の構造化レポートとして出力される。断定度は「断定」「弱断定」「弱否定」「否定」「不明」の５段階で表現される。実際の読影レポートから生成される記述単位の例を示す
２）再現率
　レポートより生成された記述単位を、医師がフリーテキストレポートから手作業で作成した記述単位（ゴールデンスタンダード）と比較して、その再現率を検証した。過去のわれわれの結果は、脳血流シンチグラフィおよび胸部CTの読影レポートを用いた場合で、それぞれ96.7%、89.5%の精度であった。
３）対象データ
　胸部CT検査のレポート500例から手作業で記述単位の構成語句を抽出して辞書を整備した。辞書作成に用いたレポート100例(学習用レポート)と辞書作成に未使用のレポート100例(検証用レポート)、別施設のレポート100例(別施設レポート)をシステムにより構造化し、それぞれの再現率を算出した。
\n結果
　各100例のレポートを構造化した場合の再現率は、89.5%(学習用レポート)、78.3％(検証用レポート)、62.5%(別施設レポート)であった。別施設の低い再現率の主因は、所見や診断の辞書への単語登録の不足であった。これらの語句を予め辞書に登録しておくことはむずかしい。この対策として即時的な構造化処理と辞書編集機能をシステムに実装することにした。これら機能を用いることにより、レポート作成中に構造化結果を視覚的に把握しながら不足する語句を辞書に登録でき、簡便に構造化精度を向上させることが可能と考えられる。
\nまとめ
　実運用にて構造化レポートを作成する際の課題と対策について検討した。整備済みの辞書を別施設レポートに適用したところ、半数以上のレポートを正しく構造化できた。一方で構造化精度向上のためには、継続的に辞書を強化する仕組みが必要であり、辞書編集機能を設けることが有効であると考えられた。

書誌情報

Medical IT 2008-2009 Mook : これ1冊でわかる!医用画像の近未来像

p. 28-29, 発行日 2009-10

出版者

産業開発機構株式会社

ISBN

識別子タイプ

ISBN

Versions

Ver.1

2023-05-15 22:25:00.392964

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR 2.0
JPCOAR 1.0
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

多施設の読影レポートの構造化：辞書の有用性と精度向上検討

× 安藤, 裕

× 二見, 光

× 山岸, 宏匡

× 川口, 修

× 塚本, 信宏

× 藤井, 博史

× 笠松, 智孝

× 長田, 雅和

× 茂松, 直之

× その他

× 安藤裕

× 川口修

× 塚本信宏

Versions

Share

Cite as

エクスポート

インデックスリンク

インデックスツリー

アイテム

多施設の読影レポートの構造化：辞書の有用性と精度向上検討

× 安藤, 裕

× 二見, 光

× 山岸, 宏匡

× 川口, 修

× 塚本, 信宏

× 藤井, 博史

× 笠松, 智孝

× 長田, 雅和

× 茂松, 直之

× その他

× 安藤 裕

× 川口 修

× 塚本 信宏

Versions

Share

Cite as

エクスポート

× 安藤裕

× 川口修

× 塚本信宏