@article{oai:repo.qst.go.jp:00057629, author = {安藤, 裕 and 二見, 光 and 山岸, 宏匡 and 川口, 修 and 塚本, 信宏 and 藤井, 博史 and 笠松, 智孝 and 長田, 雅和 and 茂松, 直之 and その他 and 安藤 裕 and 川口 修 and 塚本 信宏}, journal = {Medical IT 2008-2009 Mook : これ1冊でわかる!医用画像の近未来像}, month = {Oct}, note = {はじめに  読影レポートを利用した症例検索など、レポートシステムの応用的利用には、レポートを構造化することが有効である。構造化のためには専用の辞書が必要であるが、施設ごとに辞書を整備することは大変な労力を要する。整備された辞書が他施設でどのくらい有効であるかを検討した。  これまでわれわれは電子的に記述された読影レポートを2次的に利用するための構造化を行うシステムを開発してきた。ここではテキストマイニング技術を利用して任意の文体の日本語で書かれた読影レポート(フリーテキストレポート)の構造化を行い、他施設のレポートについても正しく構造化できるかを検討した。構造化のためには専用の辞書が必要であるが、施設ごとに辞書を整備することは大変な労力を要する。そこで2施設のレポートを対象に、整備ずみ辞書の有用性と実運用における課題と対策について検討した。 \n方法および対象データ 1)構造化手法  われわれは、テキストマイニング技術の中でもパターンマッチングを利用した構造化手法を提案してきた。その中で1つの意味単位をなす「記述単位」という概念を定義した。「記述単位」には大きく分けて2つの種類があり、それぞれ所見と診断を示すものとした。それぞれの構成要素として、「所見」もしくは「診断」、「部位」、「部位修飾」、「修飾」とそれらの存在の有無を示す「断定度」という5つの項目により定義した。システムは、整備された抽出ルールに従って、これらの項目に該当する単語(文字列を含む)を登録した辞書を参照しながら、一致した単語を記述単位の項目として抽出する。「所見」もしくは「診断」と「断定度」は必須項目で、まず断定度を決定づける単語ごとに文章を切り出す。「所見」または「診断」に相当する語句が辞書に登録されているかどうか検索する。記述単位として成立するセンテンスの中から「部位」、「部位修飾」、「修飾」に相当する単語を同様に抽出することで記述単位が生成され、XML形式の構造化レポートとして出力される。断定度は「断定」「弱断定」「弱否定」「否定」「不明」の5段階で表現される。実際の読影レポートから生成される記述単位の例を示す 2)再現率  レポートより生成された記述単位を、医師がフリーテキストレポートから手作業で作成した記述単位(ゴールデンスタンダード)と比較して、その再現率を検証した。過去のわれわれの結果は、脳血流シンチグラフィおよび胸部CTの読影レポートを用いた場合で、それぞれ96.7%、89.5%の精度であった。 3)対象データ  胸部CT検査のレポート500例から手作業で記述単位の構成語句を抽出して辞書を整備した。辞書作成に用いたレポート100例(学習用レポート)と辞書作成に未使用のレポート100例(検証用レポート)、別施設のレポート100例(別施設レポート)をシステムにより構造化し、それぞれの再現率を算出した。 \n結果  各100例のレポートを構造化した場合の再現率は、89.5%(学習用レポート)、78.3%(検証用レポート)、62.5%(別施設レポート)であった。別施設の低い再現率の主因は、所見や診断の辞書への単語登録の不足であった。これらの語句を予め辞書に登録しておくことはむずかしい。この対策として即時的な構造化処理と辞書編集機能をシステムに実装することにした。これら機能を用いることにより、レポート作成中に構造化結果を視覚的に把握しながら不足する語句を辞書に登録でき、簡便に構造化精度を向上させることが可能と考えられる。 \nまとめ  実運用にて構造化レポートを作成する際の課題と対策について検討した。整備済みの辞書を別施設レポートに適用したところ、半数以上のレポートを正しく構造化できた。一方で構造化精度向上のためには、継続的に辞書を強化する仕組みが必要であり、辞書編集機能を設けることが有効であると考えられた。}, pages = {28--29}, title = {多施設の読影レポートの構造化:辞書の有用性と精度向上検討}, year = {2009} }