WEKO3
アイテム
{"_buckets": {"deposit": "62ab3b3e-85f3-44fa-be22-7212fad958e6"}, "_deposit": {"created_by": 1, "id": "57629", "owners": [1], "pid": {"revision_id": 0, "type": "depid", "value": "57629"}, "status": "published"}, "_oai": {"id": "oai:repo.qst.go.jp:00057629", "sets": ["11"]}, "author_link": ["581114", "581118", "581110", "581119", "581113", "581117", "581109", "581120", "581112", "581111", "581116", "581115", "581121"], "item_10004_biblio_info_7": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2009-10", "bibliographicIssueDateType": "Issued"}, "bibliographicPageEnd": "29", "bibliographicPageStart": "28", "bibliographic_titles": [{"bibliographic_title": "Medical IT 2008-2009 Mook : これ1冊でわかる!医用画像の近未来像"}]}]}, "item_10004_description_5": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "はじめに\n 読影レポートを利用した症例検索など、レポートシステムの応用的利用には、レポートを構造化することが有効である。構造化のためには専用の辞書が必要であるが、施設ごとに辞書を整備することは大変な労力を要する。整備された辞書が他施設でどのくらい有効であるかを検討した。\n これまでわれわれは電子的に記述された読影レポートを2次的に利用するための構造化を行うシステムを開発してきた。ここではテキストマイニング技術を利用して任意の文体の日本語で書かれた読影レポート(フリーテキストレポート)の構造化を行い、他施設のレポートについても正しく構造化できるかを検討した。構造化のためには専用の辞書が必要であるが、施設ごとに辞書を整備することは大変な労力を要する。そこで2施設のレポートを対象に、整備ずみ辞書の有用性と実運用における課題と対策について検討した。\n\\n方法および対象データ\n1)構造化手法\n われわれは、テキストマイニング技術の中でもパターンマッチングを利用した構造化手法を提案してきた。その中で1つの意味単位をなす「記述単位」という概念を定義した。「記述単位」には大きく分けて2つの種類があり、それぞれ所見と診断を示すものとした。それぞれの構成要素として、「所見」もしくは「診断」、「部位」、「部位修飾」、「修飾」とそれらの存在の有無を示す「断定度」という5つの項目により定義した。システムは、整備された抽出ルールに従って、これらの項目に該当する単語(文字列を含む)を登録した辞書を参照しながら、一致した単語を記述単位の項目として抽出する。「所見」もしくは「診断」と「断定度」は必須項目で、まず断定度を決定づける単語ごとに文章を切り出す。「所見」または「診断」に相当する語句が辞書に登録されているかどうか検索する。記述単位として成立するセンテンスの中から「部位」、「部位修飾」、「修飾」に相当する単語を同様に抽出することで記述単位が生成され、XML形式の構造化レポートとして出力される。断定度は「断定」「弱断定」「弱否定」「否定」「不明」の5段階で表現される。実際の読影レポートから生成される記述単位の例を示す\n2)再現率\n レポートより生成された記述単位を、医師がフリーテキストレポートから手作業で作成した記述単位(ゴールデンスタンダード)と比較して、その再現率を検証した。過去のわれわれの結果は、脳血流シンチグラフィおよび胸部CTの読影レポートを用いた場合で、それぞれ96.7%、89.5%の精度であった。\n3)対象データ\n 胸部CT検査のレポート500例から手作業で記述単位の構成語句を抽出して辞書を整備した。辞書作成に用いたレポート100例(学習用レポート)と辞書作成に未使用のレポート100例(検証用レポート)、別施設のレポート100例(別施設レポート)をシステムにより構造化し、それぞれの再現率を算出した。\n\\n結果\n 各100例のレポートを構造化した場合の再現率は、89.5%(学習用レポート)、78.3%(検証用レポート)、62.5%(別施設レポート)であった。別施設の低い再現率の主因は、所見や診断の辞書への単語登録の不足であった。これらの語句を予め辞書に登録しておくことはむずかしい。この対策として即時的な構造化処理と辞書編集機能をシステムに実装することにした。これら機能を用いることにより、レポート作成中に構造化結果を視覚的に把握しながら不足する語句を辞書に登録でき、簡便に構造化精度を向上させることが可能と考えられる。\n\\nまとめ\n 実運用にて構造化レポートを作成する際の課題と対策について検討した。整備済みの辞書を別施設レポートに適用したところ、半数以上のレポートを正しく構造化できた。一方で構造化精度向上のためには、継続的に辞書を強化する仕組みが必要であり、辞書編集機能を設けることが有効であると考えられた。", "subitem_description_type": "Abstract"}]}, "item_10004_publisher_8": {"attribute_name": "出版者", "attribute_value_mlt": [{"subitem_publisher": "産業開発機構株式会社"}]}, "item_10004_relation_10": {"attribute_name": "ISBN", "attribute_value_mlt": [{"subitem_relation_type_id": {"subitem_relation_type_id_text": "978-4-9039-4018", "subitem_relation_type_select": "ISBN"}}]}, "item_access_right": {"attribute_name": "アクセス権", "attribute_value_mlt": [{"subitem_access_right": "metadata only access", "subitem_access_right_uri": "http://purl.org/coar/access_right/c_14cb"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "安藤, 裕"}], "nameIdentifiers": [{"nameIdentifier": "581109", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "二見, 光"}], "nameIdentifiers": [{"nameIdentifier": "581110", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "山岸, 宏匡"}], "nameIdentifiers": [{"nameIdentifier": "581111", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "川口, 修"}], "nameIdentifiers": [{"nameIdentifier": "581112", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "塚本, 信宏"}], "nameIdentifiers": [{"nameIdentifier": "581113", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "藤井, 博史"}], "nameIdentifiers": [{"nameIdentifier": "581114", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "笠松, 智孝"}], "nameIdentifiers": [{"nameIdentifier": "581115", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "長田, 雅和"}], "nameIdentifiers": [{"nameIdentifier": "581116", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "茂松, 直之"}], "nameIdentifiers": [{"nameIdentifier": "581117", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "その他"}], "nameIdentifiers": [{"nameIdentifier": "581118", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "安藤 裕", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "581119", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "川口 修", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "581120", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "塚本 信宏", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "581121", "nameIdentifierScheme": "WEKO"}]}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "article", "resourceuri": "http://purl.org/coar/resource_type/c_6501"}]}, "item_title": "多施設の読影レポートの構造化:辞書の有用性と精度向上検討", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "多施設の読影レポートの構造化:辞書の有用性と精度向上検討"}]}, "item_type_id": "10004", "owner": "1", "path": ["11"], "permalink_uri": "https://repo.qst.go.jp/records/57629", "pubdate": {"attribute_name": "公開日", "attribute_value": "2009-11-02"}, "publish_date": "2009-11-02", "publish_status": "0", "recid": "57629", "relation": {}, "relation_version_is_last": true, "title": ["多施設の読影レポートの構造化:辞書の有用性と精度向上検討"], "weko_shared_id": -1}
多施設の読影レポートの構造化:辞書の有用性と精度向上検討
https://repo.qst.go.jp/records/57629
https://repo.qst.go.jp/records/57629fc2d8583-5a56-4e9b-bd79-e1483ded595b
Item type | 一般雑誌記事 / Article(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2009-11-02 | |||||
タイトル | ||||||
タイトル | 多施設の読影レポートの構造化:辞書の有用性と精度向上検討 | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | article | |||||
アクセス権 | ||||||
アクセス権 | metadata only access | |||||
アクセス権URI | http://purl.org/coar/access_right/c_14cb | |||||
著者 |
安藤, 裕
× 安藤, 裕× 二見, 光× 山岸, 宏匡× 川口, 修× 塚本, 信宏× 藤井, 博史× 笠松, 智孝× 長田, 雅和× 茂松, 直之× その他× 安藤 裕× 川口 修× 塚本 信宏 |
|||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | はじめに 読影レポートを利用した症例検索など、レポートシステムの応用的利用には、レポートを構造化することが有効である。構造化のためには専用の辞書が必要であるが、施設ごとに辞書を整備することは大変な労力を要する。整備された辞書が他施設でどのくらい有効であるかを検討した。 これまでわれわれは電子的に記述された読影レポートを2次的に利用するための構造化を行うシステムを開発してきた。ここではテキストマイニング技術を利用して任意の文体の日本語で書かれた読影レポート(フリーテキストレポート)の構造化を行い、他施設のレポートについても正しく構造化できるかを検討した。構造化のためには専用の辞書が必要であるが、施設ごとに辞書を整備することは大変な労力を要する。そこで2施設のレポートを対象に、整備ずみ辞書の有用性と実運用における課題と対策について検討した。 \n方法および対象データ 1)構造化手法 われわれは、テキストマイニング技術の中でもパターンマッチングを利用した構造化手法を提案してきた。その中で1つの意味単位をなす「記述単位」という概念を定義した。「記述単位」には大きく分けて2つの種類があり、それぞれ所見と診断を示すものとした。それぞれの構成要素として、「所見」もしくは「診断」、「部位」、「部位修飾」、「修飾」とそれらの存在の有無を示す「断定度」という5つの項目により定義した。システムは、整備された抽出ルールに従って、これらの項目に該当する単語(文字列を含む)を登録した辞書を参照しながら、一致した単語を記述単位の項目として抽出する。「所見」もしくは「診断」と「断定度」は必須項目で、まず断定度を決定づける単語ごとに文章を切り出す。「所見」または「診断」に相当する語句が辞書に登録されているかどうか検索する。記述単位として成立するセンテンスの中から「部位」、「部位修飾」、「修飾」に相当する単語を同様に抽出することで記述単位が生成され、XML形式の構造化レポートとして出力される。断定度は「断定」「弱断定」「弱否定」「否定」「不明」の5段階で表現される。実際の読影レポートから生成される記述単位の例を示す 2)再現率 レポートより生成された記述単位を、医師がフリーテキストレポートから手作業で作成した記述単位(ゴールデンスタンダード)と比較して、その再現率を検証した。過去のわれわれの結果は、脳血流シンチグラフィおよび胸部CTの読影レポートを用いた場合で、それぞれ96.7%、89.5%の精度であった。 3)対象データ 胸部CT検査のレポート500例から手作業で記述単位の構成語句を抽出して辞書を整備した。辞書作成に用いたレポート100例(学習用レポート)と辞書作成に未使用のレポート100例(検証用レポート)、別施設のレポート100例(別施設レポート)をシステムにより構造化し、それぞれの再現率を算出した。 \n結果 各100例のレポートを構造化した場合の再現率は、89.5%(学習用レポート)、78.3%(検証用レポート)、62.5%(別施設レポート)であった。別施設の低い再現率の主因は、所見や診断の辞書への単語登録の不足であった。これらの語句を予め辞書に登録しておくことはむずかしい。この対策として即時的な構造化処理と辞書編集機能をシステムに実装することにした。これら機能を用いることにより、レポート作成中に構造化結果を視覚的に把握しながら不足する語句を辞書に登録でき、簡便に構造化精度を向上させることが可能と考えられる。 \nまとめ 実運用にて構造化レポートを作成する際の課題と対策について検討した。整備済みの辞書を別施設レポートに適用したところ、半数以上のレポートを正しく構造化できた。一方で構造化精度向上のためには、継続的に辞書を強化する仕組みが必要であり、辞書編集機能を設けることが有効であると考えられた。 |
|||||
書誌情報 |
Medical IT 2008-2009 Mook : これ1冊でわかる!医用画像の近未来像 p. 28-29, 発行日 2009-10 |
|||||
出版者 | ||||||
出版者 | 産業開発機構株式会社 | |||||
ISBN | ||||||
識別子タイプ | ISBN | |||||
関連識別子 | 978-4-9039-4018 |