オンライン病気事典「MEDLEY」の取り組み：その構築と医療情報の果たす役割

沖山 翔

doi:10.1241/johokanri.59.650

著者抄録

医療情報はインターネット上にあふれているが，その信頼性は必ずしも高いとはいえない。オンライン病気事典MEDLEY（メドレー）は数百名の医師が共同編集する医療情報提供Webサイトである。ここでは医師のみが記事を記し更新することでその正確性を担保し，年間10万回の改訂によって最新の知見が集められる体制をとっている。また疾患，症状，医薬品，医療機関，医学論文といったデータベース同士の関係性を定義することで，症状や年齢，性別から，それに合致した疾患を演繹する「症状チェッカー」などのツールを開発している。MEDLEYとそのツールについて概括するとともに，情報処理アルゴリズムについて，種類ごとの特徴と医療にもたらし得る価値について考察した。

1. はじめに

オンライン病気事典「MEDLEY（メドレー）」^注1）は，インターネット上で医療情報を提供するWebサイトである。国内の医師492名（2016年12月1日現在）による継続的な共同編集がなされており，疾患，症状，医薬品，医療機関，医学論文等に関する情報をユーザーは無料で閲覧することができる。本稿では医療情報が本来もつ性質に目を向けた後にMEDLEYの仕組みを示し，基盤となる医療情報データベースとそれを処理するアルゴリズムについて概括する。

2. 医療情報の性質

2.1 医療情報の果たす役割

Evidence Based Medicine（根拠に基づいた医療）は医療における基本的な概念の一つであり，医療現場では医学研究の結果に基づいた検査，治療が実践されている。しかし，分野や病状によってはこのようなエビデンス（科学的根拠）がそろっていないことも多く，その際にはエビデンスがない，または不十分な中で医療的判断を下さざるをえない。また，エビデンスは同じ条件下での試行を反復してこそ見いだせる一定の傾向を示したものであるが，治療を受ける患者にとって自身の治療体験は一度限りであり，そこにエビデンスがあろうとなかろうと，結果が不確実な中での選択を迫られるという現状に変わりはない。

このように結果に対する不確実性の高い医療において，適切な医療情報の提供は患者にとって2つの観点から重要である。

1. エビデンスを基に，治療選択等の場面において自身で適切な選択を行えることで，よい結果が得られやすくなる

2. 十分かつ信頼できる情報を基に検討したというプロセスを通じて，選択に自信と納得感がもたらされる

1番目の観点に関して，医学的に適切な選択を行うことの価値は自明といっても差し支えないだろう。一方で，2番目については必ずしも広く明示的に認識されているとはいい難い。しかし仮に治療がうまくいかなかった場合に，十分な情報がないままその治療を選択してしまっていたケースと，事前に入念な下調べをして，その時点で最良と思われた選択をしたうえでの結果であったケースとでは，納得感や後悔の度合いに差が出ることはこれもまた，想像に難くないところであろう。すなわち，よき結果が必ずしも保証されない医療においては，結果のみでなく治療選択に至るまでのプロセスも重要であり，医療情報の有無はこれら結果とプロセスの両面に影響を及ぼすものであるといえる。

2.2 医療情報の信頼性

国民のインターネットリテラシーの向上や，スマートフォンのようなポータブルデバイスの普及によるアクセシビリティー向上により，患者行動は変容してきている。過去には医師が施すものとみなされていた医療が，現在では患者と医師の両者が共同で取り組みながら意思決定すべきと考えられるようになった^1）。患者も医療に対して待ちの姿勢で臨むだけでなく，自身の病名を検索して自主的に治療に向き合ったり，インターネットで名医と評判の医師のもとに受診に行ったりなどの行動が増えてきている。

他方，インターネット上の医療情報は必ずしも正確でないものが多く，検索エンジンでしばしば上位に表示されるWikipediaの主要疾患記事においても，その9割に誤った記載が見つかったと報告されている^2）。正誤の判断に専門知識が要求される医療領域において，その記事が正確かどうか，どの部分に間違いが含まれているかを患者が判断することは容易でない。したがって，一部でも誤りを含むような情報源はその全体の信頼性が毀損（きそん）されてしまいやすいという問題がある。医療情報は正しく提供されれば有益なものであるが，そのためには専門的な知識をもった者が書くことや，古い情報がそのまま放置されていないという更新性が必要条件となる。

3. 医療データベース

3.1 オンライン病気事典MEDLEY

MEDLEYは，500名弱の医師が共同編集する医療情報Webサイトである（図1）。6名のメドレー社専属医師をはじめとする編集チームが医学文献に基づいて作成した1,500疾患の記事に対し，外部の協力医師が追記・修正を随時行うことで，疾患情報の充実と最新の知見に対する更新がなされる体制になっている。現在医師ユーザーに対しては無償での任意協力を仰いでおり，2015年2月の公開から1年半で20万回の更新が行われている。

内部ではいつ誰がどの部分をどのように修正したかといった改変記録が恒久的に残されていることと，また，実名確認により1人の医師が生涯で1つのアカウントしか作成できない仕組みが，いわゆる荒らし行為に対する抑止力となっている。

メインユーザーは非医療者，すなわち患者やその家族であり，医師のみが内容の編集を行っていることで記載内容の信頼性を担保している。医師ユーザーに対しては，アカウント作成時に医師免許証の画像確認，所属病院への電話連絡といった手段で，実名および医師資格保有の確認が行われている。患者が自身でWebサイトにアクセスするといった利用の他に，電子カルテシステムに搭載され，病院で医師が患者に配布する資料としても用いられている^3）。

図1 MEDLEY Webサイト

3.2 データベース間の関係性定義

MEDLEY上では疾患の記事と同じく，症状，医薬品，医療機関，診療科，etc. といった粒度でそれぞれのデータベース（DB）が存在している。またDB内での一つひとつのデータは，MEDLEY全体を通じた重複のない固有IDで管理されている。

医療の情報には，DBによる区分けをまたいだ連関が認められる。ある疾患では特定の症状が出やすく（疾患DBと症状DBの関係性），ある疾患に用いられる医薬品は特定のものに限られており（疾患DBと医薬品DB），ある疾患のときに受診すべき診療科や，その診療科のある医療機関もまた限定されている（疾患DBと診療科DB，診療科DBと医療機関DB）。このようなDBをまたいだ関係性を，データ間の無数の組み合わせに対して定義することで，文字情報にすぎない一つひとつのデータを有機的にツールとして利用できるようにしているのがMEDLEYの特徴である（図2）。

疾患DBと医薬品DBの関係性によって，「この疾患に対してはこの薬が用いられる」という情報が自動で表示されることや，疾患DB－診療科DB－医療機関DB－都道府県・市区町村DBといった連続的なひも付けを用いて，「この疾患候補であれば呼吸器内科の受診が適切で，呼吸器内科のある医療機関のうち，東京都港区にあるのはA病院，B病院とCクリニック」という受診先候補を表示することが可能となる。

また，最新医学論文を翻訳，要約して配信しているニュースDBは，論文の研究テーマに合わせて疾患DBや医薬品DBにひも付けられている。これによって，疾患ページを見る際や，医薬品ページを見る際に，それと関連した医学論文ニュースが自動で表示されるシステムを採用している。

データがそれぞれ孤立してしまうと単なる読み物以上の価値が生み出せず，紙媒体に対するデジタル情報の優位性は，検索性など一部に限られてしまう。しかし，それぞれのデータの関係性が定義されることで，情報としてはそのたびに一つずつ次元が増すことになり，情報量や利用用途が飛躍的な広がりをもつ。医療のあらゆる内容を個別にDB化して相互の関係性を定義することで，医療という抽象的なものを空間的にシミュレートできることになる。すなわち図2の例でいえば，x軸，y軸，z軸に症状DB，疾患DB，診療科DBそれぞれの項目を並べ，xy平面上にはある疾患でその症状が出る可能性を，yz平面上にはある疾患のときにその診療科を受診することの妥当性を，xz平面上にはある症状のときにその診療科を受診することの妥当性をそれぞれ数値化してプロットしていくことで，医学現象の起こる可能性や医療行動の妥当性を表現することができる。このような概念を形に落とし込んだのが，MEDLEYとそのツールである。

図2 DB間の関係性

4. 医療DBを用いたツール

4.1 症状チェッカー

DB間の関係性をツール化したシステムの説明として，「MEDLEY症状チェッカー」^注2）を例に取り上げる。このツールでは，「吐き気」と入力すると「吐き気が出て，どのくらい経っていますか？：半日以内・1週間以内・それ以上」といった質問や回答選択肢が提示される（図3）。医師による問診を想定したこのような対話が繰り返され，自身の症状や年齢，性別を入力すると，それに合わせて可能性のある疾患が順に表示されるアルゴリズムになっている。症状を抱える患者が，自分の病状について調べたいのに病名がわからないと検索ができないというジレンマを解消し，併せて受診に適した診療科を表示するためのツールである。

このツールを支えるのは，先述したDB間の結びつきを数値で定義したメタデータ（図2）である。1,500の疾患が登録されている疾患DBと，500の症状が登録されている症状DBの間には1,500×500＝75万セルの対応マトリックスが存在し，それぞれのセルに対して「疾患Aで症状Xが出る頻度は0.9」というような形式のデータが登録されている。このマトリックスによって，複数の症状を入力した際に，そのそれぞれに合致する可能性が高い疾患を順に表示することが可能となる。

また可能性の高い疾患が複数ある場合には「他に◯◯の症状はありますか？」といった質問がなされるが，その際には「次にどの質問をすると最も効率よく結果がふるい分けられるか」を判断するロジックによって，自動的に次の質問が選択されることになる。なお「吐き気」のケースでは，500の症状の中で次にアルゴリズムによって確認されるのが「発熱」「嘔吐（おうと）」「おなかの張り」の3つの有無である（2016年12月1日現在）。

アルゴリズムについて補足すると，1,500の疾患には，それぞれの一般的な罹患（りかん）率を数値化したデータが初期値として設定されている。したがって何も条件を設定しない状態では風邪や鼻炎などの日常的な疾患が高い評価値をもつこととなる。そこから症状の有無を入力することで，ベイズ推定により各疾患の評価値が変化していく。男女別の罹患率（例：男性が卵巣がんになることはないが，男性が乳がんになるケースはまれながらも存在する），年齢別の罹患率（例：小児は水ぼうそうや中耳炎になりやすく，高齢者は肺炎や脳卒中になりやすい）といった要素も考慮しながら，1,500疾患の確率分布を導き出すのが症状チェッカーである。このように医学的ロジックを数値化，定式化して表現することが，後述する演繹（えんえき）的アルゴリズムの礎となっている。

図3 症状チェッカー画面

4.2 DB間の関係性定義によるツールの類型

このようにDB間でデータの結び付きを定義してツール化するという試みとしては，MEDLEY以外にもさまざまなものがある。日常的に用いられているものとしては種々の会社が提供している電車乗り換え案内ツールが有名である（表1）。ここでは日本中の駅名を一覧化した駅名DBがあり，路線DBがある。そして路線DBと駅名DBは互いにひも付いており，どの駅はどの路線上に存在するかという関係性が定義されている。そこに時刻表DBが合わさることで，どの駅からどの駅まで何分かかり，その場合に乗車するのは何線という結果を返す，広く知られたツールである。

乗り換え案内ツールが事実を整理して候補を提示しているだけで意思決定の必要な判断を下したり結論付けを行ったりしていないように，症状チェッカーもまた主観的な判断から切り離されたアルゴリズムにすぎない。この症状チェッカーで診断を一つに定めたり，医療をすべて自動化したりすることはできないが，症状に合致した疾患候補やそれぞれに適した受診先を，医学的情報に基づいて表示することで，患者にとっては必要としている情報によりたどり着きやすくなるというメリットがある。

このように，医療のうち医師のオリジナリティーやクリエーティビティーを要さない部分，すなわち客観的な事実を基に選択肢を提示する部分は理論上自動化が可能であり，医療費の高騰や医師不足という問題に対する解決策の一助として今後もさまざまなツールの可能性に期待がかかる。健康診断の結果を入力するとその結果に合致した疾患可能性一覧が表示されるツール，疾患を区別するうえで有用な検査（CTかMRIかエコー検査か）を表示するツールや，特定の年齢，性別の人が特定の症状で受診した場合にかかる医療費の統計的な分布を表示するツールなど，医療情報の適切な組み合わせによって提供可能な価値は無数に考えられる。

表1 乗り換え案内ツールと症状チェッカーの比較

4.3 他アルゴリズムとの対比

このような情報処理システムとしては症状チェッカーとは別に，大量のデータを基に一定の傾向を見いだし，帰納的に結論を導き出す統計的機械学習アルゴリズムがある。2015年には，正確な診断が長期間ついていなかった患者を二次性白血病だと診断し，それによって患者が一命をとりとめたというIBM Watsonの例が報告された^4）。

医学的に検証されたロジックによって結論を導き出す症状チェッカーのような演繹的システムに対し，ビッグデータを用いて過去の傾向に基づいた結果予測を行うのが帰納的アルゴリズムである。両者はそれぞれに得手不得手があるが，2つのアルゴリズムの特徴を対比的に示すと表2のようになる。

大量のデータから一定の傾向を見いだすことで，背景にある理論がわからなくても結果の予測ができるのが帰納的アルゴリズムの強みである。同時にその限界としては，例外的な事象に対応しづらい点や，学習目的ごとに最適化された大量のデータを必要とするという点がある。医療は裾野が広く，集中治療室で生死をかけた病状の人もいる一方で，日常生活を送りながら肩こりに悩まされるといった病状も医療の範疇（はんちゅう）に含まれる。前者は専門職が深くかかわる分野であるため，ある程度定型化された医療記録が残されており，これを学習材料に利用できる可能性がある。一方で，日常生活における症状や悩みは言語化される頻度が相対的に低く，また言葉の定義や用法が統一的でないことも踏まえると，機械学習の材料としては質，量の両面から不十分である。

では入院患者の電子カルテデータを基に学習したものを一般向けに汎用（はんよう）化すればよいかというと，これでは元データが想定している母集団が重症な方へ偏っているので，そこで学習した結果を外部に当てはめることができない（外挿できない）という問題がある。このように，専門性が高い分野，すなわち深く狭い分野であるほどデータがそろっていて機械学習による帰納的アルゴリズムに適しており，逆に専門よりも日常生活寄りの分野であるほど演繹的なアルゴリズムが有効となりやすい。

また，二者の違いのうち特徴的な点として，帰納的アルゴリズムは人類がまだ認知していない新発見（例：疾患Aに対する薬が実は別の疾患Bにも効く）をする可能性があると同時に，なぜそうなるのかといった背景を論理的に説明することができないという点がある。演繹的アルゴリズムは逆で，常に「AならばB，BならばCであり，ここではAゆえにC」と理由を述べることができるが，はじめにプログラムされたロジックから離れて独自のものを生み出すことはできない。どちらも一長一短ではあるが，医療の文脈においては，判断の根拠が論理的に説明できることの重要性を見過ごすことはできない。ある優れたツールがあったとして，「あなたの病状にはこの毒薬が効くはずだから飲みなさい」といわれたとき，なぜそうなるかという説明がつかないままその判断に身を委ねるということは困難である。帰納的アルゴリズムが不得手とする点はここであり，同時にこの根拠の提示は医療において大切な要素となっている。

このように日常生活寄りの分野であるほど，均質化されたデータがそろいづらい性質をもつと同時に，重症で非日常的な母集団を基にしたデータは外挿に限界があるため，ロジックに基づく演繹的アルゴリズムが有効となりやすい。加えて，判断の根拠が論理的に説明できることも演繹的アルゴリズムの長所である。なお，演繹的アルゴリズムで作られた症状チェッカーがよりどころとするロジックについては「4.1 症状チェッカー」で言及したとおりである。

表2 演繹的アルゴリズムと帰納的アルゴリズムの比較

5. おわりに

医学が進歩するにつれて医療情報は日々その総和を増しており，医師－患者間の情報の非対称性はいまだ埋まる兆しがみえない。患者には情報の正誤を判断することが難しく，その情報を誰が提供しているかといった点から判断するしかないのが現状である。適切かつ信頼できる情報源がインターネット上にあることの重要性は論をまたない。

医療情報は文献データとして一方的に検索されるのを待っているだけでなく，ツール化され公開されることで，さらに有機的な形で提供されることが可能となる。患者が自分の疾患についての予備知識をもったうえで，さらに深い情報交換を行う場として診療の場を役立てることができれば，医療全体が効率化されることになる。患者にとってはより多くの悩みが解決されるようになり，医師にとってはツールで代替できない業務により多くの時間を割くことができるようになる。

医師の仕事は多岐にわたるが，その中で医療情報を集約，整理して示す側面には，オリジナリティーやクリエーティビティーは必ずしも要求されない。一定の症状群，検査結果から予測される疾患の候補は，十分な経験があるという前提では医師間で一致するはずであり，推奨される治療の選択肢もまたいくつか一定の候補が挙がってくるはずである。この，与えられた情報を演繹的に整理する部分は，医療の中でもアルゴリズムによる情報処理と親和性が高い側面であると考える。そのうえで，選択肢ごとのメリット，デメリットをどうとらえるかは患者の置かれた環境，医療観や人生観ともかかわってくるところであり，アルゴリズムには判断が難しい部分である。このような点にこそ，多くの患者の経過を見てきた医師の経験が役立つのであり，患者による意思決定をサポートする存在として，医師の立ち位置が際立つのではないだろうか。

執筆者略歴

沖山翔（おきやましょう）　pr@medley.jp

2010年東京大学医学部医学科卒。救急科専門医。日赤医療センターでの臨床研修を経て，救命救急医，船医，離島医，ドクターヘリ添乗医，DMAT（災害派遣医療チーム）隊員として勤務。東日本大震災では宮城県石巻市にて被災地医療に従事し，不足する入院施設の新規立ち上げを行う。2015年より株式会社メドレーにて医療情報活用の研究およびプロダクト開発に取り組んでいる。

本文の注

注1) MEDLEY：https://medley.life

注2) 症状チェッカー：https://medley.life/symptoms

参考文献

1) Hoffmann, T. C. et al. The connection between evidence-based medicine and shared decision making. JAMA. 2014, vol. 312, no. 13, p. 1295-1296.
2) Hasty, R. T. et al. Wikipedia vs peer-reviewed medical literature for information about the 10 most costly medical conditions. J. Am. Osteopath. Assoc. 2014, vol. 114, no. 5, p. 368-373.
3) “20160217 クラウド電子カルテ「Clipla」によるオンライン病気事典「MEDLEY」のデータ活用開始”. Clipla. https://clinical-platform.com/news/2016/02/17/01/20160217_Clipla%E3%81%AB%E3%82%88%E3%82%8BMEDLEY%E3%81%AE%E3%83%87%E3%83%BC%E3%82%BF%E6%B4%BB%E7%94%A8%E9%96%8B%E5%A7%8B.pdf, (accessed 2016-10-01).
4) Rutkin, A. Medicine by machine. New Sci. 2016, vol. 231, no. 3089, p. 20-21.

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）