2024 Volume 144 Issue 12 Pages 1125-1135
Intentional overdose (OD) of over-the-counter (OTC) and prescription drugs is becoming a significant social issue all over the world. While previous research has focused on drug misuse, there has been limited analysis using social networking service data. This study aims to analyze posts related to a drug overdose on Twitter® (X®) to understand the characteristics and trends of drug misuse, and to examine the applicability of social media in understanding the current situation of OD through natural language processing techniques. We collected posts in Japanese containing the term “OD” from January 10 to February 8, 2023, and analyzed 30203 posts. Using a pre-trained, fine-tuned bidirectional encoder representations from transformers (BERT) model, we classified the posts into categories, including direct mentions of OD. We examined the content for drug types and emotional context. Among the 5283 posts categorized as “Posts describing ODing,” about one-third included specific drug names or related terms. The most frequently mentioned OTC drugs included active ingredients such as codeine, dextromethorphan, ephedrine, and diphenhydramine. Prescription drugs, particularly benzodiazepines and pregabalin, were also common. Tweets peaked at midnight, suggesting a link between negative emotions and potential OD incidents. Our classifier showed high accuracy in distinguishing OD-related posts. Analyzing Twitter® posts provides valuable insights into the patterns and emotional contexts of drug misuse. Monitoring social networking services for OD-related content could help identify high-risk individuals and inform prevention strategies. Enhanced monitoring and public awareness are crucial to reducing the risks associated with both OTC and prescription drug misuse.
近年,意図的な市販薬や医療用医薬品の過量服薬(overdose: OD)が社会問題となっている.厚生労働省は,2014年に濫用等のおそれのある医薬品の成分としてエフェドリン,コデイン,ジヒドロコデイン,ブロムワレリル尿素,プソイドエフェドリン,メチルエフェドリンの6成分を指定し,これらを含む市販薬について販売時の購入状況・理由の確認や数量制限を行うよう定めている.1)わが国の市販薬は複数の有効成分から構成されているものが多く,ラットを用いた実験ではジヒドロコデインにクロルフェニラミンを添加することにより,依存性が増したとする報告もあることから,2)単一成分から構成される医療用医薬品よりも習慣性や耽溺性が強く,また過量服薬時のリスクが高くなる可能性がある.わが国で2020年9–10月の間に有床精神科医療施設で診療を受けた薬物関連精神障害患者2859例のうち,調査1年以内に薬物を使用した1129例中177例(15.7%)が主に市販薬を使用しており,その割合は年々増加傾向である.3)年代別では,主に市販薬を使用した患者は10代が11.9%,20代が26.6%と,ほかの薬物使用者と比較して若年層の割合が高く,市販薬の過量服薬を含む薬物濫用は,若年層において特に顕在化していると考えられる.加えて,2010–2020年に地方中核病院の救急部門に薬物の過量服薬で搬送された症例577例を解析した研究では,221例(38.3%)が10–20代であり,97例(16.8%)が繰り返す過量服薬の歴があることからも,4)若年層の薬物濫用を防止,あるいはその兆候を早期に検出することは喫緊の課題である.5)一方で,これまで述べたようなデータはいずれも過量服薬によって医療機関への受診が行われた件数であり,過量服薬を行ったが医療機関を受診しなかった・受診を要さなかった潜在的な濫用者を把握するのは従来の手法では困難である.Kariyaらは,日本最大のQ&AサイトであるYahoo!知恵袋における市販薬濫用に関するテキストデータの定性分析を行い,ODをしている,あるいはしようとしている人は,濫用に対する期待や不安に関する質問をしており,また,依存症になった人は,ODをやめるためのアドバイスを求めているという現状を明らかにした.6)
ソーシャルネットワーキングサービス(social networking service: SNS)は,スマートフォンなどのデジタルデバイスの普及に伴い,連絡手段や自己を表出するための手段などとして広く用いられている.2022年に行われた調査では,平日のSNS利用率は10代で60.0%,20代で70.0%と,特に若年層に広く普及していることが推察される.7)また,平日におけるSNSの平均利用時間は10代で64.2分/日,20代で87.3分/日,30代以降では1時間未満/日と,10–20代は一日合計1時間以上の時間をSNSの閲覧や書き込みに要しており,ほかの世代と比してSNSに長時間接している実態が明らかとなっている.Twitter®(調査当時.現在のX®)は,SNSの一つであり,同調査によれば全世代の45.3%,10代の54.3%,20代の78.8%が使用していると回答するなど,若年層の中で広く用いられている.Twitter®はマイクロブログ型のSNSであり,リアルタイム性の高さや気軽に発信が可能といった特徴から,リアルタイムに情報を捕捉する情報源として有用であると考えられる.実際,米国では,Twitter®を用いたオピオイドの過量服薬8,9)や物質使用障害10)についての研究が盛んに行われており,医薬品の不適切な使用についての詳細を明らかにしている.11) Kashiwabaraは,わが国におけるTwitter®の利用動機として①交流・自己実現,②既存関係維持,③実況・情報探索,④自己呈示,⑤気晴らし,の5次元を見い出しており,12)実況や自己呈示の一つとしてODに関連する投稿がTwitter®上で行われる可能性がある.また,Hakariyaらが,Twitter®上で医薬品の不適切な譲渡や売買等を意味する検索ワード「お薬もぐもぐ」を用いて不正薬物取引の可能性を調査した研究では,検索された投稿のうち30.7%が薬の売買に関連する投稿であり,118種類,26品目の医薬品名が含まれていたとの結果を報告している.13)以上のことから,わが国の若年層によるODに関する投稿を捕捉するためにTwitter®は適切なプラットフォームであり,効率的にTwitter®上でのODに関するトレンドを把握できると考える.このSNSから得られる多量のテキストデータについて,単語の抽出だけでなく文脈を考慮した解析を行ううえで,自然言語処理(natural language processing: NLP)や機械学習などの手法を用いることは有用であることが想定される.
本研究の目的は,マイクロブログ型SNSであるTwitter®からODに関連する投稿を抽出し,自然言語処理の手法を用いて解析することによって,わが国のODの実態把握においてSNSの利用可能性があるか検討するものである.
Twitter® APIを利用して取得した2023年1月10日–2023年2月8日の投稿データ(ツイート,X®におけるポスト)のうち,日本語で記載され,「OD」という単語を含むリツイート(他者の投稿を再投稿するもの)以外の投稿30203件を解析対象とした.なお,解析対象の設定にあたり,いくつかの検索語を検討した結果,「オーバードーズ」を検索語とした場合にも過量服薬に関連する投稿は含まれていたが,実際にODしていると推測されるユーザーの投稿や,それに関連する内容の投稿は,「オーバードーズ」よりも「OD」という単語を含む投稿の方が多く,多様である傾向が認められた.さらに,Twitter®の投稿文字数は140文字以内という制限があることから「オーバードーズ」などの冗長な単語ではなく,「OD」という短い単語がより頻用されると考え,「OD」が含まれる投稿のみを抽出対象とした.収集項目はツイート固有ID,ツイート時刻,ツイート本文,いいね数,リツイート数,ユーザーID,ユーザー名,アカウントID,アカウント名,自己紹介文,フォロー数,フォロワー数,アカウント作成日時,アイコン画像URL,ヘッダ画像URLとした.アカウントの特定が可能な調査項目(ユーザーID,ユーザー名,アカウント名)については符号化を行い,アカウントが特定できないようにした.
2. アノテーションと収集した投稿データの解析解析対象のOD関連投稿のうち,実際にODを行ったと判断される投稿を抽出するため,アノテーション基準を定めたアノテーションガイドラインを作成して分類を行った.アノテーションの信頼性評価のため,対象データから500件を無作為に抽出し,アノテーションガイドラインに従って研究者2名(薬剤師,薬学生)がアノテーションを行ったのち,ラベルの一致度を確認した.アノテーションガイドラインとラベルについてTable 1に示す.アノテーションの一致度はCohenのκ係数で評価した.14) κ係数とは2つの評価間の一致度を見ており,偶然の一致の影響を排除した指標とされ,κ係数は一般的に0.6を超えると十分な一致度,0.8を超えると高い一致度と評価される.
Major classification label | Minor classification label | Description | |
---|---|---|---|
(1) Posts directly related to OD | ①Posts describing ODing | Posts that can be inferred or determined to be habitually ODing based on the content of the post | |
•Even if the sentence is in the past tense, if it can be judged as OD in the present, it is classified as ① | |||
•Using “OD” as a verb like “I am ODing.” | |||
•Posts showing intentional overdose without directly stating | |||
Examples: | |||
“Fluffy with TONIN and booze” | |||
> This post is applicable Because “TONIN” is cough syrup. | |||
“It is too bad I am using 300 t in a week.” | |||
>“300 t” means 300 tablets, so this post is applicable because it suggests an overdose | |||
②Posts describing having been ODing | Posts that can be determined not to OD currently and can be judged to have ODed in the past | ||
•Not habitually ODing (stopped now), but ODed in the past, or stopping ODing for a short period, such as a few days | |||
Example: | |||
“I used to do OD, but I still feel better when I stop OD.” | |||
③Posts describing trying to OD | Posts that can be determined not to experience OD and to try to OD in the future | ||
•Posts with no OD experience and asking questions about which medications to use or how to OD | |||
Example: | |||
“I wanna overdose of KIN-PAB. How can I do?” | |||
>KIN-PAB is the slang for a brand name of cold medicine. | |||
(2) Posts not directly related to OD | ④Other posts with OD topics mentioned | Posts that do not match ①–③ and include the topic of ODs, which are intentional overdoses of medicines | |
Examples: | |||
“OD means overdose, doesn’t it?” | |||
“You should stop ODing. My friend was in the ambulance, and I thought it was terrible.” | |||
⑤Posts with non-medication-related OD | Posts that use the word OD intending to overdose on non-medications such as food or beverages (e.g., “Gummy OD” or “Booze OD”) | ||
•Supplements are also included in this category. However, supplements that are classified as Schedule III pharmaceuticals are given labels ①–③ | |||
Example: | |||
“I ODed on tea.” | |||
“I ODed on caffeine, but I am still sleepy.” | |||
“I’ve ODed on TOU-PEA (YouTuber’s collaboration tag) video, which is highly addictive.” | |||
(3) Posts not related to OD (⑥) | Posts that do not match ①–⑤ and do not mention ODs | ||
•Orthostatic Dysregulation, Out Door cans for camping, Olive Drab for color, etc., are also classified in this category because they do not indicate overdose | |||
Description of medication type | Extract a wide range of information that is analogous to the name of the drug itself (e.g., Restamin®), abbreviations and slang for the drug name (e.g., RETASU, RURUNA), cryptic words for the drug name (e.g., RE*SU, BU**N, * indicates that the word has been redacted by the user.), type of drug (e.g., cold medicine, sleeping pills), descriptions regarding prescription drugs and over-the-counter drug categories, and so on. |
残りの投稿についても研究者1名(薬学生)がアノテーションを行い,ラベルの付与されたデータセットを用いて解析を行った.薬の種類や名称については,アノテーションと同時に自由記述として収集した.収集したツイートに対して,ラベル分類に応じた週毎の投稿数,時間帯毎の投稿数を算出した.「①ODをしている投稿」のラベルが付与された投稿のうち,薬に関する記載があったものについて,記述された医薬品を類推する語句を集計し,全体数と言い換え表現の各語数を集計し,比較した.
3. 自然言語処理技術を用いた分類器の作成自然言語処理技術を用いて,収集した投稿データのODに関する投稿を分類する分類器の構築を試みた.本研究では,深層学習手法の一つであり,文脈を考慮した分散表現を獲得できるbidirectional encoder representations from transformers(BERT)を用いることとし,日本語版Wikipediaコーパスを用いて訓練した東北大学 乾・鈴木研究室の事前学習済みBERT15)を用いた.前述のデータセットを使用して,BERTモデルのファインチューニングを行った.MeCabを用いてテキストを形態素解析した後にWordPieceによってトークンに分割し,文頭に[CLS]トークン,文と文の間に[SEP]トークンを加えたものをBERTに入力した.各種訓練パラメータはバッチサイズ16,エポック数10,学習率5.0×10−5とし,Hold-out法を用いた.活性化関数にはGELU関数,損失関数には交差エントロピー関数(cross entropy loss),最適化関数にはAdamWを用いた.
方法2節でアノテーションしたデータセットのうち,80%をファインチューニング,10%をバリデーション,10%をテストに使用し,ノイズフィルター:(1),(2)ODに関連する投稿/(3)ODに関する記載のない投稿を分類する分類器と,過量服薬投稿検出器:(1)ODに直接関連する投稿/(2)ODに直接関連しない投稿を分類する2つの分類器を構築した(Fig. 1).投稿分類を2段階とする2段階パイプラインが,分類の精度向上に有用である先行研究に従い,16)本研究でも1段階目で過量服薬を意味するオーバードーズと無関係な「OD」という単語を含む投稿を除去し,2段階目の分類の精度向上を見込んだ.
モデルの性能評価には,二値分類の主要評価指標としてF1 Scoreを,副次評価指標として適合率(Precision)と再現率(Recall)を用いた.F1 Scoreは分類器の予測精度の総合的な指標として一般的であるため,主要評価項目として用いた.適合率は,モデルが正と予測したデータのうち実際に正である割合を示し,再現率は,実際に正であるデータのうちモデルが正と予測した割合を示す.F1 Scoreは適合率(Precision)と再現率(Recall)の調和平均であり,適合率(Precision),再現率(Recall),F1 Scoreはそれぞれ以下の数式で表される.
![]() | (1) |
![]() | (2) |
![]() | (3) |
本研究は,ユーザーのアカウントが特定可能な情報(ユーザーID,ユーザー名,アカウント名)を符号化したデータセットを用いており,個人情報には十分に配慮して実施された.本研究は慶應義塾大学薬学部「人を対象とする研究倫理委員会」の承認を得て行われた(承240313-2).
「OD」という単語を含む,解析対象の投稿30203件のうち,日本語以外の言語で記載されているもの,本人が記述していない投稿223件を除外し,最終的に29980件の投稿データにラベルが付与された.アノテーションの一致度に関して,全体の重みづけをした際のκ係数は0.81であった.また,それぞれのラベルについてκ係数を算出した結果をTable 2に示す.「①ODをしている投稿」はκ=0.81,「⑥ ①–⑤に該当しないもの」の投稿はκ=0.94と,いずれも評価者間での高い一致度を示した.一方で,②ODをしていた投稿のκ係数は0.33と,評価者間で評価が分かれた.①–③を「ODに直接関連している投稿」としてグルーピングし,κ係数を算出したところ,κ=0.86であった.付与されたラベル毎の投稿数をTable 3に示す.「⑥ ①–⑤に該当しないもの」が最も多く,29980件のうち20835件(69.5%)を占めていた.ついで,「①ODをしている投稿」が5283件(17.6%),「④ODの記載があるその他の投稿」2824件(9.4%)であった.投稿時間別の集計をFig. 2に示す(⑥非該当を除く).ODに関連する投稿数は午後5時から午後10時にかけて増加し,午前1時から午前6時にかけて減少していた.
①Posts describing ODing | ②Posts describing having been ODing | ③Posts describing trying to OD | ④Other posts with OD topics mentioned | ⑤Posts with non-medication-related OD | ⑥Posts not related to OD | |
---|---|---|---|---|---|---|
κ coefficient | 0.81 | 0.33 | 0.62 | 0.62 | 0.39 | 0.94 |
0.86 |
Label | Number of posts | Proportion [%] |
---|---|---|
①Posts describing ODing | 5283 | 17.6 |
②Posts describing having been ODing | 152 | 0.5 |
③Posts describing trying to OD | 524 | 1.7 |
④Other posts with OD topics mentioned | 2824 | 9.4 |
⑤Posts with non-medication-related OD | 362 | 1.2 |
⑥Posts not related to OD | 20835 | 69.5 |
「①ODをしている投稿」のラベルが付与された投稿の内容の一部をTable 4に示す.ODの症状の有無に関連する記載だけでなく,ODをやめたいという気持ち(「ODやめなきゃなのにブロンもメジコンも買っちゃった」),ODに伴う感情の吐露(「だれかにはなしきいてほしいけどはなせる友達いない,みじめだな,ODしてねます」)など,ODという行動そのものだけでなく,投稿者の感情表現が含まれる投稿内容が散見された.
Category | Description of specific posts |
---|---|
With symptoms after ODing | •As for the KIN-PAB, it’s probably a good idea to administer 5–10 t when I don’t have any drugs but want to OD on a weekday. It contains acetaminophen, so it’s more about the satisfaction of taking it than about the effect. |
•It’s great to listen to loud, loud enough to destroy my ears, hollow electronic music while I am ODing and becoming high. | |
No symptoms after ODing | •I couldn’t feel better after ODing |
•Bron OD is not working. It’s frustrating… | |
Feelings of wanting to stop ODing | •I need to stop ODing, but I bought both Bron and Medicon. |
•I feel like, you know when I take ten or more pills a day, I feel like the pills are keeping me alive, you know what I mean? That’s why I try to abstain from drugs and fail in the end, or I try to take the drugs I like and OD…I really think that if I take so many drugs, I’d rather die. | |
Emotional disclosure associated with OD | •I want someone to talk to, but I don’t have any friends I can talk to; I’m so miserable that I’m going to OD and go to bed. |
•I haven’t cut my wrist in 3 months. I hope I can OD on Depas and Silece and sleep:![]() |
「①ODをしている投稿」のラベルが付与された投稿5283件に対し,医薬品名やそれに類する表現の記述が含まれる投稿は1543件であった.得られた医薬品名等の表現のうち,15件以上認められたものをTable 5に示す.医薬品名そのもののほか,略語や隠語などが多く認められた.要指導医薬品や一般用医薬品,いわゆる市販薬と類推されるものが多数を占める一方,医療用医薬品,とりわけ第2類,第3類向精神薬に関する記述も認められた.薬効などの分類のみの記載(睡眠薬・眠剤,市販薬,風邪薬,安定剤など)も複数認められた.
Ingredients | Type of medication | Number of posts | Expressions similar to drug names (e.g., abbreviations, cryptic words, etc.) | Number of cases |
---|---|---|---|---|
Cough syrup A (dihydrocodeine phosphate, guaifenesin, chlorpheniramine maleate, caffeine anhydrous) Cough tablet A (Dihydrocodeine phosphate, dl-methylephedrine hydrochloride, chlorpheniramine maleate, L-carbocysteine/caffeine anhydrous) | OTC | 245 | ブロン ぶろん ブロロン ブロソ Others | 229 5 2 3 6 |
Cough tablet B (dextromethorphan hydrobromide hydrate) | OTC | 227 | メジコン メジ めじ めじこん フデコー Others | 177 26 10 5 4 5 |
Sleeping pills (details unknown) | NA | 183 | 眠剤 睡眠薬 Others | 134 47 2 |
Diphenhydramine hydrochloride | Both | 130 | レタス レスタミン れたす Others | 85 38 4 3 |
Etizolam | Prescribed medication | 65 | デパス デパ Other | 62 2 1 |
Over-the-counter drugs (details unknown) | OTC | 58 | 市販薬 Other | 57 1 |
Cold medication C (acetaminophen, ibuprofen, L-carbocisteine, ambroxol hydrochloride, pseudoephedrine hydrochloride, dihydrocodeine phosphate, chlorpheniramine maleate, riboflavin, etc.) | OTC | 57 | 金パブ パブロン パブ Others | 47 4 2 4 |
Flunitrazepam | Prescribed medication | 45 | サイレース フルニトラゼパム ロヒプノール Others | 28 13 2 2 |
Cold medication D (acetaminophen, tranexamic acid, dl-methylephedrine hydrochloride, caffeine anhydrous, dextromethorphan hydrobromide hydrate, bromhexine vindicative, clemastine fumarate, belladonna total alkaloid) | OTC | 37 | ルル 新ルル Others | 32 3 2 |
Tranquilizer (details unknown) | NA | 32 | 安定剤 | 32 |
Prescribed medication (details unknown) | Prescribed medication | 29 | 処方薬 | 29 |
Cold medication (details unknown) | NA | 29 | 風邪薬 Other | 28 1 |
Rescue medication (details unknown) | NA | 27 | 頓服 | 27 |
Pregabalin | Prescribed medication | 25 | リリカ プレガバリン りりか Other | 19 3 2 1 |
Loxoprofen | Both | 24 | ロキソニン ロキソ | 21 3 |
Cold medication E (Ibuprofen, dl-methylephedrine hydrochloride, caffeine anhydrous, dextromethorphan hydrobromide hydrate, isopropamide iodide, d-chlorpheniramine maleate, etc.) | OTC | 21 | コンタック コンタ | 19 2 |
Analgesics F (ibuprofen, caffeine anhydrous, allylisopropylacetylurea, etc.) | OTC | 20 | イブ イブクイック EVE いぶ Eve | 9 3 3 2 2 |
Psychotropic (details unknown) | Prescribed medication | 19 | 向精神薬 | 19 |
Tranquilizer G (bromvaleril urea, allylisopropylacetylurea, diphenhydramine hydrochloride) | OTC | 18 | ウット | 18 |
Zolpidem | Prescribed medication | 18 | マイスリー ゾルピデム | 15 3 |
Bromazepam | Prescribed medication | 16 | レキソタン ブロナゼパム Other | 13 2 1 |
Alprazolam | Prescribed medication | 15 | ソラナックス アルプラゾラム Other | 7 7 1 |
Analgesics (details unknown) | NA | 15 | 痛み止め 鎮痛剤 | 8 7 |
OTC: Over-the-counter drugs, NA: not applicable.
①–⑥までのラベルが付与された29980件の投稿について,ノイズフィルター:①–⑤のODに関連する投稿と⑥の投稿を分類するものと,過量服薬投稿検出器:①–③のODに直接関連する投稿と,④–⑤のODに直接関連しない投稿を分類するものを,事前学習済みBERTを用いて構築した.アノテーション済みの投稿29980件のうち,80%にあたる23986件を訓練用,10%にあたる2997件をバリデーション,残り10%の2997件をテストに使用した.ノイズフィルターではF1 score 0.95,Precision 0.93,Recall 0.97,過量服薬投稿検出器ではF1 score 0.85,Precision 0.82,Recall 0.87と,いずれも精度よく分類可能であった(Table 6).
Precision | Recall | F1 score | |
---|---|---|---|
Noise filter | 0.93 | 0.97 | 0.95 |
Overdose detector | 0.82 | 0.87 | 0.85 |
本研究では,わが国の若年層において高い普及率を示すTwitter®(現X®)を用いて,医薬品の意図的な過量服薬であるODに関連する投稿を抽出し,自然言語処理技術を用いて解析することによって,ODの実態把握におけるSNSの利用可能性について検討した.その結果,SNSの投稿に基づいて,受診を要さないより軽症の事例や,これからODをしようとしている・過去にODをしていたとする,いわゆるODハイリスク群による投稿を精度よく抽出することが可能であった.これは,精神科や救急病院等の受診状況に基づいて把握する従来の手法と比して,ODによる健康被害が軽度,あるいはOD予備軍と考えられる層の特徴を明らかにすることが可能であった.本研究は,わが国におけるODの実態把握を,SNSを用いて行った初めての研究であり,ODの未然防止等に有用な知見である.
ODに関連する投稿内容「①ODをしている投稿」の内容には,ODの実行や症状の有無だけでなく,ODに伴う感情の揺れ動きが推察される記述が認められた(Table 4).市販薬の乱用動機として,友人や知人からのすすめや多幸感を期待することが報告されている一方で,ストレスや生きづらさへのコーピングが含まれることも知られており,5)これらはベンゾジアゼピン系薬などの処方薬の乱用・依存理由とも類似している.「誰かに話を聞いてほしい」といった感情の揺れ動きは,生きづらさへのコーピングからのODを想起させるものであり,このようなODに伴う感情に関連する投稿も「ODをしている」として分類可能であることは,ODハイリスクケースを抽出するうえで重要であると考える.
ODに関連する投稿件数の日内変動時間帯によっても投稿数に変動が認められ,特に夜間,深夜帯に投稿件数が増加する傾向があった.元来,Twitter®の投稿頻度には内容によらず日内変動があることが知られており,養老らの研究では,日本語の文字が含まれるTwitter®投稿4ヵ月分の解析結果により,投稿総数は午後10時台に最大となり,午前0時から4時にかけては投稿数が減少,午前5時台に昼間の一定割合に戻ることが示されている.17) Figure 2の「①ODをしている投稿」とラベルが付与された投稿は,先行研究同様午後10時に投稿数のピークがあるものの,午後11時–午前1時頃までは件数が高止まりしており,先行研究とは異なっていた.Twitter®投稿をデータソースとして用いた海外の研究では,感情語の出現頻度は日内変動があり,ネガティブ感情は早朝に最も低く夜にピークに達するとする結果や,18)不眠に関するネガティブな内容の投稿について,深夜に行われる確率がそれ以外の時間帯と比較して21%高いとする報告もあり,19) ODというネガティブな感情に起因すると示唆される行為についての投稿が深夜に増加することを支持する根拠となっている.また,過量服薬によって救急搬送された症例237件の検討では,推定服薬時刻は夜間に多い傾向が認められており,本研究結果のOD関連投稿が深夜に多いことと矛盾しない.20)また,「④ODの記載があるその他の投稿」とラベルが付与された投稿についてのみ,朝9時に上昇傾向が認められた.投稿内容を限定しない先行研究の解析では,朝9時台と12時台にも投稿件数のピークを迎えており,17) ODに関する注意喚起やODに関する言及のみを示す投稿内容が主の④は,より一般的な内容に類似した変動パターンを示したものと考えられる.
投稿された医薬品等の特徴「①ODをしている投稿」とラベルが付与された投稿5283件のうち,医薬品名やそれに類する表現が含まれる投稿は1543件であり,「①ODをしている投稿」の約1/3が医薬品名等を伴う投稿であることが明らかとなった.なかでも市販薬の名称とそれに類する表現を含む投稿数が多く,市販薬の過量服薬が増加している現状を反映しているものと考える.3,4,21)有効成分では,コデインやデキストロメトルファン,エフェドリン,ジフェンヒドラミンを含有する製品が多く認められた.これらの大半は前述の「濫用等のおそれのある医薬品」として,購入者の氏名・年齢確認や購入状況の確認を必要とする医薬品であるにもかかわらずODの対象薬として名前が挙がっていることは,購入者がなんらかの手段で確認をすり抜けている,あるいはインターネット等での販売・授受が行われている可能性が考えられる.市販薬濫用に関するシステマティックレビューでは,デキストロメトルファンやコデイン類は陶酔作用,エフェドリンは興奮作用,ジフェンヒドラミンを始めとする抗ヒスタミン薬は鎮静作用や睡眠の改善を目的に使用されることが多く,またこれらの濫用は薬物関連の死亡などの潜在的なリスクとなっていることが示唆されており,22)特にこれらの成分に関するODは健康被害を生じるリスクが高いと考えられる.また,これらの市販薬の濫用はその後の違法薬物の乱用とも関連しているとの報告もあることから,23)市販薬の濫用の段階で対策を講じることは非常に重要である.
医療用医薬品では,エチゾラム,フルニトラゼパムなどのベンゾジアゼピン系薬,プレガバリン,ロキソプロフェン等を含む投稿が多く認められた.わが国における疫学研究では,薬物過量服薬で入院した患者のうち,19–49歳の患者の60%以上が過量服薬のエピソードの前90日以内にベンゾジアゼピン系薬の処方を受けており,24)これらの医薬品の使用群で過量服薬のリスクが高いものと考えられる.
市販薬,医療用医薬品いずれも,医薬品名そのもののほか,「メジ」「デパ」のような略称や,「金パブ」「レタス」のような隠語が多く使用されていた.これはSNS,特にTwitter®のようなマイクロブログの場合,投稿文字数が140字に制限されていることにより,短縮した語句が好んで用いられることにも起因していると考えられる.また,Twitter®で薬物,特に俗称や隠語が使用される場合は,不適切使用等に関連している場合があるとする報告もあり,25) OD関連投稿に俗称や隠語が多く含まれている本研究結果と一致していた.
自然言語処理手法を用いた分類器の構築本研究では,Twitter®のODに関する投稿をルールベースで抽出,そこから事前学習済みBERTを用いて,①–③のODに直接関連する投稿と④–⑤のそれ以外に分類する分類器を構築した.本研究で使用した事前学習済みBERTは前後の文脈を考慮可能なモデルであり,2018年に登場して以降,様々な分野で高い性能を示している.26)自然言語処理技術をSNS投稿に用いた例として,Twitter®やヘルスケア関連SNSから副作用疑い事例を抽出した先行研究においては,抽出性能を示すF1 scoreは0.5–0.7であった.27–29)本研究と同様に,事前学習済みBERTを使用し,日本語で記述されたツイートを対象に医薬品の不適正使用を抽出した研究では,全体でのF1 scoreは0.72であったと報告されている.30)本研究で構築した分類器のF1 scoreはそれぞれ0.95と0.85であり,対象が副作用とODに関する内容とで異なるものの,比較的良好な性能であったと考えられる.先行研究と比較して良好な性能であった要因としては,本研究では前述の通りルールベースでODに関する投稿を抽出し,そのデータセットに対して分類器を適用しており,ある程度均質化されたデータを対象にしていることが考えられる.
一方で,自然言語処理技術を用いた分類には誤分類の懸念がある.ここでは,ノイズフィルター・過量服薬投稿検出器によって正しいラベルが付与されなかったテキストに関してエラーアナリシスを行った.ノイズフィルターによる分類結果が偽陽性となったケースは69件あり,その多くはオーバードーズ(過量服薬)を意味しないODという語を含む投稿(「オーバードライブはODって言う癖がついてるので今後はそう書きます」「OD MTDの落書きでも描こうか」等)であった.これはBERTが文脈を誤って読み取った結果,ODをオーバードーズの略称と認識し,偽陽性になったことが示唆される.ノイズフィルターによる分類結果が偽陰性となったケースは24件あり,その多くは文字数が極端に多い,又は極端に少ない投稿であった.また,過量服薬投稿検出器による分類結果が偽陽性となったケースは116件あり,医薬品以外の過剰・過量摂取の比喩表現としてODという単語を使っている投稿(例えば「豆ODすると一袋食べてしまって明日のお腹が大変なことになりそうですなあ…」)が多くみられた.これらは,文脈上も医薬品のODと区別するのが難しいことから偽陽性となったことが考えられる.過量服薬投稿検出器による分類結果が偽陰性となったケースは75件あり,ノイズフィルターと同様,その多くは文字数が極端に多い又は少ない投稿であった.
本研究にはいくつかの限界が存在する.約30000件の投稿をルールベース(「OD」を含む,日本語で行われた投稿)で抽出し,解析対象としているが,「OD」以外の語句(「オーバードーズ」など)を用いて過量服薬を表現した投稿が存在することから,過量服薬に関連する投稿数を過小評価している可能性がある.さらに,虚偽の記載など投稿の真偽を判定することは困難である.また,解析対象期間は約1ヵ月間であり,季節変動や長期休暇,社会的イベントなどの外的要因を評価するのには数ヵ月–年単位での観察期間の延長が望ましいと考えられる.また,今回用いたアノテーションガイドラインにおいて,2名の評価者による評価の一致度を示すκ係数は,全体の重みづけをした場合に0.81と高い一致度を示したが,②ODをしていた投稿のκ係数は0.33と,観察者間で評価が分かれた項目が存在した.一方で,過量服薬投稿検出器で用いた,①–③のODに直接関連する投稿をグルーピングした場合のκ係数は0.86であり,高い一致度が得られた.
本研究では,マイクロブログ型SNSであるTwitter®からODに関連する投稿を抽出し,自然言語処理技術を用いて解析を行った.市販薬や処方薬のODの防止のためには,モニタリングの強化と社会的認知の向上が不可欠であるが,従来の手法では,過量服薬による救急搬送や入院などをアウトカムとする,比較的重症度の高い症例を把握できるのみであった.本手法を用いることにより,潜在的な濫用者を含む,ODのより幅広い実態を把握することが可能となった.
本研究はJSPS科研費JP21H03170の助成を受けたものです.
開示すべき利益相反はない.