2025 年 3 巻 1 号 p. 2-9
【目的】X上の「仕事」と「腰痛」に関する投稿を探索的に分析し,それらの傾向や特徴を把握し,職場環境改善・腰痛対策への応用可能性を検討することとした.
【方法】2023年4月~5月に取得した「仕事 and 腰痛」を含むツイート2,850件を対象とし,テキストマイニングソフトウェアを用いて分析を行った.
【結果】自己組織化マップでは8つのクラスターが抽出され,職場関連や腹痛や肩こりなどの複数の症状に関する言及がネガティブ表現とともに多く共起した.
【結論】SNS上の「仕事」と「腰痛」投稿から,腰痛を含む身体的負担が就業継続に影響し得る状況が示唆された.労働衛生施策や早期介入への活用が考えられる一方,短期データや投稿者属性の不明確さなどの限界を踏まえ,今後はより多面的かつ長期的な検討が望まれる.
Objective: This study aimed to conduct an exploratory analysis of posts on X (formerly Twitter) concerning both “work” and “low back pain,” thereby clarifying trends and characteristics in order to examine potential applications for workplace environment improvements and low back pain countermeasures.
Methods: Using 2,850 tweets containing the keywords “work and low back pain” obtained from April to May 2023, we conducted analyses with text mining software.
Results: A self-organizing map identified eight clusters, revealing frequent co-occurrences of references to multiple symptoms such as abdominal pain or shoulder stiffness along with negative expressions related to workplace matters.
Conclusion: Posts on X concerning both “work” and “low back pain” suggest that physical burdens, including low back pain, may affect continued employment. Although these findings may inform occupational health policies and early interventions, limitations such as the short data collection period and lack of user attribute information indicate a need for more extensive and long-term investigations.
現代では,スマートフォンなどのモバイル端末を所有している世帯は全体の97.3 % にも上るとされている1).同時にソーシャルネットワークサービス(以下,SNS)は広く普及し社会基盤の一翼を担うようになった2).これら情報端末とSNSの拡大に伴い,SNS上の大規模データをマイクロブログと呼び,これを使用した研究が盛んに行われている.例として,X(旧Twitter)のツイートデータを使用し,Naslundら3)はSNSと自殺及び抑うつ症状のリスクに対して言及し,宮部ら4)は東日本大震災後のX利用についての傾向分析を行っている.また,経済産業省においても2017年にSNSのつぶやきから鉱工業生産予測指数を算出するといった統計調査指標の試みが行われており5),ツイートデータは貴重な社会調査資源であるといえる.
これらXに投稿される記事はツイート(現ポスト)と呼ばれ,140文字までという制限があり,Xのデータはユーザがプライベートモードを選択しない限り,誰でもアクセス可能なオープンデータとしてインターネット上に公開される.また,FacebookやInstagramと比較して,Xは公開アカウントが多く投稿の取得制限が緩やかである点と1投稿あたりの文字数が短く,多頻度で発信されるため,リアルタイム分析や探索的研究に向いているとされる6).この点が他のSNSとは異なり,大規模なデータ解析を行う際の利便性に優れており,計量テキスト分析などの手法による分析がなされている.また,これらはいずれもSakakiら7)が提案しているソーシャルセンサという考え方に依拠している.Xのような大規模なソーシャルメディアにおけるユーザをセンサとして考えると,ユーザが投稿するツイートはセンサからの出力,すなわち,Xに投稿されたコンテンツから社会そのもので何が起きているか,何が求められているのかを把握することが可能であるとされている8).
すでに精神保健分野では,X上のデータからメンタルヘルスを予測するプログラムの開発や抑うつ症状の早期検出システムなどの研究が行われている9,10).しかしながら,その他の予防医療分野に限っては上記のようなシステム開発を行っている研究は皆無である.加えて,厚生労働省では2023年4月より第14次労働災害防止計画が公布され,「安全衛生対策は,ウィズ・コロナ,ポスト・コロナ社会も見据え,また,DX(デジタルトランスフォーメーション)の進展も踏まえ,労働者の理解・協力を得ながら,プライバシー等の配慮やその有用性を評価しつつ,ウェアラブル端末,VR(バーチャル・リアリティ)やAI等の活用を図る等,就業形態の変化はもとより,価値観の多様化に対応するものでなければならない」11)と明記されており,今後は労働衛生対策と情報科学の他分野横断的な研究の必要性が生じているといえる.
令和5年(2023年)の労働災害発生状況においては,「動作の反動・無理な動作」による腰痛等の死傷者数が転倒に続き第2位となっており12),産業衛生の観点から腰痛予防の重要性が指摘されている.Layneら13)によれば,労働者の転倒は55歳以上の男性に多く発生すると報告されているが,一方で腰痛等の死傷者数は全ての年齢層に広く蔓延する問題であるとされている14).これはXの利用者分布とも合致することから,本研究では腰痛に焦点を当てることとした.また,腰痛予防においては患者への正しい知識の伝達が効果的である15,16)とされる一方,患者側がどの程度腰痛に関する知識を有しているのか,あるいはどのような解決策を求めているのかについての基礎的情報は十分に検討されていない.
そこで本研究の目的は,社会調査の対象として広く用いられているX上のツイートを対象に「仕事」と「腰痛」というキーワードを含む投稿を抽出し,それらとともにつぶやかれているテキストを探索的に分析して,仕事と腰痛に関する傾向や特徴を把握することである.加えて,分析結果をもとに職場環境改善・腰痛対策への応用可能性を検討することとした.分析手法においては,分析者の恣意的な介入を極力排除することを意図し,CorrelationalアプローチとDictionary-basedアプローチを統合した分析枠組みを採用した17).ツイート抽出におけるキーワードの設定は,Sarkerら18)やRobertら19)を参考として,日常会話やSNS上で職務や就業状況に関する言及を行う際に最も一般的かつ頻度の高い表現であると考えられる「仕事」と「腰痛」とした.
本研究はXのツイートを分析対象としたが,現在はポストと称される.
2.データセット対象となるデータは,2023年4月25日~2023年5月15日までの期間に投稿されたツイートデータをX社のX API v2(Application Programming Interface)をPython(Ver.3.9.16)20)を使用して,「仕事 and 腰痛」のキーワードを含むツイートを執筆者が取得した.その後,データ内に含まれるノイズデータを削除し,2,850ツイートを本研究の分析対象とした.なお,本研究はすでに匿名化された公開データを使用する研究のため,倫理委員会より委員会への付議を要さないと判断され実施した.
3.ソフトウェア本研究では,得られたツイートデータのテキスト集合に対し,計量テキスト分析を行うこととした.計量テキスト分析は主に,自然言語処理とデータマイニングの技術が用いられており,本研究ではこれをテキストマイニングと称し実施した.今回,テキストマイニングソフトウェアであるKH Coder3(Beta.01)21)を使用した.KH Coder3内には形態素解析エンジンとしてMeCab22)が搭載されており,テキストの形態素解析はMeCabを使用した.
4.抽出語の分析形態素解析によって抽出された語に対して,各語間の特徴を抽出すべく,Ward法23)による自己組織化マップ(Self-organizing map:以下SOM)24),クラスターの頻出語リストの作成,コーディングルールの作成,コーディングルールを使用した傾向分析,共起分析を行った.また,分析に使用した係数はJaccard係数25)とした.このJaccard係数は0~1の値を取り0.2以上で強い関連ありとされるため26),Jaccard係数が0.2以上となる語を抽出した.なお,本分析において全ての集計単位は「段落」,傾向把握には100語程度が必要とされている点から最少出現語数を30以上とし,150語を抽出した27).品詞による取捨選択は既定値を用い,クラスター数は併合水準を確認し8とした.さらに,SOMでは各語の距離測定にはユーグリッド距離を用い,学習回数は1,000回,ノード数は20とした.
2,850のツイートのデータに対して,形態素解析を行った結果,総抽出語数142,005語,異なり語数が11,888語抽出され,これらを分析対象とした.
2.SOMSOMの結果を図1に示す.また,各ユニットの距離を可視化する目的でunitary matrix法(以下,U-matrix法)を表したものを図2に示す.SOMでは8つのクラスターにそれぞれの特徴語が格納された.

枠内の数字はクラスター番号を表す.

枠内の数字はクラスター番号を表す.
SOMにて抽出したクラスターごとの頻出語を表1に示す.各クラスターの最頻出語は,クラスター1が「多い」,クラスター2が「悪化」,クラスター3が「腰」,クラスター4が「仕事」および「腰痛」,クラスター5が「明日」,クラスター6が「終わる」,クラスター7が「頭痛」,クラスター8が「筋肉」であった.
また,クラスター2では「出勤」「動ける」「悪化」「戦う」などが含まれ,クラスター3には「職場」「辞める」「全然」「大丈夫」「負担」「原因」「考える」が含まれていた.クラスター4では「腰痛」「腹痛」「病院」「行く」「仕事」「働く」「辛い」などが含まれ,クラスター5では「風邪」「薬」「肩こり」「ストレス」「ぎっくり腰」「コルセット」などが併出する結果であった.クラスター6では,「元気」「軽い」「整体」「マッサージ」「ストレッチ」「改善」「楽しい」「治す」などが含まれていた.
これら頻出語をもとに表2のコーディングルールを作成した.
数字は語の出現回数を表す.
4.コーディングルールを使用した共起分析表2のコーディングルールを使用し,それぞれの関係性を表すネットワーク図を図3に示す.さらに,各コードの類似度行列を表3に示す.ネットワーク図では,職場関連の出現数が最も多く,次いで症状関連,ネガティブ関連の順となっていた.加えて,諸症状やネガティブ表現,職場関連語が強く共起しており,ネガティブ表現の頻度がポジティブ表現を上回り,腰痛や肩こりなど複数の症状を併せて訴える投稿が多い結果であった.
コード無し=出現数; 62, 割合; 2.1%

Coefficient; Jaccard係数を表す.
Frequency; コードの頻度を表す.
数値はJaccard係数を表す.
本研究では,「仕事」と「腰痛」をキーワードに抽出したツイートデータを対象に,SOMおよびコーディングルールを用いた傾向分析・共起分析を行った.その結果,SOMでは8つのクラスターに特徴的な単語が配置され,クラスターごとに異なる文脈が見られた.SOMはKohonenが考案した人工ニューラルネットワークであり28),高次元データの類似度を可視化できる点が特長とされる29).U-matrixでは近傍ノードとの距離を色調で示し,距離の大きいノードは他のクラスターと特徴が異なる可能性があると推測される30).図2ではクラスター1,7,8が他クラスターと隔たりが大きい領域に配置され,特定の利用者による連続的な投稿で構成された可能性が示唆された.
クラスター分析の結果,抽出されたクラスターの一部について,以下のような特徴が確認された.クラスター2は,「出勤」「動ける」「悪化」「戦う」といった語彙を特徴とし,腰痛を抱えながらも就労や活動を継続しようとする状況や,それに伴う症状の悪化,痛みへの対処といった内容を含む投稿群と考えられた.
クラスター3には,「職場」「辞める」「全然」「大丈夫」「負担」「原因」「考える」などが含まれていた.このクラスターは,腰痛が職場での負担となり,その原因考察や退職の検討に至る投稿と,一方で「全然大丈夫」のように状況を肯定的に捉えようとしたり,負担を軽視したりする表現が混在する内容を反映していた.
クラスター4では,「腰痛」「腹痛」「病院」「行く」「仕事」「働く」「辛い」といった語彙が頻出した.腰痛のみならず腹痛など他の身体症状を伴うこと,医療機関への受診行動,そして就労継続の困難さに関する記述が目立つ投稿群であった.
クラスター5は,「風邪」「薬」「肩こり」「ストレス」「ぎっくり腰」「コルセット」などの語彙が共起する特徴が見られた.これは,風邪や肩こりといった他の日常的な不調やストレス,急性腰痛(ぎっくり腰)が腰痛と同時に発生・認識され,薬剤やコルセットなどを用いて対処している状況を示唆する内容であった.
クラスター6においては,「元気」「軽い」「整体」「マッサージ」「ストレッチ」「改善」「楽しい」「治す」といった語彙が特徴的であった.整体,マッサージ,ストレッチといった具体的な腰痛対策の実践,症状の改善や軽快感,治療や治癒に向けた比較的肯定的な意識や感情を含む投稿群と考えられた.
これらから,腰痛だけでなく複数の症状に悩みつつも仕事を継続している者や,腰痛の悪化によって退職を検討する例など,多様な状況が含まれていると考えられる.また,腰痛の程度が比較的軽度な場合は,マッサージや整体,ストレッチを対策として挙げるケースがあることが示唆された.
コーディングルールを用いた傾向分析からは,職場関連の語が最も多く,次いで症状関連,ネガティブ関連の順で出現が多かった.これは,同一ツイート内で「職場」「辞める」「休む」といった職場関連語と,「腰痛」「肩こり」「風邪」などの症状関連語,さらに「辛い」「痛い」「悪化」などのネガティブ語が併せて言及されている投稿が多いことを意味する.図3のネットワーク分析および表3の類似度行列でも,症状関連語を中心として職場関連語やネガティブ関連語が共起しやすいことが確認され,腰痛などの身体症状が職務継続に影響している投稿が一定数見受けられる点が示唆された.実際,Jaccard係数においても職場関連と症状関連の値が最も高く,次いで症状関連とネガティブ関連の順で高いことから,腰痛や他の症状による負担増大が職場離脱や休職の原因として語られる傾向がうかがえる.
加えて,本研究ではポジティブ表現(「改善」「治る」など)よりもネガティブ表現(「辛い」「痛い」など)の頻度が高かった.職場関連語と症状関連語の共起率が高い点や,腰痛をきっかけに退職を考える投稿の存在などからは,腰痛やその他の症状が悪化し,離職に至る事例が少なくない可能性が示された.ただし,データがSNS上の発信であることから,実際の離職数や症状悪化率との関連を直接的に証明するものではない点には留意が必要である.
一方で,Xの利用率は日本人口の約42.3 % という報告がある31).特に20代の利用率が高い点や32),職業性腰痛の発症が25~59歳に広く分布していることから33),本研究で得られた若年層への言及は先行研究34,35)と一部整合する可能性がある.しかしながら,本研究では性別や職種など投稿者個人の詳細属性を制限なく抽出しているため,これらのデータを直接的に一般化する際には対象者の属性不明確という制約を考慮する必要がある.
以上を踏まえ,今後の応用可能性として,これらの知見を参考に職場環境改善や労働衛生施策を検討する必要性が示唆される.たとえば,一部の投稿に腰痛の悪化や離職リスクについての言及があったことから,企業や行政が作業姿勢や休憩制度の改善,セルフケア指導など,腰痛予防に向けた対策を再検討する上での資料として活用できる可能性がある.さらに,SNSデータを用いたリアルタイムモニタリングや早期介入策として,ネガティブな言及が増加する時期を把握し,オンラインでセルフケア情報を提示したり,メンタルヘルス支援への導線を整備するといったデジタルヘルスケアの活用が期待される.
しかし,本研究にはいくつかの限界がある.第一に,SNSデータは投稿者属性が不明であるため,対象者の背景や実際の症状の程度が正確に反映されていない可能性がある.第二に,広告やbotなどノイズデータを除去したとはいえ,投稿内容自体が虚偽や誇張であるリスクを完全には排除できない36).こうした課題に対して,榊ら37)は大量のソーシャルセンサ情報と物理センサ情報を組み合わせる多変量解析手法を提案しており,今後はこうしたアプローチを適用してデータの信頼性や妥当性を高める必要があると考えられる.第三に,データ収集期間が比較的短期でゴールデンウィーク等の大型連休と重なっていたため,社会的つながりの変化や抑うつリスクの増減など,時期特有の要因が投稿傾向に影響を及ぼした可能性を否定できない38).今後は,より長期的かつ連続的な期間にわたるデータ収集や時期の比較分析を行うことで,一層高い信頼性をもった知見が得られると考えられる.
本研究の分析結果を総括すると,「仕事」と「腰痛」に言及するツイートでは,ネガティブ関連語がポジティブ関連語よりも高頻度で出現し,さらに腹痛や肩こりなどの症状関連語や「辞める」などの職場関連語が多く併出している傾向が示された.これにより,複数の症状に悩みながら仕事を続けている利用者が一定数存在し,中には退職や休職を検討しているような投稿も確認された.また,腰痛が比較的軽度な場合には,マッサージや整体,ストレッチなどの対処法に言及する投稿が見られた.
これらの知見に基づき,今後は本研究で得られた分析結果を基盤とした職場環境改善や労働衛生施策の検討を行うことで労働施策への助言等への応用が考えられる.腰痛の悪化や離職リスクについて言及する投稿がみられたことから,企業や行政が作業姿勢や休憩制度の改善,セルフケア指導など,腰痛予防に向けた対策を再検討する上での資料として活用できる可能性がある.さらに,SNSデータを用いたリアルタイムモニタリングや早期介入策も有力な手段となり得る.たとえば,ネガティブな言及が増加する時期を把握し,オンラインでセルフケア情報を提供したり,メンタルヘルス支援につながる導線を整備するといったデジタルヘルスケアの活用が期待される.
本研究において開示する利益相反はない.
本研究の遂行にあたり,格別のご助言とご支援を賜りました研究室の皆様に,心より深謝申し上げます.あわせて,本論文の査読ならびに編集をご担当いただきました査読・編集委員の皆様にも,厚く御礼申し上げます.