多様な製品が溢れる現在においては,自社の製品がターゲットとすべき消費者セグメントを明確にすることが重要である.全消費者のうちからターゲットとする消費者セグメントを特定するために,例えば「30代の男性会社員」などのようにターゲット属性を用いて特定することは常套手段の一つである.しかし,全消費者の消費者属性と趣味嗜好を含むデータがあれば分析的な観点からターゲット属性を特定できるが,そのようなデータを各企業が独自に収集することは膨大なコストがかかり現実的ではない.そのため,多種多様なサンプル消費者のWeb閲覧履歴や購買履歴を保有するコンサルティング企業に依頼する形で,サンプル消費者のデータ分析を通じてターゲットを特定することが一般的に行われている.特に,サンプル消費者のWeb閲覧履歴などの行動履歴データをクラスタリングし,ターゲットとして相応しいクラスタを特徴付ける属性(クラスタ属性)を発見する方法はよく用いられるアプローチの一つである.しかし,クラスタ属性はしばしばクラスタに所属するサンプル消費者の属性統計量などから分析者の判断によって付与されることが多い.その上,一つのクラスタに複数のクラスタ属性を想定しシナリオ別の施策が検討されるようなこともある.このような定性的な分析や判断が入る場合,クラスタ属性の選定は分析者の経験やスキルに強く依存してしまう.そのため,消費者嗜好が反映された過去のサンプル行動データのクラスタリング結果から,客観的な評価基準に基づいてクラスタ属性を特定可能な数理モデルがあれば,分析者の作業や施策検討を強力に支援できると考えられる.そこで本研究では,多様な趣味嗜好を含むWeb閲覧履歴からサンプル消費者をクラスタリングし,各クラスタに対して,ターゲットとして有効なクラスタ属性を付与するためのモデルを定式化する.さらに,与えられた目的関数に対して分析者の恣意的な部分を可能な限り取り除いた形でターゲット属性を探索する手法を提案する.最後に,実データを用いて提案手法の有効性を示す.
国内旅行情報サイトを分析対象として,ホテルの口コミに対してテキストマイニングを行い,口コミ内容とランキングとの関係を明らかにすることを目的とする.そのために,口コミの文章データに対してLDA(Latent Dirichlet Allocation)モデルに基づく潜在意味解析を行い,口コミ内容に関する変数(トピック指数)を作成した.そして,トピック指数を説明変数,ランキングを目的変数とする重回帰分析を行った.結果として,口コミデータから3つの内容(風呂・温泉,清潔さ,ウイルス感染対策,スタッフ対応,家族との食事)が抽出され,それを基に5つのトピック指数を作成した.そして,ランキングに対して,「ウイルス感染対策」「スタッフ対応」「家族との食事」のトピック指数が統計的に有意な正の影響があることを明らかにした.
As of Feb. 2021, COVID-19 is still spreading. To overcome this infectious disease, COVID-19 vaccines are being developed around the world. In Japan, inoculation of COVID-19 vaccines to people will be starting soon (as of Feb. 2021). However, desirable vaccination strategies are not clear. Therefore, we investigate the relationship between vaccination strategies and COVID-19 spreading using positive-case data in Japan. The method is SIRVD (Susceptible Infected Recovered Vaccination Death) model, which can represent vaccinated persons. Moreover, we discuss desirable vaccination strategies based on the results.