農林業問題研究
Online ISSN : 2185-9973
Print ISSN : 0388-8525
ISSN-L : 0388-8525
個別報告論文
ECサイトのレビューデータに基づいた牛肉の部位別消費者評価の特徴
服部 明彦加藤 弘祐山本 淳子
著者情報
ジャーナル フリー HTML

2022 年 58 巻 3 号 p. 141-148

詳細
Abstract

This study aimed to explore consumer evaluations of beef by part, including its by-products. To achieve this, we analyzed online product reviews on Rakuten Ichiba (a major e-commerce site) from 2016 to 2019. We applied text mining analyses to these data in three stages: extraction of frequent words in the whole beef review to capture the overall characteristics; grouping of parts by correspondence analysis; and extraction of words that characterize each part to consider similarities and differences among parts or groups of parts. We found that for post-purchase evaluation criteria and consumption practices, several parts had some similarities, but there were also differences among several other parts and groups. Therefore, to further understand the needs of the consumer and promote the sales of beef, it would be advisable to consider the characteristics of each group of parts and each part individually.

1. はじめに

近年,牛肉の輸入量が増加傾向にある一方,国内産地においてもブランド化等の取り組みが進められ,消費者は多様な牛肉を選択できる状況になってきている.このような中では,牛肉に対する消費者ニーズも多様化していると考えられ,その的確な把握が重要になっている.これまでの牛肉に対する消費者意識や購買行動に関する代表的な研究としては,長命・広岡(2016)金他(2001)などがあり,これらによって牛肉購買時には赤身の多さ,見た目,部位,ブランドなどが重視されることが明らかになっている.また,引地他(2012)などによって地域・年齢などの消費者属性によって嗜好性が異なることが明らかにされている.更に,BSEの発生を受け,牛肉の安全性に対する消費者意識・購買行動,購買価格への影響を分析した研究(合崎他,2004)や,近年関心が高まっているアニマルウェルフェアをテーマにした研究(志賀他,2020)なども行われている.

しかし,これらの先行研究は,モモなどの主要部位を対象としているか,部位を特定せず牛肉全般を対象としたものがほとんどである.これは,我が国において,これまでモモやバラなどを中心に牛肉が消費されてきた(農畜産業振興機構,2013)ことによると考えられるが,近年では,本稿で分析対象とするEC(Electronic Commerce;電子商取引)サイト等において,後述のように副産物を含む多様な部位が販売されるようになってきている.さらに2020年以降のコロナ禍では,外出自粛や飲食店への休業要請に伴う業務用需要の低減による小売需要の高まりを背景に,牛肉の販売戦略として「低級部位や切り落としを増やす」ことを重視する小売業者の割合が高まっている(農畜産業振興機構,2021).一方,戴・矢野(2017)では,多くの副産物は消費者の認知度や購買頻度がいまだ低いことも示されている.

これらのことから,牛肉の消費者ニーズの把握には,副産物を含めた多数の部位に着目し,部位別の消費者評価に接近することがより重要になってきていると考えられる.複数部位に着目した研究としては細野他(2013)の部位別需要関数推定が挙げられるが,分析対象は主要部位のみであり,消費者評価も取り扱われていない.

また,牛肉の消費者ニーズの把握には,購買後評価の分析を通した接近が有効であろう1.購買者による多くの商品レビューが投稿されているECサイトは,コロナ禍も相まってますます重要な販売チャネルとして捉えられると同時に,そこでの商品レビューデータは,購買後評価に接近するための研究対象としても適している.なお,農産物に関するECサイトの商品レビューの分析には竹崎他(2016)があり,野菜を対象にテキストマイニングの分析手続きを検討する中で出現率の高い語を明らかにしているが,牛肉の商品レビューの分析はこれまで行われていない.

そこで本稿では,牛肉の部位別の消費者評価を明らかにすることを目的とし,購買後評価の分析に適したデータであるECサイトの商品レビューを用いてテキストマイニングを行う.以下では,まず,分析方法について説明した上で,大手ECサイトとして大量のレビューが蓄積されている楽天市場のデータについてテキストマイニングを行う.具体的には,まず牛肉の商品レビュー全体を対象に頻出語を抽出し,全体的な特徴を捉える.次に,対応分析により部位のグルーピングを行った上で,各部位の特徴語を抽出し,部位グループ間あるいは部位間の共通性や差異を検討する.このように,テキストマイニングを段階的に適用することで,牛肉全般,部位のグループ,各部位間という解像度の異なる三つの段階から,牛肉に対する消費者評価の特徴を明らかにする.

2. 方法

(1) データ

分析に用いたデータに関しては,大手ECサイトである楽天市場の商品レビューデータ(楽天グループ株式会社,2020)を,国立情報学研究所のIDRデータセット提供サービスを通じて取得した2.本レビューデータは,購買者による商品レビューテキストに出品者が設定する商品ジャンルなどの情報が紐づけられており3,牛肉カテゴリの商品にはサーロインなどといった部位がジャンルとして設定されている4.そのため,牛肉カテゴリに含まれるレビューデータを利用することにより,部位別の消費者評価への接近が可能である.分析対象期間は2016年から2019年までの4年間とした.総レビュー件数は127,500件であり,これらレビューの対象となった商品の販売元店舗は1,270種類であった.ただし,牛肉カテゴリには「セット・詰め合わせ」と「その他」の2ジャンルも含まれている.本稿は部位別の消費者評価を明らかにすることを目的としているため,以下の分析ではこれら2ジャンルは除外し,その他の18ジャンルのレビューデータ(レビュー件数81,909件5,レビュー対象となった商品の販売元店舗は938種類)を分析対象とした.

1に,牛肉のジャンル(部位)と各ジャンルのレビュー件数を示した6.部位によってレビュー件数は異なるものの,先行研究では分析外となることの多い副産物に対するレビューが一定数存在している.したがって,本レビューデータは,多数の部位に対する消費者評価の把握に適していると考えられる.

表1. ジャンル(部位)別レビュー件数
ジャンル レビュー件数
タン(副) 16,888
ホルモン(副) 11,816
バラ・カルビ 11,650
モモ 9,921
サーロイン 7,253
肩ロース 6,417
リブロース 4,433
ハラミ(副) 4,280
ヒレ・シャトーブリアン 2,637
ランプ 1,661
みすじ 1,400
レバー(副) 1,373
スネ 1,199
テール(副) 346
ミノ(副) 245
ギアラ・赤センマイ(副) 136
ハチノス(副) 134
ハツ(副) 120
81,909

資料:楽天グループ株式会社(2020)をもとに筆者作成.

1)「セット・詰め合わせ」,「その他」の2ジャンルについては計上していない.

2)副産物については,部位名の右に「(副)」を付した.

(2) 分析方法

分析には,テキストマイニングツールであるKHコーダー(樋口,2014)を利用した.まず,前処理として,文章を単語へと分かち書きする形態素解析によりレビューテキストを処理し,単語を抽出する7.次に,レビュー全体において出現回数の多い語(頻出語)を抽出し,その特徴を確認するとともに,以降の分析における視点として,購買後評価の基準と消費場面に着目することを示す.続いて,レビューデータのジャンル(部位)数が18と多いため,対応分析(Correspondence Analysis)を行い,レビュー内における頻出語と部位の関係性に基づく2次元散布図から,類似性の高い部位のグルーピングを行う.さらに,Jaccard係数を用いて,部位ごとに特徴的な単語(特徴語)を抽出し8,得られた結果をもとに,購買後評価の基準や消費場面に関して,部位グループ間及び部位間の共通性や差異を検討する.

3. 分析結果

(1) 牛肉の商品レビューの特徴

2は,分析対象の牛肉レビュー文全体において頻出する上位30語を列挙したものである.これら30語を,竹崎他(2016)を参考に各抽出語が表す内容に即して分類すると,品質に関する語(「美味しい」,「良い」,「味」,「柔らかい」,「脂」),量に関する語(「多い」,「量」),値段に関する語(「値段」,「安い」)の他,喫食方法(「焼く」,「すき焼き」,「ステーキ」),喫食者(「家族」),感情(「思う」,「満足」,「喜ぶ」),注文・配送関連(「購入」,「リピート」,「注文」,「買う」,「届く」),その他に分類できる.

表2. 牛肉の商品レビューデータから抽出された上位30語
順位 抽出語 (種類) 品詞 出現回数 順位 抽出語 (種類) 品詞 出現回数
1 美味しい 品質 形容詞 43,313 16 喜ぶ 感情 動詞 7,340
2 食べる その他 動詞 35,191 17 家族 喫食者 名詞 6,972
3 その他 名詞C 31,528 18 タン その他 人名 6,607
4 購入 注文配送 サ変名詞 25,703 19 商品 その他 名詞 6,151
5 思う 感情 動詞 21,836 20 今回 その他 副詞可能 5,645
6 良い 品質 形容詞 12,985 21 品質 名詞C 5,357
7 品質 名詞C 12,971 22 値段 値段 名詞 5,301
8 柔らかい 品質 形容詞 11,622 23 安い 値段 形容詞 5,017
9 その他 名詞C 11,112 24 頂く その他 動詞 4,966
10 リピート 注文配送 未知語 10,834 25 多い 形容詞 4,964
11 注文 注文配送 サ変名詞 8,608 26 大変 その他 形容動詞 4,958
12 満足 感情 サ変名詞 8,558 27 少し その他 副詞 4,584
13 買う 注文配送 動詞 8,379 28 すき焼き 喫食方法 名詞 4,574
14 焼く 喫食方法 動詞 8,312 29 ステーキ 喫食方法 名詞 4,553
15 届く 注文配送 動詞 7,804 30 名詞C 4,390

資料:分析結果より筆者作成.

1)名詞Cは漢字1文字の名詞,副詞可能は副詞としても解釈可能な名詞を意味する.

2)「種類」は,竹崎他(2016)の分類を参考に「品質」「量」「値段」「喫食方法」「喫食者」「感情」「注文配送」「その他」に分類したものである.

3)MeCabによる形態素解析により抽出された語を記載しており,品詞は茶筌(IPADIC)の品詞体系に準じる.

4)「リピート」と「リピ」は同義語として,「リピート」に統一した.

これらのうち品質(味,食感,脂),量,値段は,購買後評価の際に消費者が何に着目しているか(重視しているか)という,購買後評価の基準を示していると考えられる.さらに,喫食方法と喫食者からは消費場面が想定されるが,消費場面(誰がいつどのように食べるか)は購買後評価とも密接に関連していると考えられる.そこで以降では,購買後評価の基準と,喫食方法・喫食者を中心とする消費場面に特に注目して分析を進める.なお,これらの語は名詞と形容詞が多い傾向にあるため,以降では抽出語のうち名詞と形容詞に限定して対応分析,特徴語抽出を行う.

(2) 部位のグルーピング

対応分析の結果は図1に示した通りである.図より,各部位に対して関係性の近い各々の抽出語が確認できる.また,分析結果に対してk-means法によるクラスタリング9を行い,部位と抽出語を図のように5つのグループに分割した.グループ1に属する部位はサーロイン,リブロース,ヒレ・シャトーブリアン,ランプであり,このグループ内に布置された語は「ステーキ」,「ビーフ」,「赤身」である.グループ2に属する部位はバラ・カルビ,肩ロース,であり,このグループ内に布置された語は「すき焼き」,「焼肉」,「硬い」である.グループ3に属する部位はテール,ホルモン,ギアラ・赤センマイ,ハチノスであり,このグループ内に布置された語は「臭み」である.そして,グループ3に属する部位はモモ,みすじ,スネ,ハラミ,タン,レバー,ハツ,ミノであり,このグループ内には「美味しい」,「柔らかい」,「家族」などの多くの語が布置されている.

図1.

対応分析の結果

資料:分析結果より筆者作成.

1)ジャンルを外部変数として組み込んでおり,それらは▲で示している.

2)横軸は第1成分(イナーシャの寄与率50.72%),縦軸は第2成分(同18.07%)である.

なお,部位はこれら4つのグループに分類され,グループ5には2つの抽出語「スープ」,「ホルモン」のみが布置されている.

(3) 部位別の特徴語

3は,部位毎にJaccard係数が大きな上位10語を表したものである.まず,グループ1に属する部位においては,購買後評価の基準と考えられる語として多くの部位で「柔らかい」,「赤身」,「脂身」,量に関する語(「大きい」,「多い」,「少ない」)が抽出されている.また,喫食方法を表していると考えられる語としては,全ての部位で「ステーキ」が抽出されており,複数部位において「ロースト」が抽出されている.そしてサーロイン,リブロースにおいては,喫食者を表していると考えられる「家族」が抽出されている.

表3. 部位別の特徴語(上位10語)
グループ1 サーロイン ①ステーキ(.131)②サーロイン(.072)③柔らかい(.067)④脂身(.047)⑤大きい(.045)⑥家族(.044)⑦多い(.043)⑧ビーフ(.037)⑨赤身(.036)⑩薄い(.033)
リブロース ①ステーキ(.108)②赤身(.060)③柔らかい(.053)④美味しい(.052)⑤ビーフ(.051)⑥ロースト(.041)⑦脂身(.040)⑧大きい(.039)⑨家族(.036)⑩多い(.033)
ヒレ・シャトーブリアン ①ヒレ(.169)②ステーキ(.068)③柔らかい(.063)④美味しい(.032)⑤赤身(.031)⑥良い(.029)⑦感じ(.024)⑦値段(.024)⑨最高(.021)⑨サシ(.021)
ランプ ①赤身(.066)②ランプ(.062)③ステーキ(.057)④ビーフ(.055)⑤ロースト(.048)⑥柔らかい(.032)⑦脂身(.028)⑧少ない(.023)⑨硬い(.022)⑩サイコロ(.021)
グループ2 バラ・カルビ ①良い(.085)②すき焼き(.079)③多い(.077)④脂身(.073)⑤値段(.061)⑥カルビ(.057)⑦安い(.054)⑧商品(.052)⑨焼肉(.050)⑩小分け(.045)
肩ロース ①すき焼き(.143)②美味しい(.073)③柔らかい(.058)④良い(.056)⑤家族(.052)⑥霜降り(.038)⑥商品(.038)⑧牛肉(.033)⑨脂身(.032)⑩大きい(.030)
グループ3 テール ①テール(.438)②スープ(.075)③圧力(.025)④トマト(.021)⑤脂肪(.020)⑥関節(.017)⑦抜き(.016)⑧写真(.015)⑧灰汁(.015)⑩シチュー(.014)
ホルモン ①美味しい(.145)①ホルモン(.145)③スープ(.125)④臭み(.074)⑤野菜(.066)⑥安い(.054)⑦醤油(.050)⑧少ない(.041)⑨味噌(.040)⑩最高(.038)
ギアラ・赤センマイ ①煮込み(.038)②トマト(.018)②効果(.018)④内臓(.016)④下ごしらえ(.016)⑥作り方(.014)⑦好物(.012)⑧弾力(.011)⑧病みつき(.011)⑩同時(.010)
ハチノス ①トマト(.100)②酢味噌(.036)③黒い(.028)④煮込み(.023)⑤青い(.022)⑥圧力(.021)⑥香味(.021)⑧ハーブ(.019)⑧生姜(.019)⑩手間(.017)
グループ4 モモ ①すき焼き(.097)②ビーフ(.080)②ロースト(.080)④良い(.079)⑤柔らかい(.076)⑥赤身(.069)⑦家族(.057)⑧値段(.043)⑨脂身(.033)⑩霜降り(.029)
みすじ ①ロースト(.032)②ポイント(.030)②スジ(.030)④すき焼き(.029)④セール(.029)⑥ビーフ(.028)⑦歳暮(.026)⑧スーパー(.023)⑨半額(.022)⑩両親(.021)
スネ ①シチュー(.086)②煮込み(.083)③カレー(.050)④スジ(.049)⑤圧力(.041)⑥ご飯(.035)⑦ビーフ(.025)⑧レトルト(.024)⑨濃い(.022)⑨常温(.022)
ハラミ ①タレ(.097)②柔らかい(.074)③小分け(.047)④焼肉(.042)④良い(.042)⑥値段(.037)⑦子供(.035)⑧バーベキュー(.034)⑨安い(.033)⑩濃い(.029)
タン ①柔らかい(.090)②家族(.069)③厚い(.064)④安い(.053)④厚み(.053)⑥商品(.052)⑦硬い(.046)⑧大きい(.036)⑨子供(.033)⑩固い(.030)
レバー ①レバー(.246)②責任(.092)③自己(.091)④鮮度(.060)⑤ごま油(.058)⑥臭み(.050)⑦甘い(.039)⑧バニラ2)(.035)⑨久しぶり(.027)⑩薄皮(.026)
ハツ ①カロリー(.040)②塩水(.037)③胡麻(.020)④ごま油(.019)⑤抜き(.018)⑥氷水(.017)⑥水分(.017)⑧心臓(.016)⑧アイデア(.016)⑧ビタミン(.016)
ミノ ①切り目3)(.033)②タレ(.013)③サンド4)(.012)④歯ごたえ(.010)⑤焼肉(.009)⑤肉屋(.009)⑤国産(.009)⑧大きめ(.008)⑧咲き(.008)⑧気遣い(.008)

資料:分析結果より筆者作成.

1)表中の( )内はJaccard係数(小数点の前の0は省略),○付きの数字はジャンル内でのJaccard係数の順位である.

2)形態素解析により「ㇾ」と「バニラ」に分割されたが,元レビューは全て「レバニラ」である.

3)「切り目」と「切れ目」は同義語として「切り目」に統一した.

4)元レビューを参照した結果,「ミノサンド」(希少部位)に関する記述が中心であった.

グループ2に属する2つの部位ついては,購買後評価の基準と考えられる語として,脂に関する語(「脂身」,「霜降り」)や量に関する語(「多い」,「大きい」)が抽出されている,喫食方法を表していると考えられる「すき焼き」が抽出されているなどの共通点がある.また,バラ・カルビにおいては喫食方法を表していると考えられる「焼肉」,肩ロースにおいては購買後評価の基準と考えられる「柔らかい」などの語も抽出されている.さらに,肩ロースにおいては,喫食者を表していると考えられる語である「家族」も抽出されている.

グループ3においては,購買後評価の基準と考えられる語として「脂肪」(テール),「臭み」(ホルモン),「弾力」(ギアラ・赤センマイ),「手間」(ハチノス)などの多様な語が抽出されている.喫食方法に関係すると考えられる語ついては,「スープ」(テール,ホルモン),「トマト」(テール,ギアラ・赤センマイ,ハチノス)のように複数部位で共通するものも抽出されているが,「シチュー」(テール),「野菜」,「醤油」,「味噌」(ホルモン),「煮込み」(ギアラ・赤センマイ),「酢味噌」(ハチノス)のように単独部位でのみ抽出されている語も多い.なお,このグループに属する部位においては,喫食者を表していると考えられる語が抽出されていない.

そして,グループ4においては,購買後評価の基準と考えられる「柔らかい」(モモ,ハラミ,タン),「すき焼き」「ロースト」(モモ,みすじ)や喫食方法に関係すると考えられる「ごま油」(レバー,ハツ),「タレ」(ハラミ,ミノ)などが複数部位で抽出されている.しかし,購買後評価の基準と考えられる「赤身」,「脂身」,「霜降り」(モモ),「厚い(み)」,「硬(固)い」(タン),「鮮度」「臭み」(レバー),「切り目」,「(ミノ)サンド」,「歯ごたえ」(ミノ)や,喫食方法を表していると考えられる「シチュー」,「カレー」(スネ),「焼肉」,「バーベキュー」(ハラミ),「(レ)バニラ」(レバー)のように単独部位でのみ抽出されている語も多く,特に副産物においては多様な語が抽出されている傾向にある.また,喫食者を表していると考えられる語として,「家族」(モモ,タン),「子供」(ハラミ,タン)が抽出されたほか,みすじで「歳暮」,「両親」,「中元」という消費場面に関わる語が抽出されている.なお,ミノにおいては上位4語以外の全ての特徴語がJaccard係数0.01未満であり,関連度が高いといえる語があまり抽出できなかった.

4. まとめと考察

以上の結果から,本稿において明らかになった点,及びそれを踏まえて指摘できる点は次の通りである.

第一に,牛肉レビュー全体としては,品質(味,食感,脂),量,値段,喫食方法,喫食者,感情,注文・配送などに関する語が頻出していることが明らかになった.また,これらのうち品質,量,値段は商品の評価基準になっていると推察されるが,これは,店舗での一般的な購入時を想定した新山他(2007)佐々木他(2018)の指摘と共通している.そのため,ECサイトでの購入においても,評価基準は一般的な購入時と基本的に同様であることが指摘できる.さらにこの点は,本稿におけるECサイトでの購入を対象とした部位別の分析結果が,一般的な購入時にも適用できる可能性を示すものであるが,その検証は今後の課題として残されている.

第二に,レビューの類似性から牛肉の部位は4グループに分割することができた.各グループの特徴を整理すると,まずグループ1にはサーロインやリブロース等が属しており,主にステーキやローストビーフとして食べられていると考えられることから,高級部位が属すると考えられる.また,購買後評価の基準が各部位で類似する傾向があり,柔らかさ,赤身や脂(身)の量などが重要な評価基準になっていると考えられる.

グループ2にはバラ・カルビと肩ロースが属しているが,このうちバラと肩ロースは,戴・矢野(2017)の調査結果において示されている26部位の中で,「よく買う」または「買う」回答とした消費者の割合が最も高くなっている.したがってグループ2は,購入頻度の高い部位であると位置づけられる.また,これら2部位は脂(身)の量が購買後評価の基準となっている,すき焼きとして食べられているといった共通点があると考えられる.

グループ3には副産物4部位が属している.このうち3部位(テール,センマイ・赤センマイ,ハチノス)は,戴・矢野(2017)において当該部位を「知らない」と回答した消費者の割合が相対的に高いことから,グループ3には認知度が低い副産物が属しているといえる.また,購買後評価の基準については全ての部位に独自のものが見られ,さらに喫食方法や合わせる食材などについても,スープ,トマトなど一部共通するものがある一方で,全ての部位において独自の食べ方があることが推察される.

そして,グループ4には副産物を含む8部位が属している.戴・矢野(2017)の調査結果からは,この8部位は概ね,認知度は低くないが,グループ2に属する部位ほどは購入頻度が高くない傾向を持つことが指摘できる.また,このグループ内の複数の部位は,他グループ同様柔らかさが購買後評価の基準となっていると考えられる一方,独自の評価基準があると考えられる部位も存在する.喫食方法についても同様に,複数部位においてすき焼き,ローストビーフとして食べられていることなどが推察される一方,それぞれ独自の食べ方があることも示唆された.

以上のように,評価基準や喫食方法について共通性が見られるグループがある一方,一部にはグループ内でも独自の評価基準や喫食方法がとられる場合もあった.この結果を踏まえると,今後さらに牛肉のニーズ把握を進めていく際には,グループ単位での把握と個々の部位ごとの把握を組み合わせる必要があると考えられる,特にグループ3及び4に属する部位に関しては,個別に行うことが重要であるといえる.

なお,喫食者や消費場面については,グループ1,2及び4に属する複数部位において,家族で消費されることなどが示唆される一方,本研究では明らかにならなかった部位も多くあり,この点は今後の課題としたい.

第三に,ECサイトでの消費拡大には,本稿で示したグループ別・部位別の特徴を踏まえた対応が有効である可能性がある.すなわち,各部位の評価基準となるポイントを商品ラベルなどによって伝える,一緒に食べられることの多い食材やおすすめの調味料などをセットで販売する等が挙げられるが,この点の検証も今後の課題である.

その他に残された課題としては,消費者属性の違いによる部位別消費者評価の違いや,部位別の観点から見た購買行動や価格などに影響を与える要因へのアプローチが挙げられる.また,コロナ禍後の牛肉消費の変化や,購買後の評価基準が高低いずれの評価に結びついているか,購買後評価と消費場面との関係についても分析を進める必要がある.これらについては別データを取り入れつつ,分析の拡張を展望したい.

謝辞

本研究では,国立情報学研究所のIDRデータセット提供サービスにより楽天グループ株式会社から提供を受けた「楽天データセット」(https://rit.rakuten.com/data_release/)を利用した.

1  例えば大橋他(2018)では,畜産物の再購買には,対象ブランド畜産物への愛着等に加えて食味が影響することが示されており,ここからも購買(喫食)後評価の重要性がうかがえる.

2  本レビューデータにおいては,誹謗中傷的なコメントは運営側で削除されており,未購入のレビューも含まれていない.

3  レビューデータに紐づけられているのはレビュー文の他に,商品に対する評価ポイント(5段階のレーティング),商品ジャンル(部位ジャンル),商品の使い道,商品購入の目的,頻度(「はじめて」または「リピート」)である.この内,評価ポイントとジャンル以外は購入者による任意回答の項目であるため,本研究では取り扱わないこととした.

4  商品カテゴリは階層構造となっており,牛肉カテゴリは,グルメ・飲料/食品/精肉・肉加工品に属している.本稿ではこの牛肉カテゴリに含まれるデータを取り扱っている.

5  本研究で分析対象としたレビュー全体における評価ポイントの内訳は,5が49,722件(60.7%),4が18,300件(22.3%),3が6,368件(7.8%),2が3,158件(3.9%),1が4,361件(5.3%)である.

6  全国食肉公正取引協議会(2019)を参考に,ハツ,レバー,ミノ,ギアラ・赤センマイ,ハラミ,タン,テール,ハチノス,ホルモンを副産物とした.

7  形態素解析についてもKHコーダーの機能を利用しており,ツールとしてMecabを設定している.

8  単語Aと部位Xの結びつきの強さを表すJaccard係数は,以下の式によって算出される.ただし,Aは単語Aを含むレビューの,Xは部位Xのレビューの集合とする.

  

Jaccard=AXAX

Jaccard係数を用いることで,全体のレビューでの登場頻度を考慮した上で各部位に特徴的な単語を定量的に抽出できる.

9  任意で設定したクラスター数の下,各データとクラスター重心との距離に基づき適切なクラスターを検出するアルゴリズムであり,非階層クラスター分析の代表的手法となっている.本稿では,Pythonの機械学習ライブラリscikit-learn中のsklearn.cluster.KMeansクラスを用いた.また,本稿ではクラスター数を5に設定し,それ以外のパラメータはデフォルト値のまま用いている.

引用文献
 
© 2022 地域農林経済学会
feedback
Top