本論では,国内宿泊予約サイトの口コミ情報をもとに,顧客のサービスに対する期待値を推定する方法を提案する。その基本的な考え方は,期待値に関連したキーワードを口コミ情報から抜き出し,前後の文章とそのサービスに対する評価値を照合させることで,顧客がもつ期待値を推定しようというものである。東横INNとアパホテルのビジネスホテルチェーンを対象に期待値を推定した結果,前者は後者に比べ,多くの要素において期待値が低いことが明らかになった。また,本論が提案する推定法は従来の方法に比べ,チェーン間の期待値の差やサービス知覚品質が明確に現れる可能性が示された。
Parasuraman, Zeithaml, and Berry(1985)は,顧客が知覚するサービス品質(以下,サービスの知覚品質)が,サービスの評価値1)(P)から期待値(E)を減じたギャップ値(P-E)によって表現されるという基本的アイデアを示した。このアイデアを基に彼らは,評価値と期待値を測定するためのSERVQUAL尺度を開発した(Parasuraman, Zeithaml, & Berry, 1988)。
SERVQUALは,今やサービス品質を測る上での代表的な尺度となっているが,学術的批判も後を絶たない(e.g., Babakus & Boller, 1992;Iacobucci, Grayson, & Omstrom, 1994;Asubonteng, McCleary, & Swan, 1996;Buttle, 1996;Robinson, 1999)。その批判の矛先は,“ギャップ理論”そのものにも向けられる。Cronin and Taylor(1992)は,評価値だけを用いたSERVPERF尺度を提案し,サービス品質に対する説明力はSERVQUAL尺度を用いた場合よりもむしろ大きかったと報告している。この期待値を考慮しても説明力が上がらない現象は,Babakus and Boller(1992),Brown, Churchill, and Peter(1993),Crompton and Love(1995),Yüksel and Rimmington(1998)やJain and Gupta(2004)からも報告されている。
SERVQUAL尺度の説明力が大きくないことの背景には,少なくとも2つの問題が潜んでいると考えられる。ひとつは,算術的な差分値を得ることで,測定尺度の信頼性が低下する問題である(Peter, Churchill, & Brown, 1993;Dyke, Kappelman, & Prybutok, 1997)。この点に関しては,算術的な差分値に代わり,「期待値を大幅に上回った(下回った)」等の評価軸を用いて差分そのものを測定すること(Brown et al., 1993;Mei, Dean, & White, 1999;Yi & La, 2004)によって,ある程度の改善ができることが報告されている2)。
もうひとつの問題は,期待値の弁別性である3)。期待値はもともと,さまざまな意味が内包された複合的な概念であり,Santos and Boote(2003)によれば,その定義の数は少なくとも56にも及ぶという。こうした多義性をふまえれば,顧客自身が期待値を正しく計量することなどほぼ不可能であるし(Caruana, Ewing, & Ramaseshan, 2000;Souca, 2011),仮に計量できたとしても,その分散は期待値に関する解釈の多義性を単に反映したものになりかねない(Teas, 1993)。このような理由を背景に,期待値の測定を顧客の直接評価に求めてきたことがSERVQUAL尺度の妥当性を低下させ,さらにはそれがサービス品質への説明力の低下につながってきた可能性が指摘されてきた(Spreng & Olshavsky, 1992;Iacobucci et al., 1994;Dyke et al., 1997)。そこで本論では,顧客の直接評価を用いない代替案として,口コミ情報を活用したサービス期待値の推定法を提案する。
調査対象としてホテルチェーンを選定した。その主な理由は,宿泊予約サイトが発達しており,口コミ情報が比較的豊富に蓄積されていることである。さらに,ホテルサービスには,主要機能がシンプルで顧客もそれに精通していること(Boulding, Kalra, Staelin, & Zeithaml, 1993)や,利用からかなり時間が経過した後になっても想起が容易である(上原,2009)等の利点もある。本論では特に,国内のホテルチェーン出軒数で2位の東横INN(以下,東横と略)と,3位のアパホテルズ&リゾーツ(以下,APAと略)に着目した。両チェーンは立地,ターゲットとする顧客,宿泊料金等の点で強い競合関係にあり,類似したサービスの弁別性を検討するための対象として適している。一方で出軒数で1位のルートインホテルズは,高速道路のインターチェンジ等の隣接型展開が特徴的であり,上記チェーンとは提供しているサービス内容がやや異なると考えられるため,対象から外した。
なお,SERVQUAL尺度は,対人サービスを重視するあまり,設備や施設等の有形的な要因を軽視しているとの指摘がある(Fick & Ritchie, 1991;Mels, Boshoff, & Nel, 1997)。松尾・奥瀬・プラート(2001)は,ホテルサービスを有形性と非有形性とに分けた上で,前者の方がサービスの全体評価に強い影響を与えていたことを指摘している。本論が対象とするビジネスホテルにおいても,顧客が手厚いサービスを受ける機会は多くなく,SERVQUAL尺度のようにサービスの下位次元を仔細に調査することにはあまり意味がないと思われる。そこで本論では,ホテルのサービス品質を構成する要素がサービス(接客等)のみではなく,立地,部屋,設備・アメニティ,風呂,食事にもあると考える(これら6つの要素を採用する事情は後述する)。したがって,本論が提案するサービスの期待値の考え方はSERVQUALモデルに依拠するものの,その下位次元(信頼性,反応性,確実性,共感性,有形性)までをも踏襲するものではない。
2.2 基礎データ期待値を推定するためのデータソースとして,大手旅行代理店の楽天株式会社が運営する宿泊予約サイト・楽天トラベル(https://travel.rakuten.co.jp/)に記載された「お客様の声」を使用した。このサイトには,各宿泊施設に対する先の6つの要素(サービス,立地,部屋,設備・アメニティ,風呂,食事)に関する顧客評価が5段階で集められており,さらに自由記述でコメントが加えられるようになっている。これらのデータを,東横とAPAの全軒(「お客様の声」が1件も掲載されていない軒は除く)を対象に,2019年10月から11月にかけて自動プログラムを用いて収集した。その後,6要素の評価が開始されていなかった2009年春以前のデータを除外し,最終的に東横63,976件(258軒),APA 104,594件(204軒)の基礎データを得た。
2.3 期待値の推定方法ある顧客が,ホテルの利用後に「サービスが思ったより良かった」とコメントし,サービスに対する評価として5点満点中4点を与えていたとしよう。ここで,サービスが“思ったより”良かったと述べていたということは,この顧客がサービスを受ける前に想定していたサービスレベル(期待値)は,4点以下だったと推定できる。反対に,別の顧客が「サービスが想像以上にひどかった」とコメントし,サービスに2点の評価を与えていたとしたら,この顧客の期待値は2点以上だったと考えることができる。これらの情報から判断すれば,このホテルのサービスに対する期待値は,2点から4点の間に存在していたといえるだろう。このように,期待値に関連したキーワードが含まれた顧客からの口コミを一定数集めることで,当該ホテルに対する期待値を推定できると考える。以下,その具体的手順を示す。
(1) 評価用データセットの作成得られた口コミ(テキストデータ)を形態素解析にかけ4),顧客の期待値に関連するキーワードの前後の文章を抽出した。使用したキーワードは「思った以上(思う以上)/思ったより(思うより)/思っていたより(思ってたより)/思っていた以上(思ってた以上)/思っているより(思ってるより)/思っている以上(思ってる以上)/思いのほか(思いの外,思いの他)/考えていたより(考えてたより)/思っていたほど(思ってたほど,思ったほど)/意外/案外/期待/想像/想定/予想/びっくり(ビックリ)/驚く〈活用形〉/信じる〈活用形〉/考えられない/ショック/あり得ない(ありえない)」である。抽出の結果,のべ数で東横4,870件,APA 7,860件の文章が抽出された。
(2) 要素との対応付け上述で抽出された文章が,サービス,立地,部屋,設備・アメニティ,風呂,食事のどれに該当する内容か(あるいは,どれにも該当しないか),またそれは期待値を上回ることを示す内容か下回る内容か(あるいは,どちらでもないか)を,筆者を含めた3名の日本人が独立に判定した。その後,3人の判定を突き合わせ,2人以上が同一の判断をした判定のみを期待値の推定に使用した。この手続きを経て得られた各要素の該当数(期待値を上回るまたは下回る文章の合計数)は,サービス,立地,部屋,設備・アメニティ,風呂,食事の順でそれぞれ,676,329,1015,291,159,1324件(東横),1040,482,1919,640,1095,915件(APA)となった。
(3) 期待値の推定要素ごとに期待値を下回る口コミと上回る口コミで2つの群に分け,顧客評価の基礎統計量(平均値,標準偏差)を得た。これらをもとに,次式によって要素ごとの期待値を推定した(2つの群の標準偏差が同じであった場合は,期待値は群平均同士の平均値となる)。
(1) |
xL,xH:期待値を下回る/上回るコメント群における要素の平均値
sL,sH:期待値を下回る/上回るコメント群における要素の標準偏差
(4) 結果得られた期待値の推定結果を,図1にまとめた。APAの顧客は東横のそれに比べ,サービス,設備・アメニティ,風呂,食事の要素において顕著に高い期待値をもつことが示された。
本論の推定法に基づく期待値推定結果
本論が提案する期待値推定法の有効性を検討するために,直接評価に基づく期待値との比較を試みる。この基礎データは,2020年3月に国内調査会社を経由して収集した。具体的には,両ホテルチェーンを過去1年以内に利用しかつホテルで食事をとった(食事に対する評価を含むため)という条件でスクリーニングを行い,その該当者に対してインターネット調査を依頼する形で300サンプルを入手した。期待値の測定に使用する項目は,上記目的やJCSI(日本版顧客満足度指数)調査で使用された項目(小野,2016)を参考に,「東横インでは,優れた立地が期待できる」等のシンプルなものとした。図2は,測定された期待値の平均値5)を示したものである。
直接評価に基づく期待値推定結果
要素ごとに比較すると,本論の推定法(図1)と直接評価(図2)の結果には,際立った差異はないように見受けられる。しかし,チェーン間の期待値の差に着目すると,サービス,設備・アメニティ,風呂,食事の要素において,本論が提案する推定法の方が直接評価よりも顕著に表れた(APAの方が東横よりも期待値が高かった)。口コミを1件1件読み込んだ筆者の主観的判断を交えて述べるならば,この大きな差についてはある程度の蓋然性が認められる。たとえば,サービス面については,東横では同チェーンの有料会員にならないと16時までチェックインが出来ず,部屋の準備が出来ているにも関わらずロビーで待たされたり,仕方なく会員になったとの不満の声が目立った。これは,15時チェックインが通常のビジネスホテルに比べ,サービスに対する期待値を大きく下げた内容だといえよう。設備・アメニティや風呂については,APAの店舗の多くで大浴場や露天風呂の完備を売りにしていることが,期待値を上げたと考えられる。食事についても,APAでは有料で提供していることに対し,東横は朝食無料を謡っていること(無料であれば,高い期待値はもちにくいはずである)が影響したのであろう。
冒頭でも触れたように,期待値の測定には今もなお技術的課題があり,どちらの測定方法がより正確に期待値を測定できているかを判断する方法はない。しかし,これらの蓋然性をふまえるとき,少なくとも異なったサービスプロバイダ同士の期待値の弁別性に関しては,本論が提案する推定法の方が,従前の方法よりも優れている可能性があるといえるだろう。
3.2 サービス知覚品質を通じた評価サービスの知覚品質が,評価値と期待値のギャップで表現されるならば,顧客の期待値が全般的に高かったAPAは東横に比べ,より高いレベルのサービスを提供しなければ,サービスの知覚品質は相対的に低くなってしまうはずである。図3は,このサービスの知覚品質に相当する,全口コミの要素別評価値(平均値)から本論で推定した期待値を減じたギャップ値について示したものである。想定されたように,いくつの要素において,期待値が全般的に低い東横の方が,サービスの知覚品質ではAPAを上回るという逆転現象が生じていた。
本論の推定法に基づくサービス知覚品質
続いて,同様のサービス知覚品質を直接評価で測定した場合の結果を,図4に示した(図3との比較ができるように,縦軸の縮尺は同じものを用いた)。ここで評価値とは,「東横インの立地は,優れていた」等の項目を用いて,3.1節で実施した調査と同時に測定した値の平均値6)である。図3と図4を比較すると,直接評価では本論が提案する方法に比べ,小さなギャップ値しか現れないことが明白である。このように,直接評価では回答者のわずかな認識の差をもってサービスの知覚品質が判定されるために,回答者には期待値に対するとりわけ厳密な評価が求められる。しかし,既に述べたように,期待値は複合的な概念のため厳密な評価はもともと難しく,回答者の解釈や小さな揺れによってサービスの知覚品質が大きく変化することになる。これに対して本論が提案する推定法は,回答者の直接評価に基づいていないがゆえに,より明確なギャップ値の抽出を可能にしたと考えられる。
直接評価に基づくサービス知覚品質
今回調査対象とした2つのホテルチェーンは,顧客の期待値に対して好対照といえる方針の違いをみせている。それを示す端的な例は,部屋のアップグレードである。予約した部屋よりも上位の部屋が空いていた場合,フロントの裁量で差額料金の支払いなしに宿泊を許可することは,APAでは日常的に行われているようだが,東横では例外的にしか行われていない(それを示す口コミ件数は極めて少ない)。東横がこれを良しとしないのは,アップグレードを一度経験した顧客が,次回の利用時に「ひょっとしたら今回もアップグレードを経験できるのでは」と期待値を上げ,それによって知覚される品質(ギャップ値)を下げてしまうことを恐れているからではないかと推察される。この“100点を狙わないが,70点は確実に獲る”ことを目指す東横の戦略は,本論の分析結果をみる限り,十分に機能しているように見受けられる。
上記の例が示すように,長期的な企業成果をもたらす上では,サービス提供品質の向上を目指すことだけが唯一の策だとは思われない。企業が活用できるリソースが有限だとすれば,その費用対効果を念頭においた上で,重点投資すべき要素を発見することが肝要となろう(Rust, Zahorik, & Keiningham, 1995;Zeithaml, 2000)。この最善ではなく“最適な”サービス提供のあり方を考える上で,期待値の推定は重要な役割を担っている。言うまでもなく,本論で採用した期待値の推定方法は大胆なもので,学術的な妥当性や信頼性については解決されるべき課題が多く残されているが7),従前の期待値の測定方法に重大な懸念(Carman, 1990;Fick & Ritchie, 1991;Babakus & Boller, 1992;Brown et al., 1993;Teas, 1993;Iacobucci et al., 1994;Buttle, 1996;Dyke et al., 1997;Robinson, 1999)が寄せられている以上,顧客の直接評価に基づかない方法で期待値を推定する本論の新たな提案は,この分野の研究の進展に一役買う可能性があると信じている。
期待値の正確な測定は,サービスマネジメントの効率化に向けた悲願ともいえる課題である。この分野を切り拓くためには,これまでの前例に囚われない試みが求められよう。本論がその試みのひとつと評されることを願ってやまない。
本論は,科学研究費補助金(基盤研究B:18H00884)による研究成果の一部である。