2021 Volume 40 Issue 3 Pages 31-44
クラウドソーシングを利用した製品開発によって,高い市場性をもつ製品が生み出されることが実証されている一方,収集した多量のユーザー創出アイデアを評価し,有望なものを選ぶことは大きな負担になっている。本研究では,自然言語処理を用いることによって,ユーザー創出アイデアの評価の機械化を行った。創造性研究に立脚して,クラウドから集めたアイデア全体から概念空間を構成し,そこでの出現頻度の少なさから意見の希少性を算出することで,独創性を機械的に測定する手法を構築した。レシピ投稿のデータに対して手法を適用したところ,機械的に測定された独創性は,レシピの有望性の説明に有効性を持つことが示された。本研究で構築した手法によって,アイデア評価が機械化されたのみならず,従来顧みられなかった大多数の不採用アイデアに,概念空間を構成する材料という新たな役割と,研究対象としての位置づけが与えられた。
While it has been proven that product development using crowdsourcing can produce highly marketable products, it continues to be a heavy burden to evaluate the large volume of user-generated ideas and to select the most attractive ones. In this study, we constructed a method that automatically measures novelty by constructing a conceptual space from crowdsourced ideas using natural language processing and calculating the rarity of opinions based on the statistical infrequency in the conceptual space. The method was applied to data obtained from a recipe submission site and the automatically measured novelty was shown to have validity in forecasting the attractiveness of recipes. The method developed in this study not only automated the evaluation of ideas, but also gave a new role as a material to construct a conceptual space for the majority of rejected ideas that had been neglected in the past, and gave these ideas new roles as the objects of research.
近年,ユーザーが生み出すアイデアを利用して製品開発を行う共創について様々な事例が報告され,知見が蓄積されてきた(Ogawa, 2013; Prahalad & Ramaswamy, 2004)。他方で,オンラインデータの2次利用やAPIあるいはウェブスクレイピングを利用したデータ収集,自然言語処理や機械学習を活用したデータ分析が行われるなど,社会科学と計算機科学の融合領域として計算社会科学(computational social science)という分野が生まれるに至り,社会現象とその扱い方が変化しつつある(Lazer et al., 2009, 2020; Salganik, 2017; Takikawa, 2018)。本研究では,不特定多数のユーザーがアイデアを創出するクラウドソーシングにおいて,有望なアイデアを機械的に抽出する方法について,計算社会科学的な方法を利用して探索的に研究する。
本論文は以下のように構成されている。まず,クラウドソーシングについて概説し,ユーザー創出アイデアの評価を行う際に専門家の負荷が高いことを述べる。次に,従来のオンラインデータや自然言語処理を利用したアイデア評価には,一般化や専門家の負荷の面で問題があることを指摘する。その上で,創造的なアイデアが創出される際に,概念空間の潜在的可能性が探索されることを踏まえ,クラウドソーシングによって投稿されるアイデアから,独創性の高いものを自然言語処理の利用によって機械的に抽出する手法を提案する。そして,レシピ投稿サイトのクックパッドから取得したデータを用いて,提案した手法が機能するかを調べる。最後に,本研究の含意を述べる。
クラウドソーシング(crowdsourcing)とは,不特定多数の人々の余剰能力を労働力のプールと考え,公募形式でリソースの提供を求めることである(Howe, 2006, 2008)。クラウドソーシングにはコンテスト型とコラボレーション型の2つがあり,通常,製品開発に用いられるのは前者である(Ghezzi, Gabelloni, Martini, & Natalicchio, 2018)。企業は,アイデアを幅広く募集し,その中から有望なものを選ぶ。クラウドソーシングを利用した製品開発は,P&Gなどの企業がクラウドソーシングのプラットフォームであるInnoCentive(Jeppesen & Lakhani, 2010)を通じて行っているだけではなく,Dell(Bayus, 2013),LEGO(Antorini, Muñiz, Jr., & Askildsen, 2012; Jensen, Hienerth, & Lettl, 2014),Threadless(Fuchs & Schreier, 2011),無印良品(Nishikawa & Honjo, 2011; Nishikawa, Schreier, & Ogawa, 2013)など様々な企業が行っており,高い市場性をもつ製品が生み出されることが実証されている(Nishikawa et al., 2013)。
クラウドソーシングの成功要因の一つは,製品品質自体の高さにあり,クラウドによって投稿されたアイデアは,企業内の専門家によるアイデアよりも,独創性と顧客便益が高いことが示されている(Poetz & Schreier, 2012)1)。クラウドが多様であるほど,優れたアイデアが投稿されやすく(Jeppesen & Lakhani, 2010),参加者数が増えるほどアイデアの多様性が上がるので,突出した価値のあるアイデアが少なくとも1つ見いだされる可能性が上がる(Boudreau, Lacetera, & Lakhani, 2011)。一方で,参加者数が増えると,平均的にアイデアの質が下がることも知られており(Boudreau et al., 2011),企業は投稿されるアイデア全体の数を増やしつつも,その中から有望なもののみを選び出すことが求められる。
2. ユーザー創出アイデアの評価法ユーザーが創出した新製品アイデアを評価する際に標準的に用いられている方法は,当該分野の複数の専門家が独立に独創性(novelty)2)と有用性(usefulness)を評価した上で,各自の評価を合算するというものである(Franke, Poetz, & Schreier, 2014; Franke, von Hippel, & Schreier, 2006; Jensen et al., 2014; Kristensson, Gustafsson, & Archer, 2004; Moreau & Dahl, 2005; Poetz & Schreier, 2012)3)。この評価法は,創造的産出物(creative products)を評価するために創造性研究の文脈で発展した「合意に基づく評価手法」(Consensual Assessment Technique: CAT)および創造的産出物意味尺度(Creative Product Semantic Scale: CPSS)に依拠し,両者を折衷したものになっている4)。評価手段の元になったCATにおいて,創造性は「適切な評価者が独立して評価を行い,一致して創造的としたもの」として操作的に定義されており,専門家が基準となるような創造性の定義を参照することなく評価を実施する(Amabile, 1982, 1996)5)。評価基準の元になったCPSSは,125以上の創造性を評価する基準を整理することで見いだされた,独創性(novelty),解決(resolution),精巧さと統合(elaboration and synthesis)の3つの次元(Besemer & Treffinger, 1981)を尺度化したものである(Besemer & O’Quin, 1986, 1987))。解決は有用性にあたり,精巧さと統合はスタイルの良さを表す。製品開発においてユーザー創出アイデアを評価する際には,独創性と有用性の2つがある産出物が生み出されるとき創造性が発揮されているという創造性研究における共通認識(Mayer, 1999)に則り,2つの次元のみが評価される6)。
ただし,この評価法には,適切な専門家を見つけて評価してもらうこと自体が困難だという問題,複数の専門家の評価を統合することが容易ではないという問題,多くのアイデアを評価することが専門家にとって負担になるという問題がある。
3. アイデア評価の機械化への取り組み不特定多数からアイデアを募るクラウドソーシングの場合,アイデア評価者の負担は特に大きなものになる。近年,この困難を乗り越えるため,評価を機械的に行う手法が提案された。
Jensen et al.(2014)は,オンラインデータを用いて,数多くのアイデアから有望なものをフィルタリングする方法を提案した。クラウドソーシングが行われるウェブサイトにおいては,ユーザーが創出するアイデアとともに,ユーザー自身の特性に関わる情報が得られる場合がある。そこで,アイデアとユーザー特性情報の両面から,アイデアの有望性を説明する指標が探索された。クラウドソーシングの典型的研究対象であるLEGOが調べられたところ,(1)アイデアの複雑性(使われているパーツ数),(2)アイデアに対する仲間からのポジティブなフィードバックの存在7),(3)アイデア創出者の活動度(投稿したアイデアの数)が,アイデアのフィルタリングに有効であることが見いだされた。ただし,こうした指標が得られるかどうかはウェブサイトによって異なるので,一般化は困難である。
von Hippel and Kaulartz(2020)は,ユーザー創出アイデアを収集する工程の一部を,自然言語処理(Natural Language Processing: NLP)を用いることにより,以下のステップで機械化した8)。まず,(1)世界中のウェブサイトから,当該分野に関するユーザー生成コンテンツ(User Generated Content: UGC)を収集(scraping)する。検索語は,当該分野の専門家が作成した上で,検索結果を確認しながら調整される。(2a)収集したUGCの各単語を,単語埋め込み(word embedding)によってベクトル空間で表現した上で,イノベーションに関わるコンセプトに関連するデータコーパスを抽出する。(2b)構文解析(syntactic analysis)によって,「私」などの一人称の言明がイノベーションに関わるコンセプトと組み合わさっている部分を,ユーザーイノベーションの可能性があるとして抽出する。(3)専門家が,独創性の高さを評価する。(4)データ収集対象となったウェブサイトでの言及頻度と,検索された頻度を元にアイデアの市場性を調べる。これらのステップからなる手法が,ユーザーイノベーションの典型的研究対象であるカイトサーフィンに適用された結果,世界中のウェブサイトから収集した234,017件のUGCを,自然言語処理によって453件までフィルタリングし,最終的に26の有望なアイデアを得ることができた。ただし,自然言語処理は,多数のUGCからユーザーイノベーションの候補を抽出する工程において利用されており,専門家の負荷は,従来通りの手動での評価に加え,検索に用いる単語,フレーズの作成という新たな役割によってむしろ増大している。
4. 研究課題以上のように,クラウドソーシングにおいては,ユーザー創出アイデアの評価者の負担が大きいという問題があり,一般的な解決策は見いだされていない。von Hippel and Kaulartz(2020)が自然言語処理の利用によって解決したのは,自分から企業にアイデアを送ることはしないユーザー,つまり,自己選択(self-selection)をしないユーザーのアイデアを幅広く探索するという課題であった。一方で,本研究が対象とするクラウドソーシングにおいては,自己選択をしたユーザーが自らの意思でアイデアを投稿するので探索の必要はなく,課題は専門家による評価の負担を下げることにある。よって,本研究では,クラウドソーシングにおいて集められるユーザー創出アイデアの評価の機械化がいかに可能かについて探索的研究を行うことにした。
特に本研究では,独創性に特化して評価の機械化を目指した。このことは,独創性の方が有用性よりも競争優位を生むという観点で重視されているだけでなく(Schulze & Hoegl, 2008),有用性はトレンド検索などの手法で事後的に評価できるという理由による(von Hippel & Kaulartz, 2020)9)。
以上を踏まえて,リサーチクエスチョンを以下の通り設定した:
▶ RQ.クラウドソーシングにおけるユーザー創出アイデアの独創性評価を機械的に行うことは,どのようにすれば可能か?
従来のユーザー創出アイデアの評価においては,創造性研究における創造的産出物の評価手法が援用されることで,アイデアそのものの特性が評価されていた。本研究では,出発点としてアイデアそのものではなく,アイデア創出者の創造性に注目する。創造性の計算機モデルによる理解,および,人工知能の創造性についての研究の文脈において,創造性は(1)慣れ親しんだアイデアの新たな組み合わせを作る「組み合わせによる創造性」,(2)構造化された思考である概念空間(conceptual space)の潜在的可能性を探索する「探索による創造性」,(3)これまで不可能だったアイデアを可能とするように概念空間を変容させる「変容による創造性」の3タイプの方法で発揮されると考えられている(Boden, 1998, 2004)。製品開発におけるクラウドソーシングにおいてアイデアの質の高さの根拠となるのは,参加するユーザーの多様性と人数であるため(Boudreau et al., 2011; Jeppesen & Lakhani, 2010),クラウドソーシングに主に関わるのは「探索による創造性」といえる。
2. クラウドから収集したアイデアを用いた概念空間の構成ユーザー創出アイデアの源泉は「探索による創造性」であるという考察を踏まえ,本研究では,探索の対象となる概念空間を構成し,そこでの潜在的可能性を指標化することとした。まず,概念空間をクラウドによって投稿された全アイデアの集合として構成する。ここでは,アイデア創出者個人が探索しうる概念空間全体が,クラウドの投稿したアイデア全ての集合で近似できると想定している。クラウドの人数が多ければ,前者は後者に含まれることになるので,この想定は正当化される。次に,潜在的可能性を指標化する。創造性が,概念空間の潜在的可能性の探索によって発揮されたものならば,そこで創出されたアイデアの出現頻度は低いことになる。つまり,「探索による創造性」の観点で考えるならば,アイデアがどれだけ珍しいものであるかという希少性(rarity)を指標とすることが直接的といえる。創造性研究において,独創性が統計的な頻度の低さで定義される場合があること(Besemer & Treffinger, 1981)を踏まえると,希少性が独創性を高めると想定できる。
具体的な手続きは以下の通りになる。まず,クラウドが投稿したユーザー創出アイデアを表現する文章から,意見として表明されているものを自然言語処理の利用によって抽出し,抽出した意見全体を概念空間と見なす。その上で,概念空間内で,出現頻度が低い意見を,希少意見と見なす。希少意見が多く含まれているユーザー創出アイデアの独創性が高く有望だというのが,本研究の作業仮説である。
本研究では,レシピ投稿サイトのクックパッド(cookpad)のデータを用いて,クラウドソーシングアイデアの有望性予測が可能であるかどうかを調べた。
クックパッドは,プロの料理人や料理研究家でなくても,不特定多数の人々がユーザーとして登録し,レシピを投稿することが可能なクラウドソーシングの場である。2020年9月の時点で,339万品目を超えるレシピが投稿されており,日本有数のUGCによるウェブサイトとしても位置付けられる。クックパッドの場合,投稿されたアイデアの主たる利用者は企業ではなく,レシピを検索する他のユーザーであるが,投稿されているレシピを他のユーザーが実際に作り,感想を写真付きで投稿する「つくれぽ」という仕組みが存在することで,その数によってレシピの実際の人気を一定程度推測できるという利点がある。これまでクラウドソーシングの研究対象となったInnoCentive(Jeppesen & Lakhani, 2010)やTopCoder(Boudreau et al., 2011)同様に,登録したユーザーが継続してアイデアを投稿できる仕組みになっているだけではなく,Jensen et al.(2014)が調べたLEGOのウェブサイトと同様のオンラインデータが得られることから,本研究で調べる意見の希少性を他の指標と比較できるという利点がある。
また,料理は計算社会科学の研究対象となっており,レシピに共に含まれる食材のネットワーク構造に文化差が見いだされたり(Ahn, Ahnert, Bagrow, & Barabási, 2011)10),食の好みと個人の価値観の関係が見いだされたりと(Sasahara, 2019)11),食品という領域を超えた一般的な消費者心理の理解につながるものであることが知られている。本研究の手法は,自然言語で表現されたアイデアならばどのような対象でも適用可能であるが,将来の拡張を見据えて,料理のレシピを対象に研究を行うこととした。
本研究では,クックパッドのデータを用いて,「ぽん酢」を用いたレシピおよび「ぽん酢」で代替できる可能性がある調味料群を用いたレシピを対象としてアイデアの有望性を調べた。具体的には,2020年5月時点で公開されていたレシピのうち,「ぽん酢」,「醤油&酢」,「醤油&レモン」,「めんつゆ&酢」を素材に含むレシピを検索し,対象レシピのデータを取得した。合計で38,272件のレシピを収集し,収集したレシピから項目ごとのテキスト情報,投稿者のレシピ投稿数,レシピに用いられている素材数,レシピのステップ数をデータベース化した。
対象レシピで構成されるデータベース(全38,272レシピ)は,データ取得時に公開から2カ月未満であった抽出候補データ(3,915件)と,データ取得時にレシピ公開から2カ月以上が経過していた検証用データ(34,357件)に分割した。抽出候補データは,後述する自然言語処理技術を利用して各レシピの独創性を評価することに用いた。そこでは,レシピ内に記載されたテキスト情報から希少意見タグを定義し,各レシピでの希少意見タグの出現回数に基づいて希少性を判定したうえで,希少性の頻度分布を算出した。検証用データは,公開以降2カ月以上経過している点を生かし,レシピの有望性(レシピ公開から一定期間内での他ユーザーによる高い評価)に関する検証に用いた。そこでは,レシピの希少性が有望性にどのように関係しているかを検証した。さらに,各レシピが有望かどうかを判定する有望性判定モデルを構築し,当該判定モデルにおける希少性の寄与の大きさを調べる際にも用いた。
2. 独立変数:希少性の評価各レシピの希少性の評価は以下の流れで行った(図1)。まず,各レシピのテキストから意見タグを獲得し,意見タグ全体で概念空間を構成した。次に,概念空間における各意見タグの出現頻度を算出し,出現頻度が低い希少意見タグを定義した。そして,各抽出候補レシピに含まれる希少意見タグ数をカウントし,これを各レシピの希少性として評価した。
希少性判定プロセス
意見タグとは,テキストから分析に利用できる箇所だけを部分的に抜き出したフレーズのことである。意見タグは「意見対象部」と「意見述部」,そして2つをつなぐ格助詞の3要素で構成されており,「意見対象部-格助詞-意見述部」で表記される。意見タグは構文解析と述語項構造解析の結果からルールベースで獲得しており,形態素解析器としてJuman12),構文解析と述語項構造解析のためにKNP13)を利用した。意見タグの生成フローは図2の通りであった。意見対象部と意見述部はそれぞれ独立に獲得され,最後に述語項構造解析の結果に基づき2つを結合した。
意見タグ抽出プロセス
意見タグの付与例を表1に示す。構文解析および述語項解析により係り受けを反映したタグが抽出されていることが分かる。この意見タグを活用することで,単語のみで見るよりもレシピの特徴を効果的にデータとして構造化できる。抽出候補データから抽出した意見タグ全体が,本研究における概念空間である。
意見タグの付与例
STEP1において抽出候補データの各レシピに付与された意見タグについて,概念空間における出現頻度を算出した。出現頻度が高い意見タグは「ぽん酢関連のレシピでよく用いられる表現」を示し,出現頻度が低い意見タグは「ぽん酢関連のレシピとしては珍しい表現」を示している。結果は図3の通りであり,抽出候補レシピの中で1回しか出現しない意見タグが全体の7割程度を占める結果となった。次いで,2回出現する意見タグが7.6%,3回が3.4%と続いていた。
抽出候補データにおける意見タグ出現頻度と抽出されるレシピの割合
意見タグとして抽出されたアイデアが,概念空間の潜在的可能性の探索によって得られたことを踏まえると,出現頻度が低いほど独創性が高いということになる。しかし,自然言語で記されたレシピでの表現の多様性を踏まえると,抽出候補データのなかで1回しか登場しない低頻度意見タグは,表現の分散性故に登場した特殊な意見タグである可能性が考えられる。実際,抽出候補レシピに付与された意見タグを調べたところ,表2の通りの表現が見いだされた。低頻度意見タグでは「普通の胡麻和えガ和風」「中ガ大好きです」など,レシピを説明した表現となっていない例が多く見られた。つまり,1回しか登場しない意見タグはフレーズとしての希少性は高いものの,レシピ表現としての一般性が低いということになる。また,出現回数が上位の頻出意見タグは「千切り二する」に代表されるような決まり文句となっていた。出現頻度が2回~5回の意見タグは「豆腐二かける」など具体性が高く,レシピのプロセスや特徴を表現していることがうかがえた。よって,本研究では出現頻度が2回~5回の意見タグを,希少意見タグと定義することにした。概念空間,つまり抽出候補データの中で出現する全意見タグのうち,この定義による希少意見タグに該当したのは図3の通り14.7%であった。
抽出候補レシピから得られた意見タグの例
最後に,各レシピに含まれている希少意見タグの出現回数を,当該レシピの希少性として付与した。抽出候補レシピを対象に希少性を付与し,その頻度分布を検証した結果は図4の通りであった。抽出候補レシピ3,915件のうち30.0%のレシピは希少意見タグが一度も出現しないレシピであり,これらは独創性を有するとはいえない。一方で,残り70.0%は1件以上希少意見タグが出現するレシピとなっており,希少性1(希少意見タグが1回出現)が29.9%,希少性2が19.4%となっていた。なお,希少性の最大値は27であった。
レシピの希少性の頻度分布
本研究の作業仮説は,希少性の高いユーザー創出アイデアの独創性が高く,有望だというものである。前項では希少性に着目したレシピの独創性評価について述べた。本項では,その有効性を検証する際に従属変数となるアイデアの有望性(attractiveness)について説明する。
本研究ではアイデアの有望性について専門家の評価ではなく,実際に調理をする一般ユーザーの評価に依拠することとした。適切な専門家を発見することや,複数の専門家の評価を統合することが容易ではないという,従来の評価方法にある問題点がその理由である14)。本研究でデータ収集の対象としたクックパッドには,前述した通り,他のユーザーによる「つくれぽ」という仕組みが存在し,その数によってレシピの実際の人気を一定程度推測できる15)。そこで,本研究では「レシピ公開後一定期間内でのつくれぽ数」によって,当該レシピの有望性を定義することとした16)。
まず,一般的なレシピにおけるつくれぽ数の伸長度を踏まえ,レシピ公開後2カ月以上経過したつくれぽに着目した。検証用データのうち素材に「ぽん酢」を含むレシピを対象に,レシピ公開後2カ月時点でのつくれぽ数の分布を調べた結果は図5の通りであった。7割のレシピはつくれぽが0であった。また,つくれぽを有するレシピであっても,つくれぽ数が1または2の場合は,特定のファンやヘビーユーザーによるつくれぽの可能性がある等の特殊事象が想定され,一般的な有望性があるとは考えにくい。よって,本研究では,「レシピ公開後2カ月以内につくれぽが3以上」となったレシピを有望なレシピと定義した17)。この定義に則れば,「ぽん酢」を素材に含む検証用データのうち6.7%が有望なレシピと判断された。なお,ぽん酢以外の関連素材(「「醤油&酢」,「醤油&レモン」,「めんつゆ&酢」」を含めると,検証用データ全体34,357件のうち7.9%のレシピが有望と判断された。
レシピ公開後2カ月時点でのつくれぽ獲得数の頻度分布
コントロール変数としては,オンラインデータから得られた指標を用いた。Jensen et al.(2014)によって有効性が見いだされたのは,アイデアの複雑性,アイデア創出者の活動度,アイデアに対する仲間からのポジティブなフィードバックの3つだった。そこで,本研究では複雑性に該当する(1)当該レシピで用いる素材数,および,(2)当該レシピで記載された調理のステップ数,活動度に相当する(3)アイデア創出者が過去にクックパッドで投稿したレシピ数を,指標として用いることにした。アイデアに対する仲間からのポジティブなフィードバックについては,本研究ではフィードバックにあたるつくれぽが,有望性を表す従属変数となっているという理由で除外した。また,レシピ特有の事情として季節性があるので,レシピ公開時期の季節を区切り,春,夏,秋,冬の四季を3つのダミー変数で区別することにした。
まず,各レシピの希少性と有望性の2変数間の関係を検証した。検証用データ34,357件それぞれに対して希少性を算出し,希少性の値によって区別したレシピ群のうち有望なレシピの比率を集計した。検証用データ全体での有望レシピの構成比は7.9%であった。希少性0(希少意見タグ頻度0)のレシピ群では6.6%と全体平均を下回っていた一方で,希少性が2以上のレシピ群ではいずれも全体平均の7.9%を上回る構成比となっており,希少性が高いほど有望レシピの構成比が高まる傾向が確認された。
各希少性に属するレシピ群における有望レシピの構成比
レシピの有望性に対して希少性がどの程度の寄与をしているかを評価することを目的として,有望なレシピかどうかを判別するモデルを構築した。コントロール変数として希少性以外の評価指標を含めることで,それらの変数と比較しても希少性が有望性を説明し得るかどうかを検証した。
レシピの有望性については多様な変数の組み合わせで説明される可能性が高く,単一の傾向を再現する回帰モデル(例えば,ロジスティック回帰モデル)では判別にしにくいと予想されるため,多様性を反映した判別が可能となるランダムフォレスト(Breiman, 2001)を用い,有望なレシピになるかどうかの判別モデルを構築した。本研究では,生成した木の数(n_estimators)を100,最も深い木の深さ(max_depth)を7として有望性判定モデルを構築した。有望性判定モデルにおける各変数の寄与度(有望性に対する寄与の大きさ)を説明する代理指標として,ランダムフォレストにより導出された各変数の重要度(importance)に注目した。重要度とは「ある特徴量での分割によりどれだけジニ不純度(Gini impurity)を小さくできるか」を示すものであり,各変数の重要度の総和は1となる。重要度が大きいほど,その変数によって有望かどうかをどれだけ判定できるのかの有効性が高いということになる。
検証用データ34,357件を対象にランダムフォレストによって導出した重要度は表3の通りであった。希少性は素材数およびステップ数と同程度の重要度を持ち,レシピの有望性に対して影響を及ぼしていることが実証された。素材数やステップ数が料理のレシピを構成する重要な要素であること,および,Jensen et al.(2014)によって有効性が見いだされた変数を代替するものであることを踏まえると,これらと同等の重要度を有する希少性はレシピの有望性を説明する有効な指標であるといえる。つまり,既存の指標であるアイデアの複雑性,アイデア創出者の活動度を勘案してもなお,希少性は独立な変数として有望性に対する説明力を有していると実証された。
有望性判定モデルにより得られた重要度
本研究では,クラウドソーシングにおいてユーザー創出アイデアを評価する専門家の負担を下げるため,アイデア評価を機械化する手法を提案し,その可能性を探索した。提案した手法は,クラウドが投稿したアイデア全体から概念空間を構成して,そこでの出現頻度が低い意見を独創性が高い意見として扱うというものであり,独創性を測定する人工知能といえるものであった。提案した手法を,クックパッドから取得したデータに対して実装し検証したところ,レシピの有望性の説明に有効性を持つことが示された。つまり,「クラウドソーシングにおけるユーザー創出アイデアの独創性評価を機械的に行うことは,どのようにすれば可能か?」という本研究のリサーチクエスチョンに対し,肯定的な手法を1つ見いだすことができたといえる。以下では,本研究の含意について考察を行う。
まず,既存の手法と比較を行うことで,学術的貢献を明らかにする。共創手法に自然言語処理を持ち込んだ先駆的研究であるvon Hippel and Kaulartz(2020)は,ユーザーが自己選択を行わない場合,つまりリードユーザー法を機械化しているが,本研究では,自己選択が行われるクラウドソーシングを機械化した。われわれの知る限り,クラウドソーシングにおけるアイデア評価を系統的に機械化した手法は存在せず,先駆的な独自性があると思われる。また,本研究には,独創性の評価そのものにアルゴリズムを用いるという新しさがある。Jensen et al.(2014)はオンラインデータを利用することで,有望なクラウドソーシングアイデアをフィルタリングすることに成果を挙げた一方,指標として用いられたデータが入手可能かどうかはウェブサイトによって異なるという限界があった。本研究で提案した手法は,アイデアが文章で表現されているならば,他のオンラインデータがなくても独創性が評価できるので,高い一般性を持っているといえる。さらに,本研究の手法においては,希少意見タグという形で,アイデアのどの側面に独創性があるかが明示的にわかるという利点がある。特に,一般的なクラウドソーシングの条件において,このことを成し遂げている点で,一般的な状況における創造性評価という観点での前進が認められる。
さらに,本研究独自の貢献として,クラウドソーシングの手法自体を洗練させたということが挙げられる。通常,クラウドソーシングにおいては,高い評価を受けた少数のアイデアのみが採用され,それ以外の大多数のアイデアは顧みられることなく無視されていた。本研究の手法では,クラウドから収集した全アイデアを用いて概念空間を構成するので,採用されなかったアイデアにも概念空間を構成する材料としての位置づけが与えられることになる。このことにより,クラウドソーシングについての学術的理解が深まる可能性が拓かれたと考えられる。なぜなら,クラウドソーシングにおいてアイデアの質の高さの根拠となっていた多様性(Jeppesen & Lakhani, 2010)とアイデア数(Boudreau et al., 2011)を,概念空間の性質として調べることが可能になったからだ。また,収集したアイデアを無駄にせずに済むという企業側の実務的利点,投稿したアイデアが無意味なものとして捨てられないというアイデア投稿者のモチベーションに関わる実務的利点にもつながると考えられる。
ただし,本研究には課題がある。本研究の手法は,全体としては機能しているが,精緻に理論化を行う上では,それぞれの変数の特徴と関係を整理する必要がある。例えば,頻出意見タグ,希少意見タグ,低頻度意見タグのそれぞれについて,独創性がどのように評価されるのかを調べることが整理の一助となると考えられる。こうした検証を行うことで理論を精緻にし,結果の一般性を確認することは今後の課題である。また,希少意見タグの頻度だけでなく,レシピに共に含まれる意見タグのネットワーク構造を調べるなど,アルゴリズムにもさらなる工夫を行う余地がある。
マーケティングや製品開発における自然言語処理や機械学習の利用は,まだ始まったばかりといえる。本研究で創造性の研究に依拠したように,それらの利用には人間についての深い理解が重要になると考えられる。深い人間理解と計算社会科学で用いられる数理的な方法の活用を両輪とすることで,マーケティングや製品開発についての学術的理解や実務的実践は推進されていくものと思われる。そうした大きな潮流を推進していくことを,今後の展望としたい。
本研究はJSPS科研費JP18K12878の助成を受けて進められた。また,法政大学の西川英彦先生,東京工業大学の笹原和俊先生,本特集号の編集を担当された青山学院大学の石井裕明先生から貴重なご助言をいただいた。ここに記して感謝したい。
本條 晴一郎(ほんじょう せいいちろう)
静岡大学学術院工学領域事業開発マネジメント(MOT)系列 准教授。
東京大学大学院総合文化研究科広域科学専攻相関基礎科学系博士課程修了。博士(学術)。
学術振興会特別研究員(DC2),東京大学東洋文化研究所特任研究員,株式会社NTTドコモモバイル社会研究所副主任研究員等を経て,2017年2月より現職。
伊藤 友博(いとう ともひろ)
株式会社Insight Tech 代表取締役社長 CEO。
早稲田大学大学院建設工学専攻土木工学専門分野修了。株式会社三菱総合研究所を経て,2017年2月より現職。