Japanese Journal of Digital Humanities
Online ISSN : 2189-7867
Articles
Analysis of Stylistic Features Affecting "Descriptive Distance" in Narrative Texts
Fumika YoshiiHajime Murai
Author information
JOURNAL OPEN ACCESS FULL-TEXT HTML

2025 Volume 4 Issue 1 Pages 33-51

Details
Abstract

物語において,内容が同じであっても,表現ひとつで読者に与える影響は大きく変化する.したがって,表現が読み手に与える影響を分析することは有益であると推測される.そこで本研究では,読者に与える印象に大きく寄与すると考えられる「描写距離」の概念に着目することとし,描写距離に影響する文体的特徴を分析し明らかにした.分析は,描写距離がそれぞれ近・中・遠と考えられるジャンルの小説中の条件を満たすシーンを対象に,基礎統計解析やχ二乗検定,共起分析等を行った.分析から,地の文の視点や語り手を登場人物が担うなどすることで情報の付加や婉曲が生まれ,複雑性が増加し,その結果描写距離が近くなることが示唆された.その後分析結果をもとに描写距離の計算式を作成し,実際に描写距離を算出し,評価実験を行ったところ,描写距離が近いほどは描写距離の判定が容易になること,描写距離の特徴が混合しているシーンにおいては,判定がより困難になることが示唆された.

Translated Abstract

In a story, even if the content is the same, the effect on the reader can vary greatly depending on one expression. Therefore, it is assumed that it is useful to analyze the effects of expressions on the reader. In this study, we focused on the concept of "descriptive distance" among the impressions readers receive, and analyzed and clarified stylistic features that affect descriptive distance. The analysis included basic statistical analysis, χ-square test, and co-occurrence analysis for scenes that fulfill the conditions in novels of genres in which the descriptive distance is considered to be near, medium, or far. The analysis suggests that the addition of information and euphemisms, such as the point of view and the narrator of the ground text, increases complexity, and as a result, the descriptive distance becomes closer. Then, based on the analysis results, we created a formula for calculating the descriptive distance, actually calculated the descriptive distance, and conducted an evaluation experiment. We inferred that the closer the descriptive distance is, the easier it is to judge the descriptive distance, and that in scenes with a mixture of descriptive distance features, it is more difficult to judge the descriptive distance

1 はじめに

Genette[1]は,物語の見方として「物語内容」,「物語言説」,「物語行為」の三つの概念があるとした.物語内容とは物語内で何が書かれているのかという内容を,物語言説は内容をどのような筋立てで書くのかという形式を表す.物語内容を物語言説により語り方を定めるのが物語行為である.内容が同じであっても,表現によって読者に与える影響は大きく変わる.よって読み手へ与えたい影響によって表現を選択することはクリエイターにとって非常に重要であり,表現ひいては様々な物語言説が読み手に与える影響を研究することは有益であると推測される.そこで本研究では,読者に与える印象に大きく寄与すると考えられる一方で,明確な定義がなされていない「描写距離」の概念に着目し,描写距離に影響を与える文体的特徴を分析することで,描写距離の定義を定量的に作成することを目的とする.

本研究における描写距離は,Genette[1]によって提案されたナラトロジーにおける概念「距離」を,実際のデータに基づき定量的に扱えるようにした概念とする.本稿では,Genetteのオリジナルの概念である「距離」や,自然言語処理モデルのBERT[2]等で用いられる,文章ベクトル同士の類似度を示す「距離」と区別するため,「描写距離」と記述する.

Genetteの「距離」とは,物語を語る主体(語り手)と語る対象との間にある距離感を表す概念である.例えば,「男が飲み物を飲む」という物語場面を語る対象とする.この場面について,「男は椅子に座り,右手にコップを持って中に入っていた水をグイっと一気に飲み干した」と描写した場合,写実的かつ詳細に描写しているため,語り手と語る対象の間にある「距離」は近いとされている.また,心理描写が含まれる場合は,語る対象である登場人物本人でしか分かりえない情報を語り手が語っているため,語り手と語る対象との「距離」は際限なく近いと考えられる.逆に,「男は飲み物を飲んだ」と描写した場合,補足的な情報がなく,描写が俯瞰的であるため,語り手と語る対象の間にある「距離」は遠いとされている.プラトンは詳細に語ることをミメーシス,要約的に語ることをディエゲーシスと定義したが[3],ミメーシス的に語るほど「距離」は近くなり,ディエゲーシス的に語るほど「距離」は遠くなる[1].すなわち,本研究で扱う描写距離は,物語を語る主体と語る対象との間にある距離感を実際のデータに基づき定量的に扱えるようにした概念である.

先述のように心理描写の有無や描写の俯瞰性は「距離」に影響すると考えられるが,他にもテキスト中に含まれる品詞やレトリックなどの様々な文体的特徴が,読者の感じる「距離」に影響を及ぼすと考えられる.しかし,Genetteは写実的な場合は「距離」が近い,俯瞰的な場合は「距離」が遠いと述べたのみで明確な定義を行っていないため,テキスト中のどの文体的特徴とどの文体的特徴が「距離」に影響しているのか,またそれらの影響関係は何かという点は明らかではない.さらに,同じテキストを読んだ場合に感じる主観的な「距離」が読者間でどのように異なるかという点も明らかになっていない.そこで本研究では,以下のプロセスによって,Genetteの提唱する「距離」の概念に基づき,定量的に扱うことの可能な「描写距離」の定義を行う.

  • [1]   テキスト中のどの文体的特徴の影響力が大きいかを予備的に調査するため,ジャンル単位で仮描写距離を設定し,描写距離に影響すると考えられる種々の文体的特徴量を付与したシーン単位とセンテンス単位の二種類のデータセットを構築
  • [2]   構築したデータセットの各種統計量に基づき,仮描写距離に大きく影響すると考えられる文体的特徴の絞り込み
  • [3]   上記で絞り込んだ文体的特徴に基づき,重回帰分析を用いて描写距離計算式の導出

文体的特徴を用いて描写距離の定義を行う性質上,描写距離を判定するためには,一定数以上の文章量が必要となると推測される.また,一つの作品内においても,Genetteの距離は複数存在する.そこで,本研究においては,描写距離はシーンに対して判定するものとする.シーンの定義は,データの項目にて述べる.

本研究で期待される成果としては大きく三点挙げられる.第一に,距離に関わる計量的な文体的特徴を既存の作品群によって裏打ちされた状態で明らかにすることができる.これは,数的なパラメータとして描写距離が制御可能となることを意味する.加えて,大規模言語モデルへの応用も期待される.描写距離制御に関わる文体的特徴をプロンプトの形で大規模言語モデルへ入力することで,GPT-4[4]など大規模言語モデルを用いた文章自動生成において文章の距離制御が行えるようになる可能性がある.第二に,クリエイターの支援システムへの利用可能性があげられる.執筆活動において読み手へ与えたい影響によって表現を選択することは非常に重要である一方,ある場面やジャンルにおいて多用される表現はあるとしても,効果的な表現は一意に決まらない.そこで,入力した物語文章に対して描写距離を判定し,新たな描写距離を指定することで,文章の内容を変えずに描写距離に合わせて新たな表現を提案するようなシステムを構築すれば,そのシステムはクリエイターにとって有益な創作支援になると期待される.第三に,創作支援以外への応用も期待される.例えば,描写距離制御を用いて,読み手に合わせた文章のカスタマイズが可能になる.これは物語以外でも適用可能であり,例えばニュース記事のような客観的な文章を臨場感のある表現に変更したり,逆に主観的な感想を客観的な文章に変更したりして,読み手の好きなように文章のカスタマイズが行えるようになる.

なお,描写距離の制御に着目した先行研究として,Ogataら[5]の研究があるが,具体的に描写距離に影響する物語言説については言及していない.このように,既存の作品群を量的に分析することによって距離に影響を及ぼす文体的特徴を明らかにした研究は確認できていない.

2 関連研究

本研究は,分析対象を物語文章に限定した研究である.物語分析の先行研究としては,まず,Proppの物語構造分析が挙げられる[6].Proppは,ロシアの魔法物語は31の物語機能の組み合わせによって記述可能であるとした.この,「物語は複数の機能の組み合わせからなる」という構造主義を受け継ぎ,近年でも様々な物語分析の研究が行われている.村井[7]はコンピューターで物語を計量的に取り扱うために,ストーリー,クエスト,シーンの3層からなる階層的な構造として物語を記述する方法を提案した.また,Wamaら[8]は,プロップの物語構造分析に基づいて日本の民話を分類した.本研究ではこれらの構造分析の流れを受け継ぐ形でデータセットを作成し,分析を行っていく.

Genette[1]は物語の様々な文体的特徴を形式的に分類した.分類する際の視点として,物語内容が生起する時間的順序と物語言説の順序との関係を扱う「順序」,物語内容の時間的長さと物語言説の長さとの関係を扱う「持続」,情報をどのように選別・加工して物語内容を再現するかを扱う「叙法」等5つの概念を提案した.本研究で取り扱う「描写距離」の概念の元となった「距離」は「叙法」に含まれる.また,Genetteが提案した複数の技能については,描写距離に影響を与えている可能性が考えられるため,本研究における分析対象に含めている.

Souriau[9]は,物語における登場人物の役割の配置から演劇の状況を分析する手法を提案した.具体的には,獅子座(主題の力),太陽(価値)等の6個の諸機能を各登場人物に割り振ることで状況を模式化した.本研究ではこの手法は用いなかったが,描写距離によって登場人物の役割に変化が起きる傾向が見られた場合,用いることを検討する.

また,物語表現に関係する研究として根本ら[10],大石ら[11],Ogataら[5]の研究がある.根本らは,エッセイで使用されているレトリックをデータ化し,χ二乗検定や因子分析を用いてレトリックの特徴を計量的に抽出した.本研究ではレトリックは対象外としているが,χ二乗検定など表現の特徴を分析する手法は一部こちらに倣っている.大石らは,語り手と聞き手のパラメータから,入力した行為に対して接尾辞を自動的に選択するシステムを考案した.例えば「食べる」という命題に対して動作開始前,過去の出来事という風にパラメータを指定した場合,自動的に接尾辞が変更され,「食べようとした」のように出力される.本研究とは,特定の命題に対してパラメータを変化させることで,内容を変化させることなく表現を変化させているという試みが共通している.Ogataらは,物語中のイベントをノードとし,距離が大きいものをルート,距離が小さいものを葉として木構造(ストーリー木)を構成した.そしてそれらのノードを入力した距離に従って移動させることによって距離制御を実現するシステムを考案した.この先行研究は距離制御を行うという点で本研究とは類似しているが,具体的に距離に影響する文体的特徴については言及していないという点で異なっている.

以上の関連研究から,物語の内容や表現を定量的に分析する試みは広く行われているが,距離という概念に対して定量的な分析や定義を行っている研究は行われていないことが示唆される.

3 データ

3.1 本研究における分析の目的

本研究の目的は,複数の文体的特徴を用いて定量的に描写距離の定義を行うことである.しかし,事前に描写距離の定義を行った研究は見つけられていないため,新しく定義を作成することとなる.どの文体的特徴が描写距離に影響を与えているかを分析するためには,描写距離を何らかの形で特定する必要がある.しかしすでに述べた通り,描写距離の定量的な定義として参照可能なものは存在していない.そこで,本研究では厳密ではないが描写距離に近似すると考えられる予備的な仮の描写距離を大まかな形で定義し,その仮描写距離に基づいて描写距離に影響が強いと考えられる文体的特徴の候補の選定を行う.その後,仮描写距離や仮描写距離に影響を与えていた文体的特徴を基に,描写距離の定義を作成する.

3.2 本研究における仮描写距離の定義

初期条件として設定した仮描写距離の定義を記載する.仮描写距離は近・中・遠の3段階で評価することとした.また,仮描写距離は,描写距離の定義が存在しない段階で付与する必要があるため,人手であっても個々のテキストに対して設定することは困難である.そこで,ジャンル単位で仮描写距離を一括して付与する方針とした.一般的に心理描写や人物の詳細な表現が多いと言われるジャンルのテキストは仮描写距離を近とし,俯瞰的な表現や簡潔な描写が多いと言われるジャンルのテキストは仮描写距離を遠とし,両方が含まれると想定されるジャンルやその他のジャンルのテキストは仮描写距離を中とした.

本研究においては「青春」「恋愛」「ヒューマンドラマ」「ファンタジー」「ミステリー」「時代・歴史」「ノンフィクション」「ハードボイルド」のジャンルを扱った.物語のジャンルの場合,万人に共通の明確な定義は存在せず,各作品や作家がどのジャンルに該当するかは分類の仕方によって異なる.本研究においては「青春」は青少年たちの特有の日常や成長が描かれる作品,「恋愛」は恋愛を主題として描かれる作品,「ヒューマンドラマ」は,人同士の関わりが主軸として描かれる作品,「ファンタジー」は,空想上の世界を舞台に描かれる,または現実的ではない設定が含まれる作品,「ミステリー」は,謎解きが主題であり,謎の解決に向けた過程が描かれる作品,「時代・歴史」は忠実か否かに関わらず,歴史に即して描かれる作品,「ノンフィクション」は現代において実在した出来事について描かれる作品,「ハードボイルド」は,ミステリーの中でも主人公の感傷には触れず,客観的に描かれた作品とした.

また,仮描写距離が近のジャンルとして,「青春」,「恋愛」,「ヒューマンドラマ」を設定した.これらのジャンルは人物の内面・心理描写が多く含まれるため,語る対象と語り手の距離感が近く,描写距離も近いと考えられるためである.また,仮描写距離が遠のジャンルとして,「時代・歴史」,「ノンフィクション」,「ハードボイルド」を設定した.これらのジャンルは,物語内の出来事を正確に伝えることが主軸となっているため,客観的な視点から描かれていることが多く,客観的な視点で表現される場合は描写距離が遠いと考えられるためである.また,心理描写と客観的な視点,両方が含まれると考えられ,かつ主要なジャンルである「ファンタジー」,「ミステリー」を仮描写距離中として設定した.これらのジャンルでは人間関係や登場人物の心情描写が含まれる一方で,ファンタジーであれば世界設定や非現実要素の解説など,ミステリーであれば状況描写やトリックの説明など客観的な視点で描写されると考えられる内容も多く含んでいる.そのため,描写距離は遠と近の混合した中間的な値になると考えられる.また,他にも内面描写と俯瞰的な描写の両方が含まれるジャンルは複数存在するが,書籍の売り上げ上位に多く含まれ社会的影響力が大きいと考えられるジャンルであるため,分析対象として選択した.

ここで留意するべきは,仮描写距離はあくまで描写距離の定義が存在しない段階で付与する仮の距離であり,描写距離は正確にはジャンルのみで定義できるわけではないということである.はじめに述べた通り,描写距離には様々な文体的特徴が内包されており,それらによって描写距離は判定されるとする.したがって,ジャンルは描写距離に何らかの影響を与えると考えられるが,ジャンルのみで描写距離が決定するわけではない.そこで,仮描写距離を用いて得られた分析結果を通して実際の描写距離の定義を行うこととする.

3.3 分析対象の選定

3.2節で述べた通り,仮描写距離はジャンルによって一括で付与することとした.そこで,分析対象は,描写距離が近・中・遠と考えられる小説のジャンルそれぞれにおいて代表的な作家の短編集からランダムに選出した小説とした.作家は,ランキングサイト[12]に掲載された作家を,上位順に先述のジャンルの設定に基づき各ジャンルに振り分け,選出した.この際,短編作品が出版されていない作家や翻訳作品は除外した.ジャンルと作家の一覧をTab.1に,作品一覧をTab.2に提示する.

恩田陸,重松清,森絵都は複数のサイトで複数作品が著名な青春小説とされていたため,青春がジャンルの作家とした[13][14].有川浩,角田光代,江國香織は,複数のサイトで複数作品が著名な恋愛小説とされていたため,恋愛がジャンルの作家とした[15][16][17].また,中田永一は著名な恋愛小説に入っていることに加え,恋愛小説を中心としている作家であると評価を受けているため[18],恋愛ジャンルの作家とした.瀬尾まいこと小川糸は,ヒューマンドラマ小説として複数のサイトで取り上げられていた他[19][20],人間関係や登場人物の心情を緻密に描写する作風という評価をされていることから[21][22],ヒューマンドラマジャンルの作家とした.また,群ようこは登場人物の心情や人間関係を中心に描く作風であると評価をされていることから[23][24],同じくヒューマンドラマジャンルの作家とした.上橋菜穂子,梨木果歩,森見登美彦は,複数のサイトで複数作品が著名なファンタジー小説とされていたため,ファンタジーがジャンルの作家とした[25][26].また,村上春樹は著名なファンタジー小説に入っていることに加え,独特なファンタジー世界を描くのが特徴的であると評価を受けているため[27],ファンタジージャンルの作家とした.加えて,西尾維新は独特な世界観と突飛な設定が特徴的だと評価されているため[28][29],ファンタジージャンルの作家とした.東野圭吾,辻村深月,湊かなえ,綾辻行人,貴志祐介は複数のサイトで複数作品が著名なミステリー小説とされていたため,ミステリージャンルの作家とした[30][31].司馬遼太郎,宮部みゆき,池波正太郎,藤沢周平は,時代小説家・歴史作家リストに掲載されているほか[32],複数作品が著名な時代・歴史小説とされていたため,時代・歴史小説ジャンルの作家とした[33].吉村昭は,ノンフィクション作家リストに名前が掲載されているほか[34],ノンフィクション作品を多く手掛けていると紹介しているサイトが存在することから[35],ノンフィクションジャンルの作家とした.また,新田次郎は,実際の出来事を下敷きにした物語を描く作風であるとされていることから[36],ノンフィクションジャンルの作家とした.誉田哲也,今野敏,柚月裕子は「ミステリー・サスペンス・ハードボイルド」で人気の作家ランキングに掲載されているほか[37],警察小説等を多く手掛け,ハードボイルドなテイストであると評価をされている[38][39][40]ため,「ハードボイルド」ジャンルとした.

なお,本研究では特定のジャンルに基づいて作家を選出し,選出された作家の短編集を分析対象としたが,選出された各作品が各作家のジャンルに適合することは確認済みである.

分析のため,選出した小説はシーンごとに区切り,条件を満たすシーンを抜き出して分析した.なお,本研究でのシーンは,先行研究[41]を参照し,本文での空行,物理的な場面移動,時間経過,主要な登場人物の出現・退出・移動・誕生・死去,状況説明の終了によって区切られるものとした.これらの分割基準の有効性は,上記先行研究において検証されている.

シーンの選出条件は,会話が中心であること,シーン内で人間関係が肯定的に変化すること,登場人物が二人であることの3点とした.

まず,登場人物の会話や人間関係の変化は,作家の描写手法によって,同様の内容であっても描写距離に差異が出ることが推測されるため,条件の一つとした.例えば,人間関係が変化するようなシーンであれば登場人物の感情が描かれると考えられ,登場人物の感情も台詞で表現する,地の文で表現する等様々な表現方法が想定される.そして,Genetteは表現が写実的な場合は「距離」が近く,俯瞰的な場合は「距離」が遠いと述べている.したがって,登場人物の感情が台詞として写実的に表現された場合は描写距離が近くなり,第三者視点から俯瞰的に語られた場合は距離が遠くなる.このように,登場人物の会話や人間関係の変化は作家の描写手法によって描写距離に差異があると考えられる.なお,シーンの人間関係の変化が「肯定的」であると限定したのは,喧嘩など否定的な人間関係の変化であれば,表現が婉曲的になってしまい,分析の難易度が高くなると考えられたからである.具体的な人間関係が肯定的に変化するイベントとしては,物語を構造的に記述する方法を提案した先行研究[42]のタグを用いた場合,「改心」,「反省」,「和解」,「なだめる」,「依頼の受諾」,「感謝」,「赦し」,「もてなす」,「親睦」,「賞賛(人間関係)」が該当すると考えられる.

また,登場人物が多人数であると分析が困難であると考えられる.加えて,登場人物が一人の場合も,心理描写などにより描写距離に差異が出ることは想定されるが,対人描写や会話が基本的に含まれないため,描写距離に影響を与える文体的特徴を捉える目的にはそぐわないと判断した.同じく,登場人物が存在しないシーンも,対人描写や会話が基本的に含まれないため,目的にはそぐわないと考えられる.以上の理由から,登場人物が二人のシーンであることも条件の一つとした.

3.4 データセットの概要

シーンとセンテンスの二つの観点からデータセットを作成し,それぞれについて分析することとした.

シーンデータ,センテンスデータの合計データ数をTab.3.に示す.分析対象中で上記の条件に適合するシーンは合計181箇所であった.そのうち,仮描写距離が近いものが58,中が60,遠が61であった.上記のシーンデータをセンテンス単位に分割したものをセンテンスデータと称する.センテンスデータ数は4268であった.そのうち,仮描写距離が近いものが1446,中が1475,遠が1347であった.

3.5 シーンデータ

シーンデータでは,収集したシーンごとに一意のIDを設定し,作者名,作品名,シーンの内容を示したカテゴリ等を記述した.実際に作成したデータの例を,Tab.4.に示す.カテゴリのタグについては先行研究[41]のものを用いた.シーンの条件として肯定的な人間関係の変化を設定しているため,「改心」,「反省」,「和解」,「なだめる」,「依頼の受諾」,「感謝」,「赦し」,「もてなす」,「親睦」,「賞賛(人間関係)」のいずれかとなっている.地の文の語り手は,地の文において登場人物の一人称で語られている場合は語り手の人物名を,「天の声」によって俯瞰的に語られている場合は俯瞰と記述した.地の文の主な視点は,語り手を登場人物が担っている場合はその登場人物が担うこととした.一方語り手が俯瞰であっても明らかに登場人物の目線で地の文が描かれている場合は視点を担う登場人物名を記述した.

3.6 センテンスデータ

シーンをさらに細かくセンテンスに区切り,センテンスごとに実際の文章と文字数,台詞か地の文かの分類等を記述した.実際のデータ例をTab.5.に示す.文章は,紙の小説から該当するシーンをスキャナで読み取り,人手で修正を行ってからテキストデータ化した.台詞又は地の文の分類を行う際,台詞と地の文が混合した文については,台詞の部分と台詞を含む地の文の部分に分け,それぞれ「その他(台詞)」,「その他(地の文)」というように記載し,その他(台詞)は通常の台詞と同じように,その他(地の文)は通常の地の文と同じように分析した.会話意図分類は,発話者の意図によって台詞を分類した先行研究[44]で定義されたタグを用い,どのような意図でその発話がなされたのかを19のカテゴリから選択した.地の文の語る対象は,分類のためのタグを定義した先行研究が見つけられなかったため新たに定義を作成した.この定義と詳細な説明,具体例をTab.6.に示す.「会話の状況」や「人物の内面」については該当するデータが多数存在したため小カテゴリを作成し細分化した.また,一つの地の文に複数の内容が含まれる場合もあると考えられたため,重複分類も可能とした.

Tab.1.分析対象の作家一覧

List of authors analyzed

仮描写距離:近 青春 恩田陸,重松清,森絵都
恋愛 有川浩(現:有川ひろ),中田永一,角田光代,江國香織
ヒューマンドラマ 瀬尾まいこ,群ようこ,小川糸
仮描写距離:中 ファンタジー 上橋菜穂子,梨木香歩,森見登美彦,村上春樹,西尾維新
ミステリー 東野圭吾,辻村深月,湊かなえ,綾辻行人,貴志祐介
仮描写距離:遠 時代・歴史 司馬遼太郎,宮部みゆき,池波正太郎,藤沢周平
ノンフィクション 吉村昭,新田次郎
ハードボイルド 誉田哲也,今野敏,柚月裕子
Tab.2.分析対象の作品一覧

List of works analyzed.

作家名 作品名
有川浩 植物図鑑
恩田陸 袈裟と鞦韆,獅子と芍薬,竪琴と葦笛,伝説と予感
重松清 あいあい傘,にゃんこの目,ねじれの位置
森絵都 Pの襲来,炎のジャンケンバトル,神さまのいない山,鈍行列車は行く
乙一(中田永一) ラクガキをめぐる冒険,三角形はこわさないでおく
角田光代 1,お買い物,サバイバル,雨と爪,昨日、今日、明日,糧
江國香織 ぬるい眠り,ラブ・ミー・テンダー,災難の顛末
瀬尾まいこ おしまいのデート,ランクアップ丼
群ようこ 義父,探す?,母,歌う?,母,出戻る?
小川糸 こーちゃんのおみそ汁,バーバのかき氷,ポルクの晩餐,季節はずれのきりたんぽ
上橋菜穂子 ラフラ,浮き籾
梨木香歩 カコの話,ハクガン異聞,丹生都比売
森見登美彦 桜の森の満開の下,山月記,走れメロス,百物語
村上春樹 4月のある晴れた朝に100パーセントの女の子に出会うことについて,32歳のデイトリッパー,1963/1982年のイパネマ娘,あしか祭り,バート・バカラックはお好き?,眠い
西尾維新 初めまして、今日子さん,紹介します、今日子さん
東野圭吾 嘘をもう一つだけ,冷たい灼熱
辻村深月 サクラ咲く,世界で一番美しい宝石,約束の場所、約束の時間
湊かなえ 二十年後の宿題
綾辻行人 フリークス,四〇九号室の患者,夢魔の手
貴志祐介 犬のみぞ知る,狐火の家,黒い牙,盤端の迷宮
司馬遼太郎 みょうが斎の武術,外法仏,庄兵衛稲荷,丹波屋の嬢さん
宮部みゆき お文の影,討債鬼,博打眼,坊主の壺
池波正太郎 火消しの殿,熊五郎の顔,三代の風雪
藤沢周平 臆病剣松風,邪剣竜尾返し
吉村昭 海軍乙事件,八人の戦犯
新田次郎 強力伝,凍傷
誉田哲也 バスストップ,愛したのが百年目,誰かのために
今野敏 指揮,初陣
柚月裕子 業をおろす,死命を賭ける,心を掬う
Tab.3.仮描写距離別シーンデータとセンテンスデータの数

Number of scene and sentence data by tentative depiction distance.

仮描写距離 シーン数 センテンス数
58 1446
60 1475
61 1347
合計 181 4268
Tab.4. シーンデータの例(恩田陸作『祝祭と予感』[43]より)

Example of scene data (from "Festivals and Premonitions" by Riku Onda [43])

Tab.5. センテンスデータの例(恩田陸作『祝祭と予感』[43]より)

Example of sentence data (From "Festivals and Premonitions" by Riku Onda [43].)

4 結果

4.1 基礎統計

4.1.1 シーンデータの基礎統計

仮描写距離ごとにシーンデータの基礎統計解析を行った.シーンの平均文字数を仮描写距離ごとに比較したグラフをFig.1.に示す.グラフから,全体の平均文字数と地の文の平均文字数は仮描写距離が遠くなるにつれ,全体的に減少する傾向にあった.一方,台詞の平均文字数については,仮描写距離中が最も多かった.

また,仮描写距離別に台詞と地の文の文字数の割合を比較したグラフをFig.2.に示す.仮描写距離が近い時,台詞の文字数の割合は0.41で地の文の文字数の割合は0.59,仮描写距離が中の時,台詞の文字数の割合は0.53で地の文の文字数の割合は0.47,仮描写距離が遠い時は台詞の文字数の割合は0.51で地の文の文字数の割合は0.49であった.したがって,仮描写距離が近い時のみ,台詞の文字数の割合よりも地の文の文字数の割合が多かった.しかし,台詞と地の文の両方において,文字数の割合は0.4~0.6の範囲で推移していた.

また,物語の語り手と視点について,登場人物がこれら役割を担う場合を1,それ以外の場合を0と記述したデータで,仮描写距離ごとに算出した平均をTab.7に示す.語り手と視点両方において,仮描写距離が近くなるほど登場人物が語り手や視点を担うことが多くなる傾向にあった.また,仮描写距離が近い場合はすべて視点が登場人物であり,仮描写距離が遠い場合は1つのデータを除き語り手が登場人物ではなかった.

Tab.6. 地の文の分類カテゴリ

Ground text classification category

Fig.1. 仮描写距離別1シーンあたりの平均文字数

Average number of characters per scene by tentative descriptive distance.

Fig.2. 仮描写距離別台詞と地の文の文字数の割合

Percentage of characters in dialogue and ground text by tentative descriptive distance

Tab.7.仮描写距離別語り手と視点の平均値

Mean of narrator and viewpoint by tentative descriptive distance.

語り手2値 視点2値
0.62 1.00
0.47 0.85
0.02 0.80

4.1.2 センテンスデータの基礎統計

センテンスデータの会話意図分類の統計結果をFig.3.に示す.「依頼」,「将来」,「自責」,「配慮」は仮描写距離が遠いほど増加する傾向に,「提案」,「評価」,「他責」は仮描写距離が遠いほど減少する傾向にあった.また,センテンスデータの地の文分類の統計結果をFig.4.に示す.「思考のオーバーラップ」,「感情」,「思考」,「別の場面の情報」,「環境」は仮描写距離が近いほど増加する傾向に,「人物の行動」は仮描写距離が近いほど減少する傾向にあった.最後に,重複した場合の地の文の語る対象の数について,基礎統計量をTab.8.に示す.重複するカテゴリの最大数が3であり,データの75%以上が重複分類はされていないという点がすべての仮描写距離で共通しており,仮描写距離によって重複するカテゴリの数は大きく変わらなかった.

Fig.3. 仮描写距離別会話意図分類の分布

Distribution of Conversation Intention Classification by tentative descriptive distance.

Fig.4. 仮描写距離別地の文分類の分布

Distribution of Geographical Classification by tentative descriptive distance.

Tab.8.仮描写距離別地の文分類のカテゴリ重複数

Number of overlapping categories of geographical classification by tentative descriptive distance.

  近 (n=678) 中 (n=552) 遠 (n=531)
mean 1.25 1.25 1.21
std 0.51 0.50 0.44
min 1 1 1
25% 1 1 1
50% 1 1 1
75% 1 1 1
max 3 3 3

4.2 χ二乗検定

4.2.1 仮描写距離別シーンデータの基礎統計の残差分析

シーンデータの統計解析結果について,χ二乗検定,残差分析を行った.残差分析の結果をTab.9.に示す.また,今後χ二乗検定結果の表で示される▲は,5%有意水準で大きい値,▽は小さい値を示す.仮描写距離が近い場合台詞の文字数が有意に少なく,地の文の文字数が有意に多かった.また,仮描写距離が中と遠の場合台詞の文字数が有意に多く,地の文の文字数は有意に少なかった.

4.2.2 ジャンル別シーンデータの基礎統計の残差分析

これまでの結果から,仮描写距離中において,他の距離に比べて有意に多いまたは少ない特徴量があることが明らかになった.したがって,想定される描写距離以上にジャンルの固有の性質が複数の文体的特徴に強く影響していると考えられる.そこでジャンル固有の性質を確認するため,ジャンル別にシーンデータの基礎統計を行った.

シーンデータの基礎統計結果の残差分析について,ジャンル別に行った結果の調整済み残差をTab.10.に示す.こちらも5%有意水準で評価しており,▲は,5%有意水準で大きい値,▽は小さい値を示す.仮描写距離中のジャンルの一つである「ミステリー」において台詞の文字数が有意に多く,地の文の文字数が有意に少なかった.また,仮描写距離近のジャンル3つすべてにおいて台詞の文字数が有意に少なく,地の文の文字数が有意に多かった.また,仮描写距離遠において「歴史・時代」と「ハードボイルド」では台詞の文字数が有意に多く地の文の文字数が有意に少なかったのに対し,「ノンフィクション」では台詞の文字数が有意に少なく,地の文の文字数が有意に多くなっていた.

4.2.3 形態素解析結果の残差分析

各センテンスについて,Python3で言語処理ツール「GiNZA」と「SudachiPy」を用いて形態素解析を行い,品詞の数を計測した.その結果に対して,χ二乗検定,残差分析を行った.結果をTab.11.に示す.なお,表に示したものはχ二乗検定において5%水準で有意であると判定された品詞から抜粋したものである.▲は,5%有意水準で大きい値,▽は小さい値を示す.残差分析の結果,5%水準で,普通名詞-一般や,固有名詞-人名-一般など20の品詞において距離ごとに有意差があると判定された.

4.2.4 会話意図分類の結果の残差分析

Fig.2.で示した会話意図分類の統計結果についてχ二乗検定,残差分析を行った結果をTab.12.に示す.▲は,5%有意水準で大きい値,▽は小さい値を示す.5%有意水準で評価を行ったところ,会話意図の「依頼」では仮描写距離が近いほど有意に出現確率が低く,仮描写距離が遠いほど出現確率が高くなる傾向があった.「提案」では仮描写距離が近いほど出現確率が高く,仮描写距離が遠いほど出現確率が低くなる傾向があった.また,「他責」,「感情」,「冗談」では仮描写距離近において有意に値が大きく,「感謝」では仮描写距離中で値が有意に大きく,「感情」では仮描写距離中で値が有意に小さかった.

4.2.5 地の文分類の結果の残差分析

Fig.3.で示した地の文分類の統計結果についてχ二乗検定,残差分析を行った結果をTab.13.に示す.▲は,5%有意水準で大きい値,▽は小さい値を示す.「人物の状態」と「人物の行動」では,仮描写距離が近い時に値が有意に小さく,中のときに値が有意に大きかった.加えて,「人物の行動」は仮描写距離が遠いときも値が有意に大きかった.また,「世界知識の情報」は距離中において有意に値が小さかった.

Tab.9. シーンデータの基礎統計結果についてのχ二乗検定,残差分析

χ-square test and residual analysis for basic statistical results of scene data

Tab.10. ジャンル別シーンデータの基礎統計結果についてのχ二乗検定,残差分析

Residuals analysis for basic statistical results of genre-specific scene data

Tab.11. 形態素解析の残差分析の結果

Result of residual analysis of morphological analysis.

Tab.12. 会話意図分類の残差分析での調査済み残差(有意差のある項目のみ抜粋)

Investigated residuals in the residual analysis of conversational intention classification (only items with significant differences are excerpted)

Tab.13. 地の文分類の残差分析での調整済み残差(有意差のある項目のみ抜粋)

Adjusted residuals in the residual analysis of the geographical classification (only items with significant differences are excerpted)

4.3 カテゴリ間比較

シーンの物語の機能として出現回数が多い「親睦」,「依頼の受諾」,「なだめる」のカテゴリに該当するシーンについて,会話意図分類の分布を計測し,カテゴリごとの差を調査した.各シーンで出現回数が多い順に5つ会話意図分類のタグを並べた表をTab.14.に示す.会話意図分類では,「依頼の受諾」において「依頼」が,「なだめる」において「配慮」が他のカテゴリと比べて多く出現していた.なお,これらのカテゴリは表中に太字で表示している.また「依頼の受諾」における「依頼」と「なだめる」における「配慮」の両方が,仮描写距離が遠くなるにつれ出現回数の順位が高くなる傾向にあった.また,「陳述」,「質問」,「思考」については描写距離やカテゴリに関わらず出現回数の順位は高かった.

また,出現回数が多い「親睦」,「依頼の受諾」,「なだめる」のカテゴリに当てはまるシーンについて,地の文の語る対象の分布を計測し,カテゴリごとの差を調査した.各シーンで出現回数が多い順に5つ地の文分類のタグを並べた表をTab.15.に示す.地の文の語る対象の分類ではカテゴリや仮描写距離に関わらず表中に太字で表示した「人物の行動」の出現回数が最も多かった.

Tab.14. カテゴリ・仮描写距離別会話意図分類(出現回数順)

Classification of conversational intention by category and temporary descriptive distance (in order of number of occurrences)

Tab.15. カテゴリ・描写距離別地の文分類(出現回数順)

Geographical classification by category and descriptive distance (by frequency of occurrence)

4.4 共起分析

4.4.1 Jaccard係数

地の文の語る対象分類単体,そして地の文の語る対象と会話意図分類両方について共起分析を行った.共起分析では,同じシーン中で出現した地の文の語る対象や会話意図分類に対して共起していると定義した.共起の程度をはかる指標として,テキストの共起分析の指標として用いられることの多いJaccard係数を使用した.Jaccard係数は,2つの集合に含まれている要素のうち共通要素が占める割合を示している.係数の値は0から1の間となり,Jaccard係数が1に近づくほど2つの集合の類似度は高いといえる.

4.4.2 地の文分類の共起分析

地の文の語る対象に対して算出したJaccard係数の表をTab.16.に示す.なお,Jaccard係数が0.4未満のものは表示していない.また,算出したJaccard係数を用いPythonのライブラリであるNetworkXによって共起ネットワークの可視化を行った.その結果をFig.5.に示す.グラフにおいてはエッジの太さをJaccard係数によって変化させている他,ノードの大きさは,ページランクアルゴリズムで各ノードの重要性をソートした結果に基づいて変更している.仮描写距離近ではJaccard係数が0.4以上のペアが15存在するのに対し,中と遠では6と,仮描写距離が近いとき,ペア数が多く存在する結果となった.また,図より,どの仮描写距離においても「人物の行動」,「人物の状態」,「思考」,「感情」の4つのノードによる構造は維持されていた.また,仮描写距離が近いグラフでは他の仮描写距離よりも「登場人物の情報」が共起する回数が多かった.

4.4.3 地の文分類と会話意図分類との共起分析

地の文の語る対象と会話意図分類の両方に対して算出したJaccard係数の表をTab.17.に示す.なお,Jaccard係数が0.6未満のものは表示していない.また,地の文の語る対象のときと同様に共起ネットワークの可視化を行った.その結果をFig.6.に示す.仮描写距離近ではJaccard係数が0.4以上のペアが15存在するのに対し,中では8,遠では4と,地の文の語る対象単体のときと同様に,仮描写距離が遠くなるにつれて強く共起する地の文の語る対象が全体的に減少する傾向にあった.あわせて,共起ネットワークの複雑さも仮描写距離が遠くなるにつれ減少していく傾向にあった.また,「人物の行動」と「思考(会話)」,「人物の状態」と「思考(会話)」は仮描写距離が遠くなるにつれJaccard係数は減少する傾向にあった.一方「人物の行動」と「陳述」については,仮描写距離が遠くなるにつれJaccard係数が増加する傾向にあった.加えて,仮描写距離中において「応答」と「質問」,「応答」と陳述など,他の仮描写距離では出現回数が少ないペアが多く出現していた.

Tab.16. 地の文分類単体のJaccard係数

Jaccard coefficients for geographical classification alone.

Fig.5.1. 地の文分類の共起ネットワーク(仮描写距離:近)

Co-occurrence network of geographical classification (Tentative drawing distance: close)

   

Fig.5.2. 地の文分類の共起ネットワーク(描写距離:中)

Co-occurrence network of geographical classification (Tentative drawing distance: medium)

Fig.5.3. 地の文分類の共起ネットワーク(描写距離:遠)

Co-occurrence network of geographical classification (Tentative drawing distance: far)

Tab.17. 地の文分類と会話意図分類のJaccard係数

>Jaccard coefficients for ground sentence classification and conversational intention classification

Fig.6.1. 地の文分類と会話意図分類の共起ネットワーク(仮描写距離:近)

Co-occurrence network of ground sentence classification and conversational intention classification (tentative depiction distance: close)

Fig.6.2. 地の文分類と会話意図分類の共起ネットワーク(描写距離:中)

Co-occurrence network of ground sentence classification and conversational intention classification (tentative depiction distance: medium)

Fig.6.3. 地の文分類と会話意図分類の共起ネットワーク(描写距離:遠))

Co-occurrence network of ground sentence classification and conversational intention classification (tentative depiction distance: far)

5 考察

5.1 シーンデータの分析結果からの考察

1シーン当たりの平均文字数について,仮描写距離が遠くなるほど文字数と地の文の文字数が減少する傾向があったことから,描写距離が遠いほど特に地の文の描写が簡潔になることが推測される.一方台詞の平均文字数については仮描写距離中が最も多かったことから,台詞と描写距離の間には相関は無いと考えられる.ジャンル間での分析では仮描写距離中のジャンルの一つである「ミステリー」において台詞の文字数が有意に多く,地の文の文字数が有意に少なかった一方,仮描写距離中のジャンルのもう一つである「ファンタジー」においては有意に少ないまたは多いという結果が得られなかったことから,台詞の文字数において仮描写距離中が最も多くなっている原因のひとつは,「ミステリー」というジャンルの作風にあると考えられる.「ミステリー」では登場人物同士の台詞による情報のやり取りが重要な点となる.その点が分析結果に影響を与えたのだと推測される.

また,語り手の値と視点の値が,仮描写距離が近くなるほど1に近づく傾向にあることから,「物語を語る側」が物語内の出来事に近づくことで描写距離が近くなると考えられる.

5.2 センテンスデータの分析結果からの考察

まず,地の文の語る視点について,仮描写距離が近くなるほど登場人物視点の割合が増える傾向にあったことから,登場人物の視点で物語を語ることにより,描写距離が近くなると推測される.

形態素解析結果の残差分析では,品詞の数について,仮描写距離によって有意な差が確認されたことから,特定の品詞の出現回数は描写距離に影響を与えていることが推測される.特に,人名については,人名-一般では仮描写距離近が有意に高いことに対し,姓では仮描写距離遠が高かったことから,語り手と登場人物との距離感を人物の呼び方で表す傾向があることが推測される.また,副助詞と終助詞において仮描写距離が近い場合有意に値が大きく,遠い場合は値が小さかったことから,助詞によって他の用言を修飾したり,話し手の心情や判断を表したりすることで文の詳細性を高め,描写距離が近づいていることが推測される.一方単語の前について意味を付加する接頭辞においては,仮描写距離が近い場合有意に値が小さく,遠い場合有意に値が大きいことから,接頭辞による修飾は描写距離が近い場合でも用いられることが少なく,逆に描写距離が遠いと「固い」ジャンルが多いため,慣習的に用いられることが多いと推測される.

会話意図分類の分析では,「依頼」は仮描写距離が遠いほど増加する傾向に,「提案」は仮描写距離が近いほど増加する傾向にあったことから,登場人物が別の登場人物に何か頼みごとをする際,直接的に描写することによって描写距離が遠く,また「提案」などを用いて間接的に描写することで描写が複雑になり,描写距離が近くなると推測される.「感情」や「冗談」が,残差分析において仮描写距離が近い場合に値が有意に大きかったことから,描写距離が近い場合,登場人物が台詞によって感情表現を行う,冗談をいうなど物語の進行上必ずしも必要ではないイベントが起こり,それによって描写に複雑性が生まれ,描写距離が近くなると推測される.また,カテゴリ間比較より,シーンの内容に関わらず「陳述」,「質問」,「思考」の出現回数が高かったことから,これらの要素は内容や描写距離に関わらず,物語を構成する上で台詞に必要不可欠な要素であると推測される.また,「依頼の受諾」の内容では「依頼」,「なだめる」では「配慮」が,仮描写距離が遠いほど出現回数の順位が高くなる傾向にあったことから,描写距離が遠くなるほど会話内容が直接的に出現しやすいことが推測される.最後に,共起分析より,仮描写距離中において「応答」と「質問」,「応答」と「陳述」など,他の仮描写距離では出現回数が少ないペアが多く出現していたことから,ジャンルによる影響が推測される.

地の文分類の分析では,「人物の状態」と「人物の行動」は,残差分析において仮描写距離が近い場合に値が有意に小さかったことから,描写距離が近い場合は人物について直接的に描写を行っているこれらのカテゴリの出現回数を少なくし,「思考のオーバーラップ」や「感情」,「思考」,「別の場面の情報」,「環境」といった補足的な情報を入れることで婉曲的に内容を伝えつつシーンの複雑性を高めていると推測される.逆に「人物の行動」を直接的に描写することで,最低限の情報を直に表現し描写距離が遠くなっていると推測される.一方,地の文の語る対象のカテゴリ重複率が仮描写距離によってほとんど差が見られなかったことから,各描写距離に関わらず一つの地の文に収めることができる情報の量には限りがあるということが推測される.どの仮描写距離においてもカテゴリ重複数の最大値は3であったため,1つの地の文に収めることができる対象は1から3であると推測される.また,カテゴリ間比較において,地の文の語る対象の分類ではカテゴリや仮描写距離に関わらず人物の行動の出現回数が最も多かったことから,人物の行動は出現回数には違いがあるものの物語の地の文を構成する上で必要不可欠な要素であると推測される.地の文の共起分析では,仮描写距離が近いものが共起する地の文の語る対象が多かったことから,地の文で並列に語る要素の数によって物語の複雑性が変化し,描写距離も変化すると予測される.また,どの仮描写距離においても「人物の行動」,「人物の状態」,「思考」,「感情」の4つのノードによる構造は維持されていたことから,この4つの要素の結びつきは物語の地の文を構成する上で必要不可欠であり,各ノードの重要性を変化させることで描写距離を変化させていると推測される.会話意図分類との共起分析では,仮描写距離が近いほど「人物の行動」と「思考(会話)」,「人物の状態」と「思考(会話)」のJaccard係数が増加していたことから,地の文で外面的または内面的な様子を描きつつ,会話で人物の内面を描く形式が多いと推測される.例えば森絵都の「鈍行列車は行く」[45]では,「『(省略)…でも,それじゃ,今までのわたしと一緒って気もして……』うまく言えない.じれったく黙りこむ千鶴の横顔を,しほりんがじっと見つめている.」と,登場人物が自分の考えを台詞で述べた後,地の文で台詞を発した登場人物の内面とそれに対するもう一人の登場人物の様子が描かれている.一方仮描写距離が遠いほど「人物の行動」と「陳述」のJaccard係数が増加していたことから,描写距離が遠い場合は地の文で外面的な行動を描きつつ台詞でも説明を行う形式が多いと推測される.例えば柚月裕子の「業をおろす」[46]から,「『陽世が扱った,ある事件のことです』英心は厚子から,陽世が扱った事件の記録簿は篠原が持ち帰った,と聞いた旨を伝えた.」という文章では,台詞で簡単な説明を入れた後,地の文で詳しい説明を行っている様子を描写している.

5.3 考察のまとめ

まず,描写距離には複数の文体的特徴が影響していることが分析で明らかになった.そして,これまでの分析や考察から,地の文の視点や語り手を登場人物が担うなどすることで,直接的に物語の流れに関係しない情報の付加や婉曲的な表現によって表現の複雑性が増加し,それによって描写距離が近くなると考えられる.逆にいえば,表現が単調になるほど描写距離が遠くなると考えられる.描写距離を近くするために付加される情報としては,人物の名前とは別の呼び方,人物の感情や思考,冗談,思考をオーバーラップした地の文,別の場面の情報,環境,品詞であれば副助詞や終助詞があると推測される.逆に描写距離によって変化しない要素として,会話であれば陳述や質問,地の文では人物の行動,また人物の行動・状態・思考・感情の4つのノードが地の文の中心となることであると推測される.加えて,一つの地の文で表現できる対象の数にも,描写距離に関わらず限界があると推測される.

6 描写距離の計算式

以上の分析により,描写距離に影響を与える文体的特徴を絞り込むことができた.描写距離の定義式の作成に当たっては,次に,それらの特徴が描写距離に与える影響の重みを算出する必要がある.

そこで,使用する文体的特徴の抽出とそれぞれの重みを算出するため,Python3のライブラリstatsmodelsを用いて重回帰分析を行った.目的変数はジャンルで定義した仮描写距離とし,描写距離が近い場合を-1,遠い場合を1,中を0として値を設定した.説明変数は分析で描写距離に関係があると推測された文体的特徴を用いた.具体的には,シーンデータから台詞の文字数,地の文の文字数,語り手を変数として用い,センテンスデータからは会話意図分類の「依頼」,「提案」,「感情」,「配慮」,「思考」,「質問」,地の文の語る対象の「人物の行動」,「登場人物の情報」,「思考のオーバーラップ」を用いた.目的変数はシーンデータで付与した距離を使用するため,会話意図分類や地の文の語る対象のデータはシーンデータに統合する必要があった.そこで,シーンごとにその会話意図分類や地の文分類が出現した回数をカウントして,そのデータを使用した.実際に重回帰分析に用いたデータの例をTab.18.に示す.

重回帰分析の結果をTab.19.に示す.依頼が1%有効区間,台詞の文字数と配慮,人物の情報が5%有効区間で距離に正の影響を示した.また,語り手が1%有効区間で,地の文の文字数と思考のオーバーラップが5%有効区間で負の影響を示した.なお,切片のρ値は標準化してない値のものである.

重回帰分析後,有効であった変数を用いて描写距離の定義を作成した.各変数の重みづけは重回帰分析で得られた各変数の回帰係数(標準化していないもの)を利用した.具体的な計算式を以下に示す. distance は描写距離,aは語り手が登場人物であれば1,そうでなければ0を代入する語り手2値,bは「依頼」の出現回数,cは「思考のオーバーラップ」の出現回数,dは台詞の文字数,eは地の文の文字数,fは「配慮」の出現回数,gは「登場人物の情報」の出現回数をそれぞれ表す.なお,最後に足している値は重回帰分析で得た切片の値である.

distance = -0.89a + 0.12b – 0.11c + 0.001d – 0.001e + 0.13f + 0.08g + 0.27  (1)

計算式の検証のため,分析に用いていない物語文章の描写距離を,作成した計算式によって計算した.その結果について記載する.吉本ばななの「キッチン」[47]から,先述のシーンの条件に当てはまるシーンを複数抜き出し,ランダムで3つ抜き出して描写距離を計算した.なお,「キッチン」は文学賞を受賞し,ベストセラーとして高く評価されているため[48],分析に用いた他作品と同様に世間の認知度が高い作品となっている.また,登場人物の日常や人の生死を丁寧に描いている作品であることから,「ヒューマンドラマ」ジャンルに該当し,仮描写距離は近となる.

3つのシーンの描写距離はそれぞれ-0.703,-0.734,-0.878であり,平均描写距離は-0.772であった.分析に用いたデータに対して描写距離を計算したときの平均値は0.11であったため,平均と比べて描写距離が近いと推測される.また,以下に文章の一部を引用する.

“「とにかく今晩,七時頃うちに来て下さい.これ,地図.」

「はあ.」

私はぼんやりそのメモを受け取る.

「じゃ,よろしく.みかげさんが来てくれるのをぼくも母も楽しみにしてるから.」

彼は笑った.あんまり晴れやかに笑うので見慣れた玄関に立つその人の,瞳がぐんと近く見えて,目が離せなかった.ふいに名を呼ばれたせいもあると思う.

「……じゃ,とにかくうかがいます.」

悪く言えば,魔がさしたというのでしょう.しかし,彼の態度はとても,”クール”だったので,私は信じることができた.目の前の闇には,魔がさす時いつもそうなように,一本道が見えた.白く光って確かにそう見えて,私はそう答えた.彼は,じゃあ後で,と言って笑って出ていった.“

登場人物視点で心情や言動が詳細に描かれており,計算結果通り,描写距離近の特徴に合致していることがわかる.

Tab.18. 重回帰分析に用いたデータの例

>Example of data used for multiple regression analysis

Tab.19. 重回帰分析の結果

Results of multiple regression analysis

7 評価実験

7.1 実験のための事前準備

前章で定義した式で計算した描写距離が,人間が文章を読んだ時に受ける印象と一致しているかをアンケートによる評価実験を行うことで検証することとした.

アンケートを実施するにあたり,Google Formを利用した.大学生・大学院生21名を被験者とし,2024年3月20日から2024年3月31日の期間でアンケートを実施した.評価を行う文章は,次のように選出した.まず,データに用いた物語のシーンすべての描写距離を定義した式にて計算し,描写距離が近いシーン,遠いシーン,中間のシーンに3等分した.そして,描写距離が近いシーンを描写距離1,中間のシーンを描写距離2,遠いシーンを描写距離3とそれぞれ定義し,各描写距離においてランダムにシーンを3つずつ選出して評価用の文章とした.また,評価用の文章は順序効果を考慮し,被験者にランダムな順番で掲示した.回答者には掲示された物語文章に対し,描写距離が3段階のうちどれが当てはまると思うかを第二候補まで回答させた.また,教示文には,描写距離の説明と,各描写距離の例文を記載した.以下に,実際のアンケートの教示文と例文を記述する.例文には作者と作品名を記載しているが,実際のアンケートでは記載していない.

教示文:

このアンケートでは物語文章における描写距離の分類を実施する.

これより指定された9つの物語文章を読み,その文章の描写距離として,最も適切だと感じた第一候補と第二候補の二つを回答してください.描写距離の定義は,以下の通りです.

 

描写距離…物語の語り手と物語内の出来事との間にある距離感のこと.読み手が物語を読んだ時に,物語内の出来事をどの程度近くに感じるかという指標.3段階で評価する.

1:描写距離が近い.登場人物の言動,心情が詳細に描かれている.

2:描写距離が1と3の中間.登場人物の言動や心情が詳細に描かれている箇所と俯瞰的に描かれている箇所の両方が存在する.または,詳細とも俯瞰的とも決められない中間の表現が用いられている.

3:描写距離が遠い.登場人物の言動が俯瞰的に描かれている.

 

以下に物語文章と描写距離の例を示します.参考にして回答してください.

 

例文:

例1(角田光代作「太陽と毒ぐも」[49]より)

「クマコいっしょに暮らそっか」

自分が口にした言葉が他人のもののように耳に届いた.びっくりした.え,まじ?キクちゃん何言ってんのって,自分で訊き返しそうなほどに.

「え,まじ?キクちゃん何言ってんの」

クマコは顔をあげ,おれが心のなかでつぶやいたそのままのせりふを口にした.

「だって今おれたちが抱えてる問題っていっしょに暮らせば解決すると思うんだ.半年か,一年かすればおれの仕事ももうちょっと落ち着くと思うし,そんでいっしょに暮らせば毎日会えるんだから,わざわざ約束することもないし,待ち合わせなんかもうしなくていいんだ,どっかいくときはいっしょに家を出ればいいんだから」

言いながら,なんの解決にもなってないような気がするが,と,心のなかでもうひとりのおれが突っ込んでいる.クマコは顔をあげ,腫れぼったい目を見開いておれの話を聞いている.おれの好みの容姿ではないクマコ.気の毒なクマコ.前カレの話が唯一の攻撃方法であるクマコ.

「キクちゃん,本気で言ってんの」

「本気本気.だって馬鹿らしいじゃん,記念日云々とかで別れるのなんて」

これは本当の気持ちだった.別れたくないとか,別れたいとか,そういうことより,行事が好きか嫌いかで決定的に関係が壊れるなんて,あまりにも珍妙だ.そう思ってから,ああおれはそういうことを証明してみたいんだと気づく.人と人がいっしょにいるのに必要なのはそんなもんじゃないって.記念日なんかが関係より優先されるはずがないって.

 

例1の描写距離:1

 

例2(誉田哲也作「ドルチェ」[50]より)

彼は伏し目がちにしながら,久江に訊いた.

秀弥の無実を証明するには,どうしたらいいのですか,と.

久江はかぶりを振った.

「何も,しなくていいの.そもそも,何か証拠や嫌疑があって事情聴取をしたわけじゃないから.ただ事件現場の近くに彼がいて,その目的が分からなかったから,訊いただけなの.なのに秀弥さんは,頑なに答えようとしなかった.だから,こうやって……」

息が乱れそうになるのを,彼が必死で堪えているのが分かる.

久江は浅くだが,ゆっくりと頭を下げた.

「ごめんなさい.こうやってお話をしにくること自体,あなたには迷惑なんですよね.秀弥さんの気持ちを,無駄にすることにもなる……」

彼は黙って,小さくかぶりを振るだけだ.

練馬駅近くの,バス通りの歩道.まだ人通りも少なからずある.中には,久江たちを怪訝そうに見て通り過ぎていく人もいる.

久江はこれ以上,彼をここに引き止めておきたくはなかった.

「でも,これで終わりにしますから.もうあなたにも,秀弥さんにも,迷惑はかけないように,しますから」

 

例2の描写距離:2

 

例3(柚月裕子作「検事の死命」[46]より)

入院してから三ヶ月後,陽世はこの世を去った.末期の膵臓癌だった.知らせは敏郎から受けた.敏郎は目を真っ赤にし,「罪を犯した者ではあるが,一族の菩提寺である龍円寺で,葬儀をお願いできまいか.昔から陽世をよく知っている龍円さんに,陽世を見送ってもらいたい」と頭を下げた.

目の前で畳に額がつくほど頭を下げる敏郎に向かって,英心は言った.

「お父さん,なにを言うとりんさるんな.陽世の葬儀はぜひわしの手で,この龍円寺で,やらしてつかあさい.断られたら土下座してでも,頼むつもりでしたけん」

 

例3の描写距離:3

7.2 評価実験の結果

評価実験の結果,合計で21人の回答を得ることができ,ランダムに並べられた9個の物語文章に対して,合計189個の回答データを得られた.描写距離の回答率について問題,項目ごとに記載した表をTab.20に示す.「問題1において,第一候補に描写距離が1であると回答した人の割合は0.67」というような見方である.なお,問題1から3は描写距離1の物語文章,問題4から6は描写距離2の物語文章,問題7から9は描写距離3の物語文章である.また,各問題の第一候補のみの正答率と,第二候補までの正答率の表をTab.21に示す.なお,この評価実験における正答は下記の手順で定めた.

  1. 1.   本研究で用いた全シーンの描写距離を前節で定義した式で計算
  2. 2.   全シーンを描写距離が近いシーン,遠いシーン,中間のシーンに3等分
  3. 3.   評価実験で用いるシーンを抽出し,各シーンの描写距離は上記3分割での近・中・遠とした

第一候補までの正答率が最も高いものは問題番号3で90%,最も低いものは問題番号9で14%であった.また,第二候補まで合わせた正答率では,描写距離2の問題はすべて100%であり最も高く,最も低いものは問題番号9の29%であった.

 

κ = P ¯ P e ¯ 1 P e ¯ (2)

 

P ¯ = 1 N i = 1 N 1 n ( n 1 ) j = 1 k n ij ( n ij 1 )  (3)

 

P e ¯ = j = 1 k ( 1 Nn i = 1 N n ij ) 2  (4)

 

また,評価者同士の回答の一致度を検証するため,Kappa係数を求めた.各評価者同士,また,正答との一致率,期待される一致率,Kappa係数をそれぞれ示した表をTab.22.に示す.なお,Kappa係数は式(2),一致率 P ¯ は式(3),期待される一致率 P e ¯ は式(4)で求められる.式中の κ はKappa係数,iは項目番号,Nは項目数,nは評価者数,jは評価カテゴリ番号,kは評価カテゴリ数, n ij はi番目の項目をj番目のカテゴリに割り当てた評価者の数を表す.

表から,第一候補までの各被験者の一致率は0.474,期待される一致率は0.337,Kappa係数は0.207であった.また,各被験者の正答との一致率を求め,平均を算出した.第一候補の正答との平均kappa係数は0.294,第二候補まで含めた場合は0.524であった.

Tab.20.評価実験での各項目の回答率

Response rate for each item in the evaluation experiment

問題番号

/描写距離

1

(第一候補)

1

(第二候補)

2

(第一候補)

2

(第二候補)

3

(第一候補)

3

(第二候補)

1 0.67 0.29 0.33 0.67 0.00 0.05
2 0.62 0.14 0.29 0.71 0.10 0.14
3 0.90 0.10 0.10 0.90 0.00 0.00
4 0.10 0.24 0.43 0.57 0.48 0.19
5 0.14 0.10 0.52 0.48 0.33 0.43
6 0.05 0.05 0.38 0.62 0.57 0.33
7 0.10 0.10 0.38 0.62 0.52 0.29
8 0.05 0.19 0.48 0.52 0.48 0.29
9 0.48 0.24 0.38 0.62 0.14 0.14
Tab.21.評価実験での各問題の正答率

Percentage of correct answers for each question in the evaluation experiment

問題番号 正答率 第二候補まで合わせた正答率
1 0.67 0.95
2 0.62 0.76
3 0.90 1.00
4 0.43 1.00
5 0.52 1.00
6 0.38 1.00
7 0.52 0.81
8 0.48 0.76
9 0.14 0.29
Tab.22.被験者間でのKappa係数

Kappa coefficient across subjects

被験者間のKappa係数

正答とのKappa係数

(第一候補のみ)

正答とのKappa係数

(第二候補を含む)

一致率 0.474 0.529 0.841
期待される一致率 0.337 0.333 0.667
Kappa係数 0.207 0.294 0.524

7.3 評価実験の結果に対する考察

評価実験において,描写距離が近い文章は描写距離が遠い文章に比べ,正答率が全体的に高くなっていることから,描写距離が近い文章の方が正しく描写距離を認知しやすいことが推測される.また,第二候補まで合わせた正答率は,中間である描写距離2の文章すべてにおいて100%となっていることから,描写距離2が第一候補ではない場合,被験者は,第二候補には中間である描写距離2を選択する傾向があることがわかる.

描写距離中の問題すべてにおいて,第一候補に「描写距離が遠い」と回答する確率が,「描写距離が近い」と回答する確率よりも高かったことから,中間の描写距離においては描写距離が遠いと誤答する傾向があることが推測される.また,描写距離遠においては,問題7と8については描写距離が中と誤答する確率が高かったが,問題9については描写距離が近いと誤答する確率が他の問題と比べて高かった.問題9の物語文章を抜粋して以下に示す.なお,文章は今野敏作「初陣」[51]より抜粋している.

“「小学校からの付き合いじゃないか」

「おまえはそういう言い方をするが,俺たちは小学校時代に親しかったわけじゃない」

「キャリアの同期で,小学校の同級生というのは貴重なものだぞ」

「忘れたのか,俺はおまえたちにいじめられていたんだ」

「そうだっけな……」

本当に覚えていなかった.小学校時代のことはよく覚えている.だが,竜崎をいじめていたという記憶はない.

「やっているほうは忘れても,やられたほうは決して忘れない.いじめというのはそういうものだ」”

問題9は地の文の文字数の少なさや台詞の多さ,語り手が俯瞰であるなど,描写距離が遠い場合の特徴を持っているが,その一方で登場人物の視点が頻繁に地の文に現れるなど,描写距離が近い場合の傾向もみられる.したがって,問題9の物語文章は,描写距離が混合しているシーンであるといえる.

このような描写距離が混合しているシーンは,描写距離の判別が難しいと想定される.問題9の次に正答率が低い問題8においても,問題9よりは少ないものの,登場人物視点で心情について記述している地の文があり,描写距離の判別は困難であると推測される.描写距離の混合は,シーンというある程度大きな単位で描写距離を判定しているからこそ起こりうる現象である.現段階では描写距離の計算式はシーンに対して適応するものとしているため,内部に部分的に異なる描写距離の箇所が含まれているような混合したシーンに対しては正しく設定することができない.しかしながら,シーンよりも小さな単位,パラグラフやセンテンス等で描写距離を測定することが可能であれば,より描写距離の判定が行いやすくなる可能性がある.

また,被験者同士の一致率のKappa係数は0.207であり,Kappa係数が0.01から0.20の際はわずかに一致していると解釈されることから,回答の一致率は低く,描写距離のとらえ方は被験者によって異なるということが推測される.正答との平均一致率は第一候補のみの場合は0.294である一方,第二候補まで含めた場合は0.524であり,Kappa係数が0.41から0.60の範囲にある場合は適度に一致していると捉えられることから,第二候補まで選択の余地を増やした場合,被験者の描写距離の認識は計算式とある程度一致することが推測される.

8 総括

8.1 結論

本研究では,既存の小説作品から描写距離に影響する文体的特徴を計量的に分析することで,描写距離を複数の文体的特徴量の重み付き線形結合として定量的に定義することを目的とした.

はじめに描写距離をジャンルで定義し,定義に従って分析用の小説作品を収集した.選出した小説はシーンごとに区切り,条件を満たすシーンを抜き出して分析した.分析はシーンとセンテンスの二つの観点から行った.各観点で文体的特徴を書き出したデータを作成し,分析に使用した.分析では,各文体的特徴の基礎統計,その統計量を用いたχ二乗検定,残差分析,物語文章の形態素解析,各カテゴリ間での統計量の比較,カテゴリ同士の共起分析と共起ネットワークの可視化を行った.

分析結果から,描写距離に影響を及ぼす変数として,人物の呼び方,人物の感情や思考,冗談,思考をオーバーラップした地の文,別の場面の情報,環境,品詞であれば副助詞や終助詞等が関係することが示された.逆に描写距離によって変化しない要素として,会話であれば陳述や質問,地の文では人物の行動,また人物の行動・状態・思考・感情の4つのノードが地の文の中心となることであると示された.

この分析結果をもとに,重回帰分析によって,各要素が描写距離に与える影響の重要性の評価を行った.その結果,描写距離に正の影響を与える(多く存在するほど描写距離が遠くなる)変数として,「依頼」の内容を含む台詞,台詞の文字数,「配慮」の内容を含む台詞,登場人物の情報を含む地の文が挙げられ,特に「依頼」の内容を含む台詞が最も描写距離に正の影響を与えていた.また,描写距離に負の影響を与える(多く存在するほど描写距離が近くなる)変数として,語り手が登場人物であること,地の文の文字数,思考のオーバーラップが地の文に含まれていることが挙げられ,特に語り手が登場人物であることが,最も描写距離に負の影響を与えていた.

重回帰分析によって描写距離に影響を与える文体的特徴と重みが算出されたため,重回帰分析の回帰式によって描写距離の計算式を作成した.その結果,描写距離の計算式は下記となった. distance は描写距離,aは語り手が登場人物であれば1,そうでなければ0を代入する語り手2値,bは「依頼」の出現回数,cは「思考のオーバーラップ」の出現回数,dは台詞の文字数,eは地の文の文字数,fは「配慮」の出現回数,gは「登場人物の情報」の出現回数をそれぞれ表す.

distance = -0.89a + 0.12b – 0.11c + 0.001d – 0.001e + 0.13f + 0.08g + 0.27  [1]

語り手や視点等のパースペクティブの問題はGenette[1]においても大きく取り上げられており,Genetteの「距離」にも関係があることが示唆されていたが,重回帰分析においても,他の文体的特徴と比べて語り手の存在は描写距離に大きな影響をあたえていることが示された.

また,計算式によって出力された描写距離が,実際に人が物語文章を読んだ時に受ける印象と一致しているかを確認するため,被験者に物語文章を読んでもらい,描写距離を判定する評価実験を行った.その結果,描写距離が近いほうが人間にとって認知しやすく,計算式の結果とも一致していること,また,描写距離の判定には被験者によってばらつきがあること,大雑把な視点で見た場合,定義した描写距離と読者が受ける印象は概ね一致していることが示唆された.加えて,描写距離の特徴が混合しているシーンにおいては,描写距離の判定がより困難になるため,パラグラフ等,シーンよりも短い単位で描写距離を判定することで,一致率が高くなることが推測された.

8.2 今後の展望

本研究においては,「登場人物が二人であること,会話が中心であること,シーン内で人間関係が肯定的に変化すること」という3つの条件に合致したシーンのみを対象に分析を行っている.しかし,その結果として,地の文のカテゴリとして人物の状態・行動や思考を表すものが多く出現している可能性がある.また,この条件が原因で,描写距離に影響を及ぼす特徴としても,人物の状態・行動や思考を表すものが多く出現している可能性がある.そこで今後は,分析対象シーンを広げ,より汎用的な描写距離の定義について検討していく.

加えて,評価実験の結果から,今後はパラグラフ単位で描写距離の判定をする式の作成を検討する.しかし,パラグラフという単位は,シーンよりも小さいがゆえに情報が収まらず,描写距離の判定ができないノイズとなる文章も現れることが推測される.このようなノイズにどう対応していくかが今後の課題となる.また,今回の評価実験では詳しく触れなかったが,今後は人がどのような文体的特徴から描写距離を判断するかについても調査を進めていくことを検討する.例えば,評価アンケートによって描写距離を選んだ理由を尋ね,どの文体的特徴が人間の判断に影響を及ぼしているかを調査し,その結果を描写距離の計算式に重みづけとして組み込むことで,より人間の判断と近い描写距離の計算式が得られると推測される.本研究の成果については,小説の本文は著作権が存続しているため公開できないが,評価実験の結果を含めた本論文記載の統計結果や付与したタグについては,データを一般に公開する準備を進めている.

また,Genette[1]は人間が物語から得る情報量は「距離」により変化するとも述べた.しかしながら本研究では,描写距離と物語から提供される情報量の関係性については分析できておらず,描写距離の定義中にも組み込まれていない.そこで,今後は描写距離と情報量との相関についても検証を進めていく.

描写距離の定義の改善とは別側面の展望として,描写距離の定義を利用するシステムの構築を検討する.具体的には,描写距離を入力することで描写距離に合わせて物語表現を調整するシステムを考案している.その前段階として,今回作成したデータを用いたプログラムの構築を行う.具体的には,データと本研究で算出した描写距離を,BERT[2]等の自然言語処理モデルに学習させることで,入力した物語文章に対して各変数の値を入力することなく描写距離を出力するモデルの開発をすすめていく.加えて,今後は入力した物語文章と描写距離に合わせて,描写距離を変化させるために変更すべき箇所を抽出・変更する方法について検討していくことで,描写距離に合わせて物語表現を調整するシステムの構築をすすめていく.

参考文献
 

この記事はクリエイティブ・コモンズ [表示 4.0 国際]ライセンスの下に提供されています。
https://creativecommons.org/licenses/by/4.0/deed.ja
feedback
Top