デジタル・ヒューマニティーズ
Online ISSN : 2189-7867
最新号
選択された号の論文の4件中1~4を表示しています
preface
論文
  • 藤田 郁
    2022 年 3 巻 1 号 p. 3-15
    発行日: 2022/12/31
    公開日: 2022/12/31
    ジャーナル オープンアクセス HTML

    本研究は,トピックモデルの一つである潜在的ディリクレ配分法 (latent Dirichlet allocation;LDA) を,まだ先例の少ない韻文作品へ適用する際の問題点の一つと言えるセグメントサイズの設定について議論し,LDA の韻文作品研究応用の有効性を検討することを目的としている。LDA に限らず,トピックモデリングは,デジタル人文学やテクストマイニングの分野では有望なアプローチと考えられており,散文作品研究にトピックモデルを用いる研究は近年増加しているものの,詩作品へトピックモデルを応用した研究はあまり多くない。この手法の韻文コーパスへの適用に関しては,さらなる検討と知見の蓄積が必要である。本稿では,作品の総語数が25語から2万語超まで大きくバラつきがある Alfred Tennyson の韻文作品を対象とし,特に作品総語数が 1,000 語を超えるテクストを複数の小さいセグメントサイズに分割した結果について論じ,LDAに適用可能な最小セグメントサイズを提示する。

  • 村田 祐菜, 永崎 研宣, 大向 一輝
    2022 年 3 巻 1 号 p. 17-26
    発行日: 2022/12/31
    公開日: 2022/12/31
    ジャーナル オープンアクセス HTML

    文学研究をはじめとした諸分野において, 一定規模のテキストを素早く, 網羅的に検索可能な環境が整備されていることは研究基盤の点から重要である.しかし,近代短歌は研究に利用可能な電子テキストの蓄積が十分ではない.また,日本文学研究者はプログラミング技術等を用いたテキストの処理・分析手法をとる場合はいまだ少なく,テキストの構築に加え,データの利用環境としての検索・分析インターフェースの整備も必要である.そこで研究データとしての近代短歌の電子テキストの作成及びその利用環境としての全文検索システムを構築し,「近代短歌データベース」として公開した.本稿ではその構築過程と実現した機能の詳細,近代短歌研究における利用事例について述べる.

データ論文
  • 片倉 峻平
    2022 年 3 巻 1 号 p. 27-31
    発行日: 2022/12/31
    公開日: 2022/12/31
    ジャーナル オープンアクセス HTML
    J-STAGE Data

    本稿では,中国出土資料に登場する古文字の解読情報を機械可読なテキスト形式で記述したデータを紹介する.このデータは研究者ごとに見解の異なる複数の解読情報を網羅的に参照することを目的としたものであり,表データとして作成した.既にデジタルアーカイブの検索用途に対して応用的に利用されている.本稿執筆時点では「包山楚簡」という出土資料のデータのみ公開しているが,以降も対象となる資料を拡大させて同リポジトリにデータを蓄積してゆくことを計画している.出土資料の文字のテキストデータ化は未だ充分に進んでおらず,本データがその先駆けとして機能することを期待する.

feedback
Top