データ分析の理論と応用
Online ISSN : 2434-3382
Print ISSN : 2186-4195
10 巻, 1 号
選択された号の論文の3件中1~3を表示しています
依頼資料
  • 林知己夫公開インタビュー第2回 —2001年6月23日午前10時~12時半 統計数理研究所にて—
    高橋 正樹
    原稿種別: 依頼資料
    2021 年 10 巻 1 号 p. 1-28
    発行日: 2021/08/01
    公開日: 2021/11/09
    ジャーナル フリー HTML

    日本分類学会初代会長の林知己夫先生を囲んで,「木曜会」と称する研究会が,1990 年代より2002 年に氏がお亡くなりになる前年頃まで月1 回程度のペースで開催されていた.村上征勝氏(当時,統計数理研究所)を事務局に,当初は渋谷駅に近い桜ヶ丘の林事務所で,後には参加者が増えたこともあり統計数理研究所の会議室で,数名から10 数名が集まっていた.

    初期には林先生の各方面での研究の講義,後には参加メンバーの各々が自分の研究を発表し,気楽な茶飲み話のような雰囲気で互いに講評をするというものであった.その中で高橋正樹氏の発案で林先生への公開インタビューが,2001 年に全3 回開催された.

    本稿はその第2 回分を収録したものである.第1 回及び第3 回(の一部)はそれぞれ『行動計量学』(高橋, 2004),『社会と調査』(高橋, 2012)に掲載された.今回で全3 回分が公開されることになり,すべてがJ-stage 等を通じてWeb 上で一般にダウンロードが可能となる.

    本インタビューを含め,戦後統計学の大きな柱の1 つであった林先生の科学者としての哲学と,また今日でも通ずる「科学者のあり方」,データ取得のプロセスからデータ解析,政策立案への提言までの全体を俯瞰した真正の「データの科学」,そして社会的課題解決のための本当の学際的「共同研究」のあり方について,読者の方々が深い思いを寄せる機会となれば幸いである.

    (編集委員長吉野諒三)

    本稿は公開インタビューとして行われた第2 回分をまとめたものである.事前に告知したタイトルは「共同研究の意義と方法:統計学者の立場から」であった.テープ録音を高橋が文章に起こし,林先生自身が一度目を通され,テープの余白部分の追加・加筆,録音時に不明だった点や表現,人名の確認などといった修正・補足をしていただいている.

    なお,一連のインタビューは,実は当初から3 回分を予定していたわけではなく,この2 回目の「共同研究」というテーマは林先生自身から発案があったものである.「日本人の読み書き能力調査」をはじめ数多くの共同研究に関わり,その中で数量化理論等が創り上げられていったことを考えれば納得できるテーマ設定である.様々な調査や研究の経験については,それまでにも書かれたり話されたりする機会は少なくないのに対し,共同研究という切り口からのものはほとんどない1

    内容は大きく3 つのパートに分けられる.冒頭ではまず共同研究とはどのようなものかについて語り,続いてその背景となった個人の研究史や共同研究の経験について触れている.そのうえで,共同研究はどうあるべきかについて言及している.その内容は研究そのもののあり方にも及び,3 回の中で最もメッセージ色が強いものともなっている.あらためて整理していると,統計学さらには「データの科学」の発展には共同研究が欠かせないのだという強い思いが,この発案にあったことを感じる.

    (なお,以下,全体を通じて,林文編集顧問と吉野編集長が論文誌の体裁に整備してある.脚注の中で,(T)及び(Y)はそれぞれ高橋と吉野による注釈を示す.)

    (高橋正樹)

論文
  • 渡部 諭, 澁谷 泰秀
    原稿種別: 論 文
    2021 年 10 巻 1 号 p. 29-44
    発行日: 2021/08/01
    公開日: 2021/11/09
    ジャーナル フリー HTML

    これまで,高齢者の特殊詐欺被害に対して認知機能の脆弱性にその原因が存在するとする立場から,認知機能の脆弱性を測定し判定が可能な論理を導き,詐欺抵抗力判定式として定式化した.従来の判定式ではロジスティック回帰式を用いたのに対して,本研究では高速倹約ヒューリスティクスを応用した決定木を用いた判定式への改良を提案する.高速倹約決定木を用いることによって,詐欺抵抗力判定の正解率が向上し,また,判定に基づくアドバイスの理解しやすさも向上する.更に,特殊詐欺被害者データを一般のデータと混在して分析するときに生じる不均衡データの問題及び特殊詐欺被害者データに必然的に伴う小標本の問題についても論じる.

  • 許 麗梦, 金 明哲
    原稿種別: 論 文
    2021 年 10 巻 1 号 p. 45-57
    発行日: 2021/08/01
    公開日: 2021/11/09
    ジャーナル フリー HTML

    企業の継続性に関する研究において,財務諸表がよく用いられている.また,経済レポートや電子掲示板,有価証券報告書などを活用して,計量的アプローチで企業の倒産の兆候となる情報を抽出し,企業評価と株価予測などの研究が行われている.本稿では上場企業が金融庁へ提出する年度報告書「有価証券報告書」に載せられた財務に関する数値データとテクストデータを結合して,企業の倒産判別分析を試みた.テクストデータについてはテキストマイニングの方法でデータセットを作成して用いた.その結果,数値データとテクストデータを結合して用いた場合,判別指標のマクロ平均F 値は0.941 に達し,数値データだけによる判別率0.880 およびテクストデータだけによる判別率0.895 を大きく上回ることが示された.

feedback
Top