理論と方法
Online ISSN : 1881-6495
Print ISSN : 0913-1442
ISSN-L : 0913-1442
19 巻, 2 号
選択された号の論文の9件中1~9を表示しています
特集 非定型データ分析の可能性
  • 太郎丸 博
    2004 年 19 巻 2 号 p. 131-133
    発行日: 2004/09/30
    公開日: 2008/12/22
    ジャーナル フリー
  • ―定性調査におけるテキスト・マイニングをどう考えるか―
    大隅 昇, 保田 明夫
    2004 年 19 巻 2 号 p. 135-159
    発行日: 2004/09/30
    公開日: 2008/12/22
    ジャーナル フリー
     ここではまず,テキスト・マイニング(TM)あるいはテキスト型データのマイニング(TDM)の特徴を俯瞰すると同時に,これに関わる技術的な諸要素,諸事項について総合的に報告する.つぎに,現状考えられるTMを実際データの分析に用いるうえでの諸問題を整理する.とくに,その適用可能性について,データ科学の視点から問題解決を図ることの重要性について触れ,さらに具体的なTM応用ソフトを紹介する.また,筆者等が独自に行ったWeb調査データによる分析例を通じ,どのような使い方ができるかの要点,留意事項を示す.ここでは,自由回答設問で得た情報と通常の選択肢型設問との併用による定性型情報の計量的評価の例として示すが,これはTMのごく一部の具現化に過ぎず,本来のTMのあるべき姿,目標はこれだけではない.このようなことからTMの今後の進むべき道あるいは期待される方向は何かについての私見を述べる.
  • ―『毎日新聞』にみる「サラリーマン」を題材に―
    樋口 耕一
    2004 年 19 巻 2 号 p. 161-176
    発行日: 2004/09/30
    公開日: 2008/12/22
    ジャーナル フリー
     社会調査において内容分析(content analysis)という方法が用いられるようになった当初から、新聞記事は重要な分析対象として取り上げられ、様々な分析が行われてきた。コンピュータの発達やデータベースの整備が進む現在、この新聞記事の分析にあたってコンピュータを用いることが容易になりつつある。それに加えて、新聞記事のようなテキスト型データを、コンピュータを用いて計量的に分析する方法も提案されている。そこで本稿では、1991年以降の『毎日新聞』から「サラリーマン」に言及した記事を取り出し、コンピュータを利用した分析を試験的に行うことで、以下の2点についての確認・検討を行った。第一に、コンピュータを用いても、伝統的な手作業による分析と同じ結果が得られるかどうかを確認することを試みた。第二に、テキスト型データ一般を分析するための半ば汎用的な方法として提案されている方法を、各種のテキスト型データの中でもとりわけ新聞記事の分析に用いた場合、いかなる長所短所が生じるのかを検討した。
  • ―職業コーディング自動化の方法―
    高橋 和子, 高村 大也, 奥村 学
    2004 年 19 巻 2 号 p. 177-195
    発行日: 2004/09/30
    公開日: 2008/12/22
    ジャーナル フリー
     社会調査において基本的な属性である職業は、通常、調査票に選択肢として職業コードを提示せず、自由回答法を含む複数の質問により収集したものを分析者が総合的に判断しコードを付ける。これは職業コーディングとよばれ、データを統計処理するためには必須の作業である。しかし、判断の中心となるデータが自由回答であることや職業のカテゴリ数が多い(約200)ことなどから、自由回答の分類と同様に多大な労力と時間を要するという問題が存在する。また、コーディングの結果に一貫性が欠けやすいという問題がある点も同様である。これらの問題を解決するために、自然言語処理技術の適用により職業の定義を格フレームの形式によるルールとして記述し、自動的に職業コードを決定するシステムが開発された。ルールに基づくこのシステムは、ルールにマッチしない回答をうまく処理することができないという欠点をもつが、職業コーディングで用いられる知識のすべてをルールにするのは困難である。また、ルールセットやシソーラスの継続的なメンテナンスも手間がかかる。そこで、ルールを必要としない機械学習に注目し、特に文書分類の分野で最も分類性能が高いとされるサポートベクターマシン(SVM)を職業コーディングに適用した。JGSS(日本版General Social Surveys)データを用いた実験の結果、SVMによる方法はルールベース手法より正解率が高かった。本稿の目的は、職業コーディングの自動化に対して、ルールベース手法を適用する方法およびSVMを適用する方法を提案し、その有効性を示すことである。これら2つの方法は、職業データと類似する性質をもつ自由回答の分類にも拡張が可能である。
  • ―宗門改帳の統計分析のために―
    中里 英樹
    2004 年 19 巻 2 号 p. 197-212
    発行日: 2004/09/30
    公開日: 2008/12/22
    ジャーナル フリー
     本稿は、宗門改帳を用いた統計分析および社会学におけるリレーショナル・データベース(RDB)利用の可能性を考察するものである。まず、世帯に関する質問紙調査の代表的存在である世帯動態調査を比較対象にして、宗門改帳の形式の特徴について述べる。ついで、様々な形式のデータを結合し、非定型データを定型データに変換する上で有効な道具となりえるRDBの特徴と、歴史研究における導入の事例を紹介する。その上で、宗門改帳の情報から、世帯動態調査と同様に子との同居率やその変化を算出するための変数を作成する方法について、具体的にSQL(RDB操作の標準言語)文を示しながら解説していく。さらにそれを踏まえて、社会学における質問紙の効率的な利用のためのRDBの応用可能性についても提案する。
  • ―最適マッチング分析の可能性―
    渡邊 勉
    2004 年 19 巻 2 号 p. 213-234
    発行日: 2004/09/30
    公開日: 2008/12/22
    ジャーナル フリー
     本稿では、職歴データの分析を通じて、近年系列データの分析手法として注目されつつある最適マッチング分析の有効性と問題点を検討する。職歴パターンについては、これまで原(1979)、盛山(1988) などによって検討されてきた。ただ職歴データの分析はあまり進んでいるとはいえない。本稿では、1995年社会階層と社会移動に関する全国調査(SSM調査)の職歴データを最適マッチング分析により検討する。まず入職から10年間、および30年間の職歴データについて、最適マッチング分析によって距離行列を求め、さらにクラスター分析によって、それぞれ6つのクラスターを析出した。また初職、現職、学歴、職歴パターンの関係を明らかにするために、ブール代数分析をおこなった。以上の分析から、既存の類型化とは異なり、職歴の包括的な類型化が可能であることを示し、従来の分析方法では十分にできなかった職歴の新たな分析の可能性があることを示した。
原著論文
  • ―多次元尺度構成法による世界認知構造の研究―
    田辺 俊介
    2004 年 19 巻 2 号 p. 235-249
    発行日: 2004/09/30
    公開日: 2008/12/22
    ジャーナル フリー
     本論文は様々な外国人に対する認知構造について、多次元尺度構成法による把握を試みたものである。先行研究を受けつつ本研究では、26国民・民族集団についての類似度データ、10国民・民族集団の一対比較データ、海外経験の有無や外国人友人の有無についてのデータを、主に大学生を対象として収集し、分析した。
     類似度データをクラスカルの非計量多次元尺度構成法で分析した結果、「西洋人(あるいは白人)か否か」、心理的距離、地理の3つの次元によって人々が外国人を分類していることが示された。さらに個人差多次元尺構成度法により認知構造の属性差を検討した結果、旅行経験の有無に関して旅行経験のある人の方が「西洋人か否か」(「白人か否か」)という次元をあまり重視しないという傾向が見られた。また一対比較データを選好度の多次元尺度構成法で分析した結果、「アジアびいき」、「欧米びいき」という異なる選好パターンが存在すること、またイスラム諸国やアフリカ地域の人々がどんな人からも「遠い」存在と考えられていることが示された。
  • ―ロジスティック回帰モデルの応用―
    鹿又 伸夫
    2004 年 19 巻 2 号 p. 251-264
    発行日: 2004/09/30
    公開日: 2008/12/22
    ジャーナル フリー
     本稿で提示するロジスティック回帰分析では、独立変数として、時間の経過にかんする変数、従属変数(本人の階層)と同一カテゴリーにかんする父階層のダミー変数、そしてこれらの交互作用変数を投入する。この分析方法によって、移動表から計算される対数オッズ比に相当する移動機会格差(地位継承の強さ)を回帰係数としてえられ、またその機会格差の時間的変化も分析できる。SSM調査データをもちいて世代間移動(父階層×現職階層)を階層別に分析した。その結果、移動機会格差は、6階層分類のうち3階層で年齢が高まるにつれて低下し、1階層で調査時点が後になるほど減少していた一方で、2階層は時間的変化をしめさなかった。さらに、回帰係数を利用して計算した社会全体としての機会格差指標は、1955年から1965年にかけて機会格差が急激に減少し、1965年以降は新しいコーホートほど格差が緩やかに減少してきたことをしめした。
書評
feedback
Top