詳細検索結果
以下の条件での結果を表示する: 検索条件を変更
クエリ検索: "Yahoo!ブログ"
74件中 1-20の結果を表示しています
  • 李 文平, 劉 海濤, 熊 子涵
    計量国語学
    2022年 33 巻 5 号 325-340
    発行日: 2022年
    公開日: 2023/06/20
    ジャーナル オープンアクセス
    本研究では,「現代日本語書き言葉均衡コーパス」のコアデータに対する文節係り受け・並列構造情報のデータを利用し,6つの文章ジャンルにおける語順の自由度,格標識の豊富さ及び両者の相関を定量的に分析した.その結果,次の三点が明らかになった.第一に,語順の自由度は白書,
    Yahoo
    !
    ブログ
    ,Yahoo!知恵袋,新聞,雑誌,書籍の順に高くなる傾向が見られた.第二に,格標識の豊富さは
    Yahoo
    !
    ブログ
    ,Yahoo!知恵袋,新聞,雑誌,書籍,白書の順に高くなることが明らかになった.第三に,白書以外の5つの文章ジャンルにおいて,語順の自由度と格標識の豊富さの間に正の相関関係が見られた.本研究では,日本語の語順の自由度と格標識の豊富さとの関係を初めて定量的に分析した.本研究の結果は統語と形態との関係の面,及び言語普遍性の面から日本語をより深く理解するために役立つと考えられる.
  • 佐藤 凖一
    マリンエンジニアリング
    2015年 50 巻 5 号 553-560
    発行日: 2015/09/01
    公開日: 2016/12/03
    ジャーナル フリー
  • 中西 弘樹
    漂着物学会誌
    2015年 13 巻 15-19
    発行日: 2015/12/25
    公開日: 2022/08/30
    ジャーナル オープンアクセス
    The seed morphology and seed drifting of Vernicia fordii (Hemsl) Airy Shaw were investigated. The size of seed, number of seeds per fruit, proportion of three morphological types of seeds, seed buoyancy in water were surveyed about the seeds collected from two cites of V. fordii community in Nagasaki Prefecture, southwestern Japan. The survey about drift seeds of V. fordii was also done on the coasts in Nagasaki Prefecture. It was found that there was a relation between three morphological type of seeds and number of seeds per fruit. The three types of seed are the Shina type which is obovate with transversely rhombic in cross section, the Kanton type which is very broadly obovate with transversely narrowly elliptic in cross section and the Middle type which are middle shape between the Shina and Kanton types. Seeds of Shina type are found in the fruits which have chiefly five seeds per fruit. Seeds of Kanton type are found in the fruits which have chiefly two or three seeds per fruit. Seeds of the Middle type are found in the fruits which have chiefly four seeds per fruit. The drift seeds collected were also divided into such three types of seed. From the observation results and the distribution of V. fordii and V. montana Lour. in Japan, the drift seeds have been identified with V. montana must be seeds of the Kanton type of V. fordii. Any seeds floated in water have no embryo so that the drift seeds of V. fordii could not germinate.
  • 小山田 智寛, 二神 葉子, 逢坂 裕紀子, 安岡 みのり
    デジタルアーカイブ学会誌
    2020年 4 巻 2 号 154-157
    発行日: 2020年
    公開日: 2020/04/25
    ジャーナル オープンアクセス

    近年、デジタルコンテンツの公開がますます盛んになり、オープンデータによるデジタルデータの活用も進んでいる。一方、フロッピーディスクやMOなどの記録メディアの問題は言うまでもなく、2019年12月の

    Yahoo
    !
    ブログ
    のサービス終了など、プラットフォームの変容に追随できず公開が持続できないデジタルコンテンツも増えている。東京文化財研究所では、2018年、幕末から明治大正期にかけての書画家の番付のデータベースを公開したが、これは2004年に作成され、技術的な問題で公開が停止していたデータベースのリニューアルである。このリニューアル作業を例として、デジタルコンテンツを持続させるための課題を検討したい。

  • 菊地 礼
    表現研究
    2022年 115 巻 14-23
    発行日: 2022/04/30
    公開日: 2023/05/24
    ジャーナル フリー
  • 中俣 尚己
    計量国語学
    2020年 32 巻 7 号 419-435
    発行日: 2020/12/20
    公開日: 2021/12/20
    ジャーナル オープンアクセス
    本論文では,日本語学習者にとって困難とされる副詞の文体情報の計量を試みた.日本語教育において基本となる副詞ならびにそれと文体的には異なるが意味が似ている副詞計164語を対象とした.それぞれの副詞をBCCWJで検索,14レジスターにおける調整頻度を算出し,得られたデータに対し,主成分分析を行った.各副詞における2つの主成分の主成分得点により,副詞を分類した. 主成分分析の結果,PC1として「双方向的VS一方向的」の対立軸,PC2として「自己表現的VS公共的」の対立軸が抽出された.これは英語の文体研究と合致する.副詞はこの二軸を用いて「A 自分について表現する副詞」「B 客観的に表現する副詞」「C1 より洗練されたやりとりで使う副詞」「C2 日常的なやりとりで使う基本の副詞」の3種4類に分類される.この分類では,類義の副詞はほぼ異なるグループに属することが確認された.
  • ――文章ジャンルの位相差を対象に――
    李 文平, 劉 海濤, 小森 早江子
    言語研究
    2022年 162 巻 47-62
    発行日: 2022年
    公開日: 2022/10/25
    ジャーナル フリー

    本研究では,異なる文章ジャンル間の相違点と共通点を把握するために,統語情報が付与された日本語コーパス,具体的には「現代日本語書き言葉均衡コーパス」(国立国語研究所)のコアデータのツリーバンクである「UD Japanese-BCCWJ」を利用し,白書,新聞,書籍,雑誌,

    Yahoo
    !
    ブログ
    ,Yahoo!知恵袋の6つのジャンル間で統語依存関係,統語複雑度,依存方向において位相差があるか否かを考察した。その結果,統語依存関係,統語複雑度,依存方向はジャンルごとに異なっており,これらの指標は内容語か機能語かといった指標と同様に,文章ジャンルの特徴をある程度反映していることがわかった。また,統語複雑度と関係する依存距離は最小化される傾向があるという位相間に共通の法則が見られた。

  • 「あつめる」と「くらう」との比較を中心に
    小山田 由紀
    計量国語学
    2017年 31 巻 2 号 84-98
    発行日: 2017/09/20
    公開日: 2019/01/11
    ジャーナル オープンアクセス
    本稿は,受動態に関わる機能動詞について考察するものである.これらの機能動詞は,一様に同じ働きを担っているわけではなく,それぞれに特徴があると考えられる.そこで,辞典の記述やコーパスの調査によって,機能動詞の特性の違いを明らかにすることを試みた.まず概念的な考察によって機能動詞の特性を捉え,さらに,その結果を踏まえて,計量的な考察を行った.計量的な考察においては,出現分野からみた機能動詞の分布・機能動詞の名詞部分・機能動詞結合主格と能動主体との組み合わせという3 つの観点が有用である.以上の考察から,受動のタイプ,名詞部分の特徴,文体や評価極性など,機能動詞の特性の違いが明らかになった.
  • 中井 延美
    異文化の諸相
    2019年 39 巻 1 号 19-29
    発行日: 2019/02/25
    公開日: 2023/07/19
    ジャーナル フリー

    Over the past ten years or so, the loanword for hospitality, which was not heard much before, has come to be commonly used in Japanese. Searching for the term hospitality in katakana in the Balanced Corpus of Contemporary Written Japanese (BCCWJ), 46 out of a total of 50 examples appeared in the media since 2000. The loanword for hospitality (ホスピタリティ), which is based on the meaning of the original word hospitality, is often referred to as cordial omotenasi in Japanese, undergoing a unique change in the Japanese language. This article examines how the loanword for hospitality has been integrated into the Japanese language during the past 70 years, highlighting examples that appear in the written language media.

  • 財津 亘, 金 明哲
    情報知識学会誌
    2017年 27 巻 3 号 261-274
    発行日: 2017/09/28
    公開日: 2017/11/24
    ジャーナル フリー

     犯人の早期検挙を目的とした捜査支援手法である犯罪者プロファイリングは,犯罪現場の状況などを統計的もしくは心理学的に分析し,犯人の性別や年齢層,職業などの犯人像を推定するものであるが,印字された文書や電子メールなどしか存在しない事件においては犯罪現場自体がないため,有効な手段が従来はなかった.本研究は,文章情報を基に,犯人像を推定する手法の開発の嚆矢として,まずブログを対象に,ランダムフォレストによる著者の性別推定を試みた.その結果によると,性別推定には,漢字や平仮名,片仮名,名詞の使用率,品詞(動詞・形容詞・助詞・感動詞)や接続助詞「し」,助動詞「なかっ」,読点,文字(代名詞「私」「僕」,小書き文字「っ」「ゃ」) の使用頻度が有効で,1個抜き交差確認法による検証の結果,最高で正解率86.0% (適合率:男性84.6%,女性87.5%) を得た.なお,サポートベクターマシンを用いた検証も合わせて実施したが,正解率は最高で 75.0%(適合率:男性69.2%,女性85.7%)と相対的に低い精度を示した.

  • Elastic Netを使用したモデル構築と評価
    岩崎 拓也
    計量国語学
    2018年 31 巻 6 号 426-442
    発行日: 2018/09/20
    公開日: 2019/09/20
    ジャーナル オープンアクセス
    正書法が一般に浸透していない日本語の文において,読点を打つ・打たないということは恣意性の高い選択である.本研究では,接続詞の直後に読点が打たれる要因を探ることで,日本語の文における読点使用の理由の一端を明らかにすることを試みた.分析データには,BCCWJ のコアデータを使用し,モデル構築にはElastic Netを用いた正則化付きの一般化線形モデルを作成した.この手法をとることで,過学習を防ぐことと,従来では扱うことができなかった情報量の多い変数を取り扱うことができる.モデル評価には,10分割サンプルによる交差検証を実施した.今回構築したモデルを用いて元データの再分類を行った結果,再現率は78.99%であった.また,係数を確認したところ,語彙素「で」,接続詞が文頭にあるとき,語彙素「が」,レジスター「白書」,語彙素「然しながら(しかしながら)」といった指標が接続詞の直後に読点が打たれる強い指標であった.
  • ブログとTwitterを例に
    岸本 千秋
    計量国語学
    2022年 33 巻 7 号 466-480
    発行日: 2022/12/20
    公開日: 2023/12/20
    ジャーナル オープンアクセス
    ブログとTwitterを対象として文体の特徴を明らかにした.ブログについては,品詞比率,語種比率の結果から,きわめて話しことば的であることを確認した.Twitterについては,品詞比率からは書きことばに近いととらえられるが,これは,字数制限が影響しているとの解釈が妥当であるとした.Twitterの語種比率では,和語の値が高く,話しことば的な俗語,書き手の感情や状況を強調して表す語,物事に対する評価などを表す語が上位にランクインした.また,ウェブ記号が文体にどのような影響を及ぼすかについて,ウェブ記号がある文とない文との品詞比率の差をロジット変換によって再表現した結果,ブログもTwitterも,ウェブ記号がある文は形容動詞・感動詞について,ウェブ記号がない文は,連体詞・接続詞についてより大きく評価された.
  • 金 愛蘭
    計量国語学
    2013年 29 巻 2 号 66-70
    発行日: 2013/09/27
    公開日: 2024/05/01
    ジャーナル オープンアクセス
  • 関 洋平
    自然言語処理
    2014年 21 巻 2 号 271-299
    発行日: 2014/04/18
    公開日: 2014/07/17
    ジャーナル フリー
    意見分析の研究が盛んになり,世論調査,評判分析など,多岐にわたる応用が実現されている.意見分析の研究においては,他の言語処理研究と同様に,コーパスの重要性が指摘されている.意見分析研究のコーパスは,応用目的に応じて,対象とする文書ジャンルが変化し,アノテーションすべき意見の情報も変更する.現在,意見分析コーパスは,ニュース,レビュー,ブログなどの文書ジャンルを対象としたものが多い.一方で,対話型の文書ジャンルには焦点が当てられておらず,アノテーションについての明確な方針がない.本稿では,『現代日本語書き言葉均衡コーパス』に含まれるコミュニティ QA の文書を対象として,詳細な分類タイプに基づく意見情報ならびに関連した情報のアノテーションを行い,コーパスを作成する.また,複数のアノテーション情報を重ね合わせることにより,コーパス中の質問や回答に現れる意見の特徴を明らかにすることで,ドメインを横断した意見分析や,意見質問の応答技術といった,現在の意見分析研究が直面している難しい課題に対する新たな知見を提供できることを示す.
  • 宮尾 学
    組織科学
    2016年 49 巻 3 号 21-32
    発行日: 2016/03/20
    公開日: 2016/08/29
    ジャーナル フリー

     本稿では,多義的な製品の開発と価値創出について非決定論的な視点で事例研究を行い,次の点を発見した.開発プロセスでは,製品コンセプトの提案・評価・変更の応酬によって,製品が創出しうる価値が最大限議論された末に1つのコンセプトに収斂していた.さらに,製品の価値創出プロセスでは,こうした組織内での対話に加え,消費者への伝達,伝達内容と製品設計の調整,競合の追随という4つのメカニズムが複雑に作用していた.

  • 加藤 祥, 菊地 礼, 浅原 正幸
    自然言語処理
    2020年 27 巻 4 号 853-887
    発行日: 2020/12/15
    公開日: 2021/03/15
    ジャーナル フリー

    日本語の比喩表現の実態把握を目的として,『現代日本語書き言葉均衡コーパス』に基づく指標比喩データベースを構築した.『比喩表現の理論と分類』に掲載されている 359 種類の比喩指標要素を手掛かりとし,『分類語彙表』に基づいて類義用例を確認しながら指標比喩表現候補を展開し,コアデータ6レジスタ(Yahoo! 知恵袋・白書・

    Yahoo
    !
    ブログ
    ・書籍・雑誌・新聞)1,290,060 語から人手で 822 件抽出した.抽出した比喩用例には,喩辞・被喩辞の情報と,その分類語彙表番号を付与したほか,擬人化・擬物化・擬生化・具象化などの種別情報も付与した.さらに提喩・換喩・文脈比喩・慣用表現などの情報も付与した.上記作業は言語学者によったが,非専門家が比喩表現をどのように捉えるかを評価するために,比喩性・新奇性・わかりやすさ・擬人化・具体化(具象化)の 5 つの観点について,1事例あたり 22–77 人分(平均 33 人分)の評定値を付与した.レジスタ毎の相対度数や評定値の分布により,現代日本語の指標比喩表現の使用傾向を確認した.

  • 荒井 俊介, 辻 慶太
    情報知識学会誌
    2013年 23 巻 1 号 1-19
    発行日: 2013/02/20
    公開日: 2013/04/18
    ジャーナル フリー
     Blog やTwitter に書かれた日常的な質問を収集し回答を呼びかけるWeb サイトを構築すれば,記事の著者は効率よく回答を得ることが出来るかもしれない。本研究では次の2 つのステップからなる記事の収集方法を提案し,実際に質問を提示するWebサイトを構築して,有効性の検証を行った。即ち,(1)疑問の書かれた記事に特徴的な表現を用いた,既存のサーチエンジンによる検索,(2)テキスト自動分類を用いた疑問の書かれた記事の抽出,である。(1)では「タイトルが思い出せない」をキーワードとして用いることで,効率的に疑問の書かれた記事を抽出できることを明らかにした。(2)ではブースティングと決定木を用いる事で効率よく抽出できることを明らかにした。さらに疑問の書かれたBlog 記事30 個とTwitter 記事31 個をWeb サイトに提示した結果,それぞれ6 個と5 個の記事の著者を満足させる回答が得られた。
  • 探索的多変量解析の実施と分析結果に対するスコアリングによる検討
    財津 亘, 金 明哲
    計量国語学
    2018年 31 巻 6 号 417-425
    発行日: 2018/09/20
    公開日: 2019/09/20
    ジャーナル オープンアクセス
    100名のブログを対象に,句点前の語(文末語)の使用率に基づく,ブログ筆者の識別を試みた.1名の疑問テキスト(筆者不明を想定),1名の対照テキスト(筆者が既知を想定),全く別人の4名の無関係テキスト内の文末語の使用率に着目して,①主成分分析,②多次元尺度法,③対応分析,④階層的クラスター分析を実施し,それらの分析結果に対して得点を付与し,得点を合算することで分析結果を統合した.実験条件として,疑問・対照テキストの筆者が同一人である筆者組合せ条件「同一人」と両テキストの筆者が異なる筆者組合せ条件「別人」を設定し,上記同様の分析を両条件(各100名)で行い,その200名の得点分布を条件間で比較検討した.その結果によると,文末語の使用率のみで,筆者を識別することが可能な上に,非自立語の使用率や品詞のbigramに次いで,筆者の識別力を有していることが示唆された.
  • *長谷川 真吾, 藤村 考
    日本社会情報学会全国大会研究発表論文集
    2007年 22 巻
    発行日: 2007年
    公開日: 2010/01/22
    会議録・要旨集 フリー
    ブログ空間での言及数は、現実世界における人間の活動を反映するものであり、分野によってはマーケットシェアを推定する有益な指標となるものと考えられる。本稿では、テレビ視聴率や商品の売り上げデータなどの既存の統計指標とブログから抽出される言及数との相関・回帰分析を行うことにより、ブログを活用したマーケットシェア推定がどのような分野で有効かを調査した。
  • 奥村 学
    人工知能
    2006年 21 巻 4 号 424-429
    発行日: 2006/07/01
    公開日: 2020/09/29
    解説誌・一般情報誌 フリー
feedback
Top