詳細検索結果

Web上の
同姓同名
人物識別のための職業関連情報の抽出

*上田洋, 村上晴美, 辰巳昭治

人工知能学会全国大会論文集
2008年 JSAI08 巻 2D2-3
発行日: 2008年
公開日: 2009/07/31

DOI https://doi.org/10.11517/pjsai.JSAI08.0.174.0

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

　本研究では、Web上の
同姓同名
人物の識別を容易にすることを目的に、
同姓同名
人物毎に分けられたWebページから、各人物の職業に関する情報（職業関連情報）を抽出する手法を検討する。
抄録全体を表示

PDF形式でダウンロード (206K)
Extracting Key Phrases to Disambiguate Personal Names on the Web

*ボッレーガラダヌシカ

人工知能学会全国大会論文集
2006年 JSAI06 巻 3G1-5
発行日: 2006年
公開日: 2006/12/07

DOI https://doi.org/10.11517/pjsai.JSAI06.0.279.0

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

When you search for information regarding a particular personon the web, a search engine returns many pages. Some of these pagesmay be for people with the same name. How can we disambiguate thesedifferent people with the same name? This paper presents an unsupervisedalgorithm which produces key phrases for the different people withthe same name. These key phrases could be used to further narrow downthe search, leading to more person specific unambiguous information.The algorithm we propose does not require any biographical or social informationregarding the person. Although there are some previous workin personal name disambiguation on the web, to our knowledge, this is thefirst attempt to extract key phrases to disambiguate the different personswith the same name. To evaluate our algorithm, we collected and handlabeled a dataset of over 1000 Web pages retrieved from Google usingpersonal name queries. Our experimental results shows an improvementover the existing methods for namesake disambiguation.[日本語]検索エンジンなどで人名を検索すると情報が知りたい「本人」以外に沢山の
同姓同名
に関する検索結果が返ってくる。このような沢山の
同姓同名
の中から自分が情報知りたい人のみに関する結果を得るためにはどうすれば宜しいでしょうか。
同姓同名
の人に関する結果を少なくするためにクエリーに何らかのキーワードを加えるのは一般的なやりかたであるが、本研究はこのような「
同姓同名
な人物を見分けるために役立つ」キーワードを自動的に抽出するアルゴリズムを提案する。一方、SNS (Social Network Services)が流行しており、このような人間を対象としたネットワークをウェブから自動的に抽出するシステム（例：Polyphonet、FOF)などが提案されている。しかし、このようなシステムでは
同姓同名
による曖昧性が問題となっており、本研究が提案するキーワードを抽出アルゴリズム用いることによってこのような曖昧性も解消できる。
抄録全体を表示

PDF形式でダウンロード (210K)
Web上の
同姓同名
人物識別のための職業関連情報の抽出

上田洋, 村上晴美, 辰巳昭治

システム制御情報学会論文誌
2009年 22 巻 6 号 229-240
発行日: 2009年
公開日: 2011/04/22

DOI https://doi.org/10.5687/iscie.22.229

ジャーナルフリー

抄録を表示する抄録を非表示にする

Distinguishing different people with identical names is becoming more and more important in person searches on the Web. The aim of this research is to dispatch useful labels for identifying persons in “person clusters,” which are generated as a result of person searches on the Web. In this paper, we propose a method to label person clusters with “vocation-related information.” The vocation-related information includes broader terms that may be considered as vocations, and terms that are useful to infer vocations, not only those rigorously defined as vocations. Our method is based on (a) extracting candidates of vocation-related information by using HTML structures and simple heuristics, and (b) generating vocation-related information by using term frequencies,synonym clustering, and Web search engines. Experimental results revealed the usefulness of the proposed method.

抄録全体を表示

PDF形式でダウンロード (251K)
研究者リゾルバーαの研究者同定・分析

*蔵川圭, 武田英明, 高久雅生, 相澤彰子

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集
2009年 25 巻 2D3-02
発行日: 2009年
公開日: 2009/12/15

DOI https://doi.org/10.14864/fss.25.0.140.0

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

科学研究費補助金における研究者番号を持つ研究者を対象とし，Web上の研究者リソースをリンキングするサービスとして研究者リゾルバーαを構築して公開している．リンキングのためには，
同姓同名
や異体字などの様々な問題を克服して研究者同定をしなければならない．ここでは，科研費の研究者と代表的な34大学の研究者総覧データベースに登録された研究者の漢字氏名を対象に
同姓同名
分析を行った．その上でシステム内部の同定手法を定め実装し，同定精度をサンプル調査した．本報告では，これらの結果について示す．
抄録全体を表示

PDF形式でダウンロード (252K)
Web上の人物への図書館の分類記号の付与と人物ディレクトリの開発

村上晴美, 浦芳伸, 片岡祐輔

システム制御情報学会論文誌
2016年 29 巻 2 号 51-64
発行日: 2016/02/15
公開日: 2016/05/15

DOI https://doi.org/10.5687/iscie.29.51

ジャーナルフリー

抄録を表示する抄録を非表示にする

To help users select and understand people while searching for them, we present a method of assigning Nippon Decimal Classification (NDC), which is a system of library classification numbers, to people on the web. By assigning NDC numbers to people, we can assign not only labels to people but also build a NDC-based people-search directory. We use a relative index in NDC, which lists the related index terms attached to NDC. We count the number of relative index terms contained in the titles of web pages (HTML files) and assign the top five NDC9 numbers to people. We developed a prototype of a people-search directory by assigning NDC9 numbers to HTML files that were manually classified from web people-search results. We evaluated the usefulness of our approach by comparing four methods and six documents and found that our method (extracting relative index terms) from the titles of web pages outperformed other methods and documents.
抄録全体を表示

PDF形式でダウンロード (4124K)
大規模災害の被災者の居住地転居の現状とデータベース作成 ―東日本大震災後の岩手県・宮城県―

稲村肇

土木学会論文集
2023年 79 巻 1 号論文ID: 22-00028
発行日: 2023年
公開日: 2023/01/23

DOI https://doi.org/10.2208/jscejj.22-00028

ジャーナルフリー

抄録を表示する抄録を非表示にする

　本研究は東日本大震災による津波被災世帯の居住地移動（2007年－2020年）を電話帳に基づく追跡で明らかにした．主たる結論は以下の通り．1）対象とした岩手県・宮城県の被災10市町から両県の主要9都市への転出人口シェアは57%を超えている．2）分析対象はNTT電話帳登録者，被災10都市98,991世帯及び主要都市320,678世帯である．電話登録率は2012年で世帯数比61.5%，2019年は46.9%である．現住所が判明したのは74.7%，74,000世帯，うち転居者は39.2%，38,800世帯であった．転居者の35.7%，13,986世帯の住所が明らかとなった．これの旧居住者に対する比率は14.0%である．3）
同姓同名
による複数マッチングは3,800世帯の約半分1,831世帯となっている．本研究で対象とした登録者と新旧居住地の住所はデータベースとして保管されている．

抄録全体を表示

PDF形式でダウンロード (840K)
Web上の人物理解のための履歴書作成

上田洋, 村上晴美, 辰巳昭治

人工知能学会論文誌
2010年 25 巻 1 号 144-156
発行日: 2010年
公開日: 2010/01/06

DOI https://doi.org/10.1527/tjsai.25.144

ジャーナルフリー

抄録を表示する抄録を非表示にする

When users find information about people from the results of Web people searches, they often need to browse many obtained Web pages and check much unnecessary information. This task is time-consuming and complicates the understanding of the designated people. We investigate a method that integrates the useful information obtained from Web pages and displays them to understand people. We focus on curriculum vitae, which are widely used for understanding people. We propose a method that extracts event sentences from Web pages and displays them like a curriculum vita. The event sentence includes both time and events related to a person. Our method is based on the following: (1) extracting event sentences using heuristics and filtering them, (2) judging whether event sentences are related to a designated person by mainly using the patterns of HTML tags, (3) classifying these sentences to categories by SVM, and (4) clustering event sentences including both identical times and events. Experimental results revealed the usefulness of our proposed method.
抄録全体を表示

PDF形式でダウンロード (890K)
アイデンティティを推定する(<特集>WebアイデンティティとAI)

小山聡

人工知能
2009年 24 巻 4 号 544-551
発行日: 2009/07/01
公開日: 2020/09/29

DOI https://doi.org/10.11517/jjsai.24.4_544

解説誌・一般情報誌フリー

PDF形式でダウンロード (870K)
人物名に着目した二段階クラスタリングによるWeb上の
同姓同名
人物の分離

*片岡真一, 上田洋, 村上晴美, 辰巳昭治

人工知能学会全国大会論文集
2008年 JSAI08 巻 1E1-4
発行日: 2008年
公開日: 2009/07/31

DOI https://doi.org/10.11517/pjsai.JSAI08.0.20.0

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

本研究では, 人物名に着目してクラスタリングを二段階で行うことによりWeb上の
同姓同名
人物を分離する手法を提案する。一度目のクラスタリングでは, 同じ人物名をページ内に含む初期クラスタを作成する. 二度目のクラスタリングでは, 初期クラスタに対して階層型クラスタリングの手法である群平均法を適用する.
抄録全体を表示

PDF形式でダウンロード (179K)
研究者同定とその応用 -- 統計分野と材料科学分野を例として --

*高久雅生, 相澤彰子, 馬場康維, 蔵川圭, 谷藤幹子

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集
2009年 25 巻 2D3-03
発行日: 2009年
公開日: 2009/12/15

DOI https://doi.org/10.14864/fss.25.0.141.0

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

書誌データベースをはじめとする人手により整備された情報からのデータマイニングの一事例として、科研費データベースを対象とした研究者コミュニティの分析を行った。統計関連分野の研究者、物質・材料研究機構所属者の2つのデータセットを手掛かりとして研究者の同定を行い、各研究分野における研究者コミュニティそれぞれの特徴抽出と比較を試みる。
抄録全体を表示

PDF形式でダウンロード (1706K)
Web人名検索結果の要約と可視化を目指して―2010年代の進捗―

村上晴美

Webインテリジェンスとインタラクション研究会予稿集
2020年 16 巻
発行日: 2020年
公開日: 2022/11/07

DOI https://doi.org/10.57413/wii.16.0_116

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

著者の研究室では，テキストやデータからの人物の理解に関する研究を行っている．その中で，Web上の人物の理解のために，Web人物検索における要約と可視化の研究を行っている．研究の目的は，Web上の人名検索においてユーザによる人物の選択と理解を支援するインタフェースの開発である．先行研究において2000年代の研究の進捗報告を行った．本稿では，2010年代の研究の進捗の概要をまとめる．内容は，NDC人物ディレクトリ，人間による
同姓同名
人物の分離，履歴書と地図の表示，Wikipedia風概要文の作成，件名の付与である．

抄録全体を表示

PDF形式でダウンロード (288K)
デジタルネットワークにおける歴史的人名・組織情報の現状とその利活用モデル

研谷紀夫

情報知識学会誌
2008年 18 巻 2 号 93-98
発行日: 2008/05/23
公開日: 2008/09/08

DOI https://doi.org/10.2964/jsik.18-93

ジャーナルフリー

抄録を表示する抄録を非表示にする

インターネットを中心とするデジタルネットワーク空間においては、電子化された歴史資料など多様な文化資源情報が格納されている。これらの情報内には様々な歴史的人名・組織情報が含まれているが、各人物に関する参照情報を提供することによって資料情報のより深い理解を促進させることが可能となる。本研究では、現在のインターネット上の人名・組織情報の現状を調査した上で、デジタルネットワーク上で共用可能な主に明治以降の近代期を対象とした歴史的人名・組織典拠情報の可能性について検討する。
抄録全体を表示

PDF形式でダウンロード (415K)
[B43] 『人事興信録』データからの親族ネットワークの可視化

佐野智也, 増田知子

デジタルアーカイブ学会誌
2020年 4 巻 2 号 195-198
発行日: 2020年
公開日: 2020/04/25

DOI https://doi.org/10.24506/jsda.4.2_195

ジャーナルオープンアクセス

抄録を表示する抄録を非表示にする

「日本研究のための歴史情報」プロジェクトでは、様々な資料のテキストデータ化に取り組み、研究に利用している。本報告では、テキスト処理とその結果の活用事例の一つとして、『人事興信録』の人的ネットワークの可視化について報告する。『人事興信録』は、家族・親戚情報が詳細に記載されている点に大きな特徴があり、これを利用することで、実親子関係やより広い姻戚関係の情報を得ることができる。可視化のための前提作業として、テキストデータからの親の氏名の抽出処理や、採録者との同定処理について紹介する。特に、採録者の同定処理は、他の人事情報資料を扱う際の参考になるものと考えられる。このようなテキスト処理を経て描かれたネットワーク図は、『人事興信録』原典だけでは容易にわからない人的関係性を可視化しており、実際の事例を用いてその有効性を示す。

抄録全体を表示

PDF形式でダウンロード (842K)
中国出願の中国語発明者名を用いた発明者分析

— 同姓同名や上位者連名等の影響 —

*山村健一, 桐山勉

情報プロフェッショナルシンポジウム予稿集
2013年 2013 巻
発行日: 2013年
公開日: 2013/09/24

DOI https://doi.org/10.11514/infopro.2013.0.71.0

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

各社の研究開発の人員規模やキーマンの把握手段として発明者分析が行われている。近年の中国出願件数の著しい伸びから、中国出願でも中国語発明者名分析を行うことが求められているが、
同姓同名
や組織の上位者の連名等の影響を受けて中国出願データから得られる上位発明者データと実際のキーマンとの間に差異が生じる懸念がある。本稿では中国内の出願件数上位の企業及び大学について、それぞれ中国語発明者名を含むデータを取得して、各企業・大学の上位発明者ランキング、上位発明者出願件数分布グラフ及びネットワーク分析ツール Cytoscape を用いて作成した共同発明ネットワーク図を作成し、これに基づいて、上位企業及び大学の
同姓同名
や組織の上位者の連名の影響を調査した。その結果に基づき中国出願に対する発明者分析の活用上の課題を明らかにする。本研究は、2013 年度アジア特許情報研究会のワーキング活動結果として発表する。
抄録全体を表示

PDF形式でダウンロード (417K)
Web上の
同姓同名
人物を分離して人物属性情報を表示するシステム

*上田洋, 村上晴美

人工知能学会全国大会論文集
2007年 JSAI07 巻 3G8-1
発行日: 2007年
公開日: 2018/07/29

DOI https://doi.org/10.11517/pjsai.JSAI07.0_3G81

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

氏名でWeb検索を行った結果を
同姓同名
人物毎に分離し、人物属性情報（地名・職業・キーワード)を表示するシステムを試作した。本システムは、氏名による検索結果の分類インタフェースとして、また、該当人物の特徴の理解に役立つと考える。

抄録全体を表示

PDF形式でダウンロード (275K)
Social Network Miningと人工知能

*松尾豊, 濱崎雅弘

人工知能学会全国大会論文集
2006年 JSAI06 巻 1F2-2
発行日: 2006年
公開日: 2006/12/07

DOI https://doi.org/10.11517/pjsai.JSAI06.0.70.0

会議録・要旨集フリー

抄録を表示する抄録を非表示にする

本発表では、Webからの社会ネットワーク抽出の技術や関連動向について述べるとともに、新しいフレームワークであるSuper social network miningを提案する。また、ＡＩにとってどのような貢献をするかについて議論を行う。
抄録全体を表示

PDF形式でダウンロード (297K)
人名の言語的特徴の分析に基づくキラキラネーム判定

山西良典, 大泉順平, 西原陽子, 福本淳一

日本感性工学会論文誌
2016年 15 巻 1 号 31-37
発行日: 2016年
公開日: 2016/02/26
[早期公開] 公開日: 2015/10/09

DOI https://doi.org/10.5057/jjske.TJSKE-D-15-00030

ジャーナルフリー

抄録を表示する抄録を非表示にする

This paper describes linguistic features of generally unreadable person names, which are defined as “KIRAKIRA names,” and proposes a method to detect KIRAKIRA names based on the features. Through the discussions, the following eight features are founded as the linguistic features of KIRAKIRA names: 1) Too many Kanji characters, 2) Too many syllables, 3) Multiple usage of a common Kanji character, 4) Kanji variants are used, 5) The pronunciation of Kanji is generally unknown, 6) Too many stroke count for Kanji, 7) Mismatching of gender between a person and the name, and 8) The pronunciation of name equals an imported word. Based on the features, KIRAKIRA names are automatically detected by using Support Vector Machine. The experiments to detect KIRAKIRA names were conducted for 10,000 names. The results of the experiments showed 81.79% accuracy, 76.89% precision, and 91.84% recall.
抄録全体を表示

PDF形式でダウンロード (710K)
A33 中国語キーワードによる中国特許情報解析 : 調査精度向上への応用(セッションA3特許3,一般発表概要,<特集>第10回情報プロフェッショナルシンポジウム)

安藤俊幸, 金澤祐孝, 小山裕史, 沖祥嘉

情報の科学と技術
2014年 64 巻 3 号 85-
発行日: 2014/03/01
公開日: 2017/04/13

DOI https://doi.org/10.18919/jkg.64.3_85_4

ジャーナルフリー

PDF形式でダウンロード (204K)
A32 中国特許の中国語キーワード検索検証 : 中国語を用いた特許調査の網羅性向上(セッションA3特許3,一般発表概要,<特集>第10回情報プロフェッショナルシンポジウム)

石田政司, 山本光三, 田畑文也

情報の科学と技術
2014年 64 巻 3 号 85-
発行日: 2014/03/01
公開日: 2017/04/13

DOI https://doi.org/10.18919/jkg.64.3_85_3

ジャーナルフリー

PDF形式でダウンロード (204K)
A31 中国出願の中国語発明者名を用いた発明者分析 :
同姓同名
や上位者連名等の影響(セッションA3特許3,一般発表概要,<特集>第10回情報プロフェッショナルシンポジウム)

山村健一, 桐山勉

情報の科学と技術
2014年 64 巻 3 号 85-
発行日: 2014/03/01
公開日: 2017/04/13

DOI https://doi.org/10.18919/jkg.64.3_85_2

ジャーナルフリー

PDF形式でダウンロード (204K)

J-STAGEへの登録はこちら（無料）