2020 年 30 巻 1 号 p. 42-61
近年,多くの行政・団体がオープンデータの公開,活用に取り組んでいるが政府の推進する「オープンデータは,機械判読可能で人手を多くかけずにデータの2次利用が可能である」というデータ活用までには至っていない.本研究では,地方公共団体のオープンデータの可能性を探るために,開示されているCSVデータの項目名,列データをベクトル化することによりデータの連携度を測る述語ベクトル法を提案する.またその述語ベクトル法を用いて,各データ間の連携可能性について実験を行い,オープンデータ間における項目名のみの連携度と列データのみの連携度を比較した.結果として列データのみから算出した連携度が高いオープンデータは特定の列の類似度が高くなり,データ連携を取りやすいことが示された.