「Gis and r 012」の版間の差分

提供: OSGeo.JP Wiki
移動: 案内検索
行10: 行10:
 
*小野原(リアル)
 
*小野原(リアル)
 
*清野(リアル)
 
*清野(リアル)
*瀬戸(遅刻)
+
*瀬戸(リアル)
 
*東郷(リアル)
 
*東郷(リアル)
  
行22: 行22:
 
*方言データ125地点(『岐阜県方言の研究』(奥村, 1976)より)
 
*方言データ125地点(『岐阜県方言の研究』(奥村, 1976)より)
 
*方言データのクラスタリングには「NCD・PAM」と「DPClus」の2種類を用いた
 
*方言データのクラスタリングには「NCD・PAM」と「DPClus」の2種類を用いた
 +
*NCD (Normalised Compression Distance 正規化圧縮距離)
 
*データをクラスタリングしてまとまりの悪かったものを外れ値に設定
 
*データをクラスタリングしてまとまりの悪かったものを外れ値に設定
 
*分析結果のヴィジュアライズにはmaptoolsパッケージを使用
 
*分析結果のヴィジュアライズにはmaptoolsパッケージを使用
行27: 行28:
 
*2種類のクラスタリング結果を比較するRのcluster.stats関数を使用
 
*2種類のクラスタリング結果を比較するRのcluster.stats関数を使用
 
*各々のクラスタ属性をたがいに異なる2変数x,yとし,x-y平面上に分布するクラスタ間のユークリッド距離(デフォルト)を求める.距離が小さいほどクラスタの属性が似ていると判断される
 
*各々のクラスタ属性をたがいに異なる2変数x,yとし,x-y平面上に分布するクラスタ間のユークリッド距離(デフォルト)を求める.距離が小さいほどクラスタの属性が似ていると判断される
 
 
 
===議論===
 
===議論===
 
*クラスタリング単位を構成しているshapefileの領域境界の引き方 → 250mメッシュDEMデータを使用して作成(少し粗い? cf. [http://www.gsi.go.jp/kiban/ 基盤地図情報サイト]).概念は水系分析と同じ(スロープとアスペクトを計算)
 
*クラスタリング単位を構成しているshapefileの領域境界の引き方 → 250mメッシュDEMデータを使用して作成(少し粗い? cf. [http://www.gsi.go.jp/kiban/ 基盤地図情報サイト]).概念は水系分析と同じ(スロープとアスペクトを計算)
行34: 行33:
 
*調査地点125カ所を点データ(調査地域の代表点)とするとき,各点を中心に発生させた円内のDEMデータから作成したヒストグラムを調査地点の「地形属性」とするのは妥当か?
 
*調査地点125カ所を点データ(調査地域の代表点)とするとき,各点を中心に発生させた円内のDEMデータから作成したヒストグラムを調査地点の「地形属性」とするのは妥当か?
 
*方言分布と地形の関係性だけでなく,他の要因(例えば住民の人口構成,職業構成などの社会的属性や河川の影響など)も考慮に入れる必要がある cf. [http://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do センサスなどの統計資料] [http://nlftp.mlit.go.jp/ksj/ 国土数値情報]
 
*方言分布と地形の関係性だけでなく,他の要因(例えば住民の人口構成,職業構成などの社会的属性や河川の影響など)も考慮に入れる必要がある cf. [http://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do センサスなどの統計資料] [http://nlftp.mlit.go.jp/ksj/ 国土数値情報]
 +
*統計データとして扱うための元データの圧縮(例えばNANBANとNANBAを同じ分類とみなす)に関するジレンマ
 +
*その他のクラスタリング手法 cf. [http://en.wikipedia.org/wiki/Geodemography Geodemography] など
 
===参考文献===
 
===参考文献===
 
cluster.statsについて
 
cluster.statsについて

2011年3月26日 (土) 00:38時点における版

表紙へ戻る

※Wiki記法の書き方については http://ja.wikipedia.org/wiki/Help:%E6%97%A9%E8%A6%8B%E8%A1%A8 を参照。


第12回GIS+R勉強会

参加者

  • 小野原(リアル)
  • 清野(リアル)
  • 瀬戸(リアル)
  • 東郷(リアル)

報告

小野原

異なるクラスタリング方法を用いた結果の差異についての分析

岐阜県の方言分布についてNCDによるPAMの分類結果とJaccard距離によるDPClusの分類結果が似ているか似ていないか,すなわち両者の類似度をRのcluster.stats関数を用いて統計的に評価する.

地形勾配が方言の分布,すなわち文化の伝達に及ぼす影響を明らかにすることを目的とする.

使用データ
  • 方言データ125地点(『岐阜県方言の研究』(奥村, 1976)より)
  • 方言データのクラスタリングには「NCD・PAM」と「DPClus」の2種類を用いた
  • NCD (Normalised Compression Distance 正規化圧縮距離)
  • データをクラスタリングしてまとまりの悪かったものを外れ値に設定
  • 分析結果のヴィジュアライズにはmaptoolsパッケージを使用
分析方法
  • 2種類のクラスタリング結果を比較するRのcluster.stats関数を使用
  • 各々のクラスタ属性をたがいに異なる2変数x,yとし,x-y平面上に分布するクラスタ間のユークリッド距離(デフォルト)を求める.距離が小さいほどクラスタの属性が似ていると判断される

議論

  • クラスタリング単位を構成しているshapefileの領域境界の引き方 → 250mメッシュDEMデータを使用して作成(少し粗い? cf. 基盤地図情報サイト).概念は水系分析と同じ(スロープとアスペクトを計算)
  • クラスタリング方法を複数用いる必要性の有無
  • 調査地点125カ所を点データ(調査地域の代表点)とするとき,各点を中心に発生させた円内のDEMデータから作成したヒストグラムを調査地点の「地形属性」とするのは妥当か?
  • 方言分布と地形の関係性だけでなく,他の要因(例えば住民の人口構成,職業構成などの社会的属性や河川の影響など)も考慮に入れる必要がある cf. センサスなどの統計資料 国土数値情報
  • 統計データとして扱うための元データの圧縮(例えばNANBANとNANBAを同じ分類とみなす)に関するジレンマ
  • その他のクラスタリング手法 cf. Geodemography など

参考文献

cluster.statsについて

今後の方針

次回の予定

日時:

場所:

内容: