|
|
行6: |
行6: |
| | | |
| | | |
− | ==第12回GIS+R勉強会== | + | ==第13回GIS+R勉強会== |
| ===参加者=== | | ===参加者=== |
| *小野原(リアル) | | *小野原(リアル) |
| *清野(リアル) | | *清野(リアル) |
− | *瀬戸(リアル) | + | *安藤(リアル) |
| *東郷(リアル) | | *東郷(リアル) |
| | | |
| ===報告=== | | ===報告=== |
| + | |
| ====小野原==== | | ====小野原==== |
− | =====異なるクラスタリング方法を用いた結果の差異についての分析=====
| |
− | 岐阜県の方言分布についてNCDによるPAMの分類結果とJaccard距離によるDPClusの分類結果が似ているか似ていないか,すなわち両者の類似度をRのcluster.stats関数を用いて統計的に評価する.
| |
| | | |
− | 地形勾配が方言の分布,すなわち文化の伝達に及ぼす影響を明らかにすることを目的とする.
| |
− | =====使用データ=====
| |
− | *方言データ125地点(『岐阜県方言の研究』(奥村, 1976)より)
| |
− | *方言データのクラスタリングには「NCD・PAM」と「DPClus」の2種類を用いた
| |
− | *NCD (Normalised Compression Distance 正規化圧縮距離)
| |
− | *データをクラスタリングしてまとまりの悪かったものを外れ値に設定
| |
− | *分析結果のヴィジュアライズにはmaptoolsパッケージを使用
| |
− | =====分析方法=====
| |
− | *2種類のクラスタリング結果を比較するRのcluster.stats関数を使用
| |
− | *各々のクラスタ属性をたがいに異なる2変数x,yとし,x-y平面上に分布するクラスタ間のユークリッド距離(デフォルト)を求める.距離が小さいほどクラスタの属性が似ていると判断される
| |
| ===議論=== | | ===議論=== |
− | *クラスタリング単位を構成しているshapefileの領域境界の引き方 → 250mメッシュDEMデータを使用して作成(少し粗い? cf. [http://www.gsi.go.jp/kiban/ 基盤地図情報サイト]).概念は水系分析と同じ(スロープとアスペクトを計算)
| |
− | ** 現在、基盤地図情報では全国の10mメッシュDEMと地域によっては5mメッシュDEMが公開されている。また、ASTER GDEMを用いれば全世界の約30mメッシュDEMが手に入る。 [[利用者:Say-no|Say-no]] 2011年4月6日 (水) 11:22 (UTC)
| |
− | ** クラスタリング単位領域の生成がArcGISを用いて行われたらしいが、どのようなアルゴリズムで算出されたかわからなくなってしまったため、再生成できなくなっている。GRASS-GISやQGISで再現できないか? [[利用者:Say-no|Say-no]] 2011年4月6日 (水) 11:22 (UTC)
| |
− | *クラスタリング方法を複数用いる必要性の有無
| |
− | ** ここもう少し詳しく。 [[利用者:Say-no|Say-no]] 2011年4月6日 (水) 11:22 (UTC)
| |
− | *調査地点125カ所を点データ(調査地域の代表点)とするとき,各点を中心に発生させた円内のDEMデータから作成したヒストグラムを調査地点の「地形属性」とするのは妥当か?
| |
− | ** 自治体の範囲で調査が行われたのなら、その自治体の形状のポリゴンで地形属性を設定したり、もしくは調査地点が分かっているならそれらを全て包含するポリゴンを生成したり、それが不明なら例えば家住地域で生成したポリゴンを用いて分析を行うのが良いのではないか? [[利用者:Say-no|Say-no]] 2011年4月6日 (水) 11:22 (UTC)
| |
− | *方言分布と地形の関係性だけでなく,他の要因(例えば住民の人口構成,職業構成などの社会的属性や河川の影響など)も考慮に入れる必要がある cf. [http://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do センサスなどの統計資料] [http://nlftp.mlit.go.jp/ksj/ 国土数値情報]
| |
− | ** 方言という人文社会的属性分析なのだから、ことさら自然環境属性(地形・水文環境など)との関連性ではなく、人文社会的属性と紐付けて分析したほうが良い分析になるのではないか?(瀬戸) [[利用者:Say-no|Say-no]] 2011年4月6日 (水) 11:22 (UTC)
| |
− | *統計データとして扱うための元データの圧縮(例えばNANBANとNANBAを同じ分類とみなす)に関するジレンマ
| |
− | *その他のクラスタリング手法 cf. [http://en.wikipedia.org/wiki/Geodemography Geodemography] など
| |
| | | |
| ===参考文献=== | | ===参考文献=== |
− | cluster.statsについて
| |
− | * http://www.statmethods.net/advstats/cluster.html
| |
| | | |
| ===今後の方針=== | | ===今後の方針=== |