[PR] 留学 MAP & Urban Legend
MAP & Urban Legend


都市伝説はどこから始まる?
口裂け女は……
データ収集
マッピング


都市伝説はどこから始まる?

都市伝説の特徴として、その伝播性があります。
ただし、伝わるには伝わるのですが、その出所ははっきりとしていません。
「友だちの友だちから聞いたんだけど……」という表現があるように、話の出所を辿っていったのにいつのまにか同じ人の所に戻ってきていたり、どうにもやっかいです。

でも、本当に発生源を知ることは無理なのでしょうか?
ここでは、発生源を知る1つの手段として、地図 というものの可能性について考えたいと思います。

例えば、その都市伝説について話している人が多い地域は、それだけ発生源に近いことが考えられます。
ということは、それをどんどんマッピングしていけば、中心には発生源が……?

まぁ、そんなに上手くはいかないかもしれませんが、何事もまずは挑戦です^^

口裂け女は……

地図上へのマーキングを行う前に、有名な都市伝説とその発生源(と言われている場所)を調べてみました。
これらの場所と、実際解析した場所の集中点が一致すれば、解析は成功と言えるはず!

口裂け女 岐阜県美濃加茂市
人面犬 特定の場所なし?(メディアから)
首なしライダー 秋田県秋田市?
赤マント 東京谷中
テケテケ 北海道

私の住んでいる北海道が発生源となっているテケテケ。
中学校の時、先生が話してくれたのを未だに覚えていますし、それからも何度か耳にしています。
やはり、発生源とされている地域には、その土地の都市伝説を話す人が多いようです。

データ収集

さて、いよいよ解析を始めます。
最初はマッピングするためのデータ収集です。
データ源はWEBを用います。
本当は人手で全てやれば精度の高いデータが得られるのですが、yahooでの都市伝説のHit数は……
235万件!!
一生かかっても解析が終わりそうにありません。
それに日々更新されていくWEBでは、新しいデータが次々と登場してきます。

とりあえずの手段として、今回はプログラムに頼ることにしました。
いずれは、投稿形式で自由にマーカーをつけられるようにできれば、面白いかもしれません。

プログラムの動作は
  • キーワードを入力
  • キーワードでWEBを検索
  • 要約文を持ってくる
  • 要約文に対して形態素解析(名詞や動詞。単語の属性の判定を行っています)
  • 地域に分類される単語を収集
  • 単語の出現頻度で並び替え
  • 出現頻度の高い単語から取得

  • といった流れです。
    もっと複雑なことをするには、TF-IDFと呼ばれる手法を使うそうです。
    例えば「ポマードという単語は口裂け女とは一緒に出てくるけれど、 他ではあまり見かけない……」
    といったようなユニーク度を分析をします。
    今回は……難しいのでパスです……。

    YAHOOの検索APIでは、一度に50件の要約文が得られます。
    それを20回繰り返して1000ページの要約文を手に入れました。

    本当は2000回やってたんですが、yahooAPIの制限に引っかかったみたいです。
    もっと検索ワード絞らなきゃいけないようです。

    さて、気を取り直して解析をしてみた結果は……

    「口裂け女」と地域の関係
    1位 東京 40point
    2位 渋谷 29point
    3位 岐阜 26point
    4位 カシマ 15point
    5位 大阪 15point
    6位 吉祥寺 8point
    7位 京都 7point
    8位 福岡 5point
    9位 6point
    10位 板橋 5point

    うーん、やはりデータ数が少ないなぁ。
    できれば、10000件は欲しかったです。
    ただ、岐阜も3位に入っているし、傾向としては悪くないと思います。
    東京、渋谷が1位なのは単に人口が多いからとして、4位のカシマはカシマレイコという別の都市伝説が地名に分類されてしまったようですが……。
    修正したいけど……ここは、せっかくなので全て機械任せの結果を載せることにします。
    このぐらいならいいけど、将来的にもっと多くのデータを扱うときがきたら、人手で評価するのは難しいので。

    それでは、次はいよいよマッピングです!

    マッピング

    GoogleMapは重いので、別Windowを開くことにしています。

    ごちゃごちゃして、少しわかりにくいかもしれませんが
  • 東京
  • 岐阜
  • 大阪
  • 福岡
  • のあたりに、スコアの高い赤マークがあり、まわりを他の色のマークが取り囲んでいます。

    東京、大阪あたりは人口的に見ても、どんな場合でもマークが集中している可能性があるのですが、
    岐阜、福岡は何か特別な(「口裂け女」の発祥地である)ことを匂わせます。

    特に岐阜は前述の情報でも発祥地とされているので、この方法にある程度の信頼性があることを証明できたことにな ります。

    せっかくなので、あと2つほど解析してみます。

    テケテケはまさに北海道の都市伝説でした!
    ということは、出所がわかっていない人面犬も、何か手がかりが見つかるかもしれません。
    地図を見た限りでは東北地方に多いのが気になりますが、はたして……?



    さてさて、今回の実験はこれにて終了です。
    こんど時間が出来たら、さらに突っ込んだ検証をしてみようと思います。
    また、現在のプログラムを使ったマッピングはキーワード変更で対応できるので、徐々に増えていくかもしれません。

    最後までおつきあいいただき、ありがとうございましたm(__)m

    また、GoogleMapのプログラムにつきましては、「月と六ペソ」様(http://japonyol.net/editor/)のサンプルを参考にさせていただきました。
    トップへ戻る