アメリカの歯医者

t33032005-03-11



いや、自分のことじゃなく、聞いた話ですがw


某友人、虫歯を大量に作ってしまい、5箇所も詰め物が必要になるハメに。でもアメリカは高い。


で、彼が取った行動は「タイまで行って直す」(何


タイまでの飛行機代と向こうでの滞在費を差し引いてもまだ安いらしいです。しかも観光付き。こっちでは結構よくある手段らしいです。


ちなみに大体虫歯一本の詰め物一つに$1000くらいかかるとのこと。5本だと$5000だから、確かに飛行機代引いても安そうだw





登場頻度でクラスタリング



ふと思い立って、上のようなグループ分け図を作ってみました。(http://t3303.ifdef.jp/negima.html


小さいグループほど似た傾向を持っていて、離れるにつれ関係が薄くなっていきます。


大きく分けるとまず、(ネギ,明日菜,木乃香,刹那)の頻出組とその他の組に分かれているのがわかると思います。頻出組を細かく見ると、(ネギ,明日菜)の傾向が似ており、それに木乃香、刹那が続くというような構造になっています。


アキラの位置がちょっと微妙なのと、朝倉とあやかが同じグループなのが意外だったりしますが、結構きれいにまとまっていると思いませんか?


ところでこれ、実はプログラムで自動生成したものです。


各キャラの各話での登場回数を基に、似た傾向で登場しているキャラ同士を自動でグルーピングさせました。


こうしてみると、登場回数という簡単な情報が、ネギま!の人間関係を強く反映していることがわかると思います。


分かりやすいところではチアのグルーピングが((美砂,円)桜子)となっていますが、これは桜子が頭一つ分くらい登場回数が多いのを反映しています。


逆に((のどか,夕映)ハルカ)は登場回数が少ないハルカが外れています。


(美空,ザジ)は出てない組w


まき絵,クー)はバカレンジャーやネギの特訓などで一緒に活躍しています。それにくっつく楓はバカレン繋がりや、クーとの武道繋がりでしょうか。


(亜子,裕奈)にくっつくさよは、どうやら74話のさよの回繋がり。実際、さよと一番相関度が高いキャラは裕奈だったりします。


最後に意外と思われた(朝倉、あやか)ですが、これはよく考えると修学旅行で同じ班だったりしています。これはこの図をみていて思い出しましたw このように、ある意味知識の発見的に使えるのも便利です。


ちなみに全体を見渡すと、上から下にかけて、大体登場頻度順に並んでいるのもわかると思います。これは似ているほど近くなり、似ていないほど遠くなるので自然と頻度順に並ぶ結果になったようです。






せっかくなので、グループ分けに使った手法も簡単に解説しておきますw


まず最初に行うのは、各キャラごとに、各話の登場回数の数字を一直線に並べる作業です。今回もデータは魔法先生ネギま!研究所からお借りし、各キャラごと1〜84話までの登場回数を表にまとめました。


次のステップは、各キャラの組み合わせごとの、相関度の計算です。


今回はネギも含めて32人のキャラクターが居るため、2人組にしたときの組み合わせは496パターンあります。そこで、それぞれの組み合わせに関して、一人目のキャラをx、二人目のキャラをyとすると、例えば、(明日奈の1話での登場回数,木乃香の1話での登場回数)を(x1,y1)のように表すことができます。今回は84話分なので、組み合わせごとに84個の点がプロットされます。


次に、この各点の情報を基に、積率相関係数というものを計算します。イメージ的にはこんな感じになります。


つまり、組み合わせのキャラの登場パターンが似ていれば似ているほど、この数値が大きくなると考えてもらえばOKです。


この作業により、どのキャラとどのキャラの登場パターンが、どの程度似ているのかがわかりました。


ここまでが前半です。後半では、この情報を基にキャラクターをグルーピングしていきます。




グルーピングにはいろいろな方法があるのですが、ここでは、この場合に最も適していると考えられる階層的クラスター分析という手法を使いました。


簡単に説明すると、似たもの同士を同じグループまとめるのを基本にしつつ、順にグループに加えていったり、グループ同士を大きなグループにしたりといった作業を続けることにより、最後に一つのグループにまとめてしまうといったやり方です。


これにより、トーナメント表のようなグループ構造が実現されます。


具体的にみていきましょう。


まずプログラムは一番相関度が高い組み合わせを探します。この場合は(千鶴、夏美)でした。次にこの(千鶴、夏美)を一つの組として考えます。2人で一組なので、公平のため千鶴、夏美が持っていた値の平均をとって、それをグループの値とすることにします。これで、次からは(千鶴、夏美)を一つのものと考えることが可能になりました。


次に、同じように一番相関度が高い組み合わせを探します。今度は(美空、ザジ)だったので、上と同じ作業をします。


次に見つかったのは、(美空、ザジ)と真名の組み合わせです。(美空、ザジ)はもう既に2人で1人なので、新しい組み合わせは((美空、ザジ)真名)というようになります。


あとは、この過程をグループが一つになるまで繰り返していけば完成です。




と、このような過程を経て今回のグループ分け図が完成しました。


自分でも、たかだか登場回数の情報で、ここまで正確なキャラ相関図が描けるとは正直思っていませんでした。


しかもこの図は、クーとまき絵の意外な繋がりや、あやかと朝倉の組み合わせのように、普通に読んでいたらちょっと気付きづらいような関係も見事に現しています。


これはクラスタリングと呼ばれる人工知能の手法なのですが、ネギま!にも応用できるとは意外でした。これからも何か思いついたらいろいろ試していこうと思います。