棒グラフや円グラフなどのグラフによる視覚化はよく知られています。いずれも直感的に特性を理解するには有効な手法ですが,データの個数や調査項目が多い場合でも,似ているもの同士をグルーピングしたものをグラフで視覚化することによりデータの特徴を知ることができます。
データの分類には,クラスター分析による分類が,一般的に統計的手法としてよく使われますが,その他にチャーノフの顔グラフによる分類法があります。この分類法では,顔の部位に調査項目を割り当て,その表情の違いにより主観的にデータの分類をおこないます。右の図1は,Excel上で動作する“データマイン君”というソフトを使って描いた顔グラフです。データマイン君では,11個の顔の部位に調査項目を割り当てることができます。そこで,同じデータで顔の割り当て箇所をいろいろ変えてみて顔グラフを描いてみました。図2に,そのうちの6つの割り当てパターンの顔グラフを示しました。同じデータなのに,まったく印象が違ってくることがわかります。
(図1) データマイン君で描いた顔グラフと
顔の割当箇所
(図2) 同じデータで顔の割当箇所を変えた
顔グラフ
さて,「しおり」に示した顔グラフの解説に移りましょう。「しおり」の顔グラフは,表1にある職業の印象を尋ねた「職業印象データ」を使って職業の分類とグラフによる視覚化を行ったものです。このデータを用いて,
■ 似たようなイメージの職業はどれとどれかを見つけて,
グルーピングを行う
■ グルーピングした職業群の特徴は何かを調べる
ことが目的です。
そこで,顔の部位への割り当てを次のようにして顔グラフを作成したものが,「しおり」に載っているものです
(1)顔の幅=立派,(2)耳の位置=役立つ,(3)顔の高さ=よい,
(4)顔上半分の楕円の離心率=大きい,
(5)顔下半分の楕円の離心率=力がある,
(6)鼻の長さ=強い,(7)口の中心位置=速い,(8)口の曲率=騒がしい,
(9)眉の角度=若い,(10)口の長さ=誠実な,(11)目の高さ=かたい
ところで,データの分類には,クラスター分析がよく行われると,上で書きましたが,この「職業印象データ」に対してクラスター分析を適用して得られる樹形図を示しましょう。図3がそれです。試合の対戦を示すトーナメント表のようなものができています(これをデンドログラムとよびます)が,この図でどれとどれが近いかを見ることができます。ここでは,4つの職業グループに分類しましょう(黄色の点線のところで切れば,その下に4つのグループができますね)。すると,各グループとその特徴は次のようになります。
グループ1 =(僧侶,大学教授,作家)
・・・ 知的,創造的
グループ2=(キャビンアテンダント,俳優,漫画家,デザイナー)
・・・ かっこいい,あこがれ
グループ3=(船乗り,プロスポーツ選手,警察官,新聞記者)
・・・ 体力がある
グループ4=(銀行員,保育士,医師)
・・・ 人に奉仕的
この分類結果を基に,「しおり」の顔グラフを4つのグループに並べ替えてみましょう。図4のようになります。 グループ3は,何だか元気そうな顔に見えたりしませんか。普通は,顔グラフによる分類では,顔(の表情)を見て,直感で似ている顔をグルーピングします。したがって,データの特徴がうまく顔の表情に出るような割当てが必要になってきます。卒業研究では,調査項目の特徴を考慮した顔の部位への割当の効果を実験的に調べました。(グルーピングはさらに細かくすることも可能です。その時には,各グループの職業イメージの表現も変わってきます。どのくらい大きさでグルーピングをし,それを特徴づけるかが解析者の腕の見せ所になってきます。)
このように,データの中に隠れている情報をうまく取り出し,コンピュータを活用しながらデータを視覚化し,新しい知見を得るという統計的手法を勉強して,さまざまな問題解決に役立てています。
(図3)「職業印象データ」のデンドログラム
(図4) クラスター分析の結果を基に
並べ替えた顔グラフ
今回は,職業イメージを尋ねたアンケート結果から,各職業を分類してみましたが,同じやり方で,
■ 各社のペットボトルのお茶の印象を尋ねた
アンケートデータから,「お茶」を分類する
■ 都道府県の各種の労働人口のデータから,
「労働面」で47都道府県を分類する
■ 歴史上の人物の性格を記したデータから,
「性格面」で偉人を分類する
といったことができます(それぞれ,「経営・経済」,「法政・社会」,「歴史・文化」の分野です)。
出典:佐藤泰実「顔グラフによる変数割当の効果について (卒業研究論文)」(2007年3月) による。
データ(表1)の出典:足立浩平著(2006)「多変量データ解析法」ナカニシヤ出版,16ページ,表2.1の職業印象データ(心理学実験指導研究会,1985,p156の表III-6-1)より引用