階層クラスター分析は非常に簡単です。
クロス集計表をクラスター分析にかけると、デンドログラム(樹形図)とよばれるトーナメント表のような図が出力されます。

アプリでは最大距離の70%のところに赤い線が引いてありますが、あくまで目安であって、自分が適切と思う位置で線をひき、
その線とデンドログラムの交点にぶら下がっているものが同じグループ(クラスター)となります。
デンドログラムをわかりやすいように回転して見てみましょう。
下記のデンドログラムは、過去に学生がインスタ映えする食べ物写真を分類した際のものです
赤い線で区切るとすると、4つのクラスターに分けることができます。

これだと、少し大雑把だなと感じたら、もう少し閾値を下げて青い線のところで線をひきます。
そうすると、8つのクラスターに分類することができました。
青い線で区切ったクラスターで写真を分類してみると次のようになります。
大体適切に分類されていますね。