# 2-2. 図書館のデータを分析してみよう
# 呉市の図書館について
呉市立図書館は、呉市が運営している図書館サービスです。
呉市内には図書館が7館あります。
- 呉市中央図書館 (opens new window)
- 呉市広図書館 (opens new window)
- 呉市昭和図書館 (opens new window)
- 呉市川尻図書館 (opens new window)
- 呉市音戸図書館 (opens new window)
- 呉市倉橋図書館 (opens new window)
- 呉市安浦図書館 (opens new window)
この7館の他に、自動車図書館を運営しています。これは、蒲刈地区や豊地区などの図書館が近くにない島しょ部の地域でも本が借りられるようにしているサービスです。2週間に1度、保育所や小中学校、公共施設に設定されている各サービスステーションを巡回し、 本の貸し出しを行っている移動型図書館です。
運行日程やコースは、呉市立図書館「自動車図書館運行表」 (opens new window)のページを参照してください。
# 図書館のサービス
呉市の図書館のサービスの一部を紹介します。
- 館内サービス
- 館内の資料を閲覧することができます
- 利用登録をすることで、資料を借りることができます
- レファレンス・サービス
- 資料が見つからないときや調べ方がわからないときには、図書館職員に相談することができます
- 口頭・電話・文書による問い合わせに対して、回答をもらうことができます
- ホームページ
- 蔵書検索や貸出予約をすることができます
- イベントの情報を知ることができます
- 電子図書館サービス
- パソコンなどを使って電子書籍を借りて読むことができます
この他にも朗読研究や古文書研究など、様々なサービスを行なっています。
詳しくは、呉市立図書館「利用のお知らせ」 (opens new window)を参照してください。
# 図書館のデータって?
呉市立図書館でこれまで貸し出された図書等の記録は、データとして保存されています。
今回はその図書貸出データを使用して、実際に可視化してみましょう。
1回の貸出の手続きで1つのデータが作成されます。
作成されるデータには、以下のものが含まれています。
| データ名称 | 説明 |
|---|---|
| 貸出館 | 貸出手続きをした場所が分かります。 |
| 貸出SP | 貸出館より細分化されたデータで、自動車館の部分が移動先に変わっています。 |
| 資料種別 | 図書、雑誌、電子図書、AV(オーディオ・ヴィジュアル)、電子AVの種類が分かります。 |
| 資料区分 | 資料区分より細分化されたデータで、図書は一般書や絵本、洋書などに分けられます。 |
| 年齢 | 貸出手続きをした方の年齢が分かります。 |
| 性別 | 貸出手続きをした方の性別が分かります。 |
| 貸出処理年 | 貸出手続きをした日時から、年が分かります。 |
| 貸出処理月 | 貸出手続きをした日時から、月が分かります。 |
| 貸出処理日 | 貸出手続きをした日時から、日が分かります。 |
| 貸出処理時 | 貸出手続きをした日時から、時間が1時間単位で分かります。 |
| 貸出処理曜日 | 貸出手続きをした日時から、曜日が分かります。 |
| 貸出冊数 | 貸出手続きをした冊数が分かります。 |
💡これらのデータを可視化すると、何が分かるでしょう?
# 可視化するためのツールの紹介
図書貸出データを簡単に可視化するために、プログラミング環境を用意しました。
こちらから (opens new window)使用することができます。
ここでは、データを可視化するために簡単なプログラミングを行います。
使用するプログラミング言語は「Python」、そのプログラムを実行する環境としてGoogle Colaboratoryを使用しています。
Google Colaboratoryは、お使いのPC、タブレット関わらず、アプリケーションのインストール不要でWeb上でプログラムを実行できるサービスです。
本ページを使って自分で分析を行う時には、Googleのアカウントを作成する必要があります。
日本におけるGoogleのアカウントの年齢制限は13歳ですので、13歳以下の方は親御さんがお持ちのアカウントを用いて、一緒にこのアプリケーションを使ってみましょう!!
参考:Googleアカウントの年齢制限 (opens new window)
# 使用する上での注意
プログラムが書いてある部分(背景の色が違う部分)をセルと言います。
iPad等のタッチパネルの機種の場合は、このセルの部分を触るとスクロールできない場合があります。
その場合は、左側などの白い背景の部分を触ってスクロールしてください。
# 使用方法
セルの左上にある実行ボタン(再生マーク)を押すとプログラムが実行されます。

画像のような実行ボタンが見当たらない場合、iPadの場合はセルの一番左端をタッチしてください。PCの場合は、セルの上にマウスポインタをかざしてください。
その他の説明は、Google Colaboratoryのページ (opens new window)のページの説明をご覧下さい。
# 実際にデータを可視化してみよう
まずは、1つのデータを可視化してみましょう。
貸出館のデータを用いて、どの図書館が一番多く貸し出されたのかを確認してみましょう。
※このプログラムでは、データを番号で選択する必要があります。詳しくはGoogle Colaboratoryのページ (opens new window)より、使用したいデータの選択の項をご覧下さい。
貸出館のデータに対応する番号は0なので、data_index = 0として実行すると、以下のようなグラフが出来上がります。

中央図書館が、一番貸し出しの手続きがされていることが分かります。
他のデータに関しても可視化してみましょう。
性別ごとのデータを用いて実行してみます。
※このプログラムでは、データを番号で選択する必要があります。詳しくはGoogle Colaboratoryのページ (opens new window)より、使用したいデータの選択の項をご覧下さい。
性別のデータに対応する番号は5なので、data_index = 5のようにプログラムを書き換えて実行すると、以下のようなグラフが出来上がります。

男性よりも女性の方に多く借りられていることが分かりますね。
他のデータについても確認してみてください!
# 2つのデータを組み合わせて可視化してみよう
次は2つのデータを組み合わせて可視化してみます。
2つのデータを組み合わせるために、新しいグラフの形式を使用します。
その名もヒートマップです。
ヒートマップは、データ数の多いところに色が付くグラフ形式です。2つのデータの関係性を確認します。
文章だけでは分かりにくいと思うので、実際に性別と年齢を組み合わせて可視化してみます。
性別のデータに対応する番号は5、年齢のデータに対応する番号は4なので、x = 5 y = 4のようにプログラムを書き換えて実行すると、以下のようなグラフが出来上がります。

データ数の多いところが青色としてヒートマップが表示されました。
このヒートマップからは、男女ともに70歳代の人に多く貸し出されていることが分かります。
また、先ほど男性よりも女性の方が多く借りられいることが分かりました。ヒートマップから女性の方が幅広い年齢層で貸し出されていることが確認できるので、これが女性の方が多く借りられている理由かもしれません。
さらに、高校生や大学生の年齢付近の方にはあまり利用されていないようです。
💡なぜ高校生や大学生にはあまり利用されていないのか考えてみましょう。また、追加でどのようなデータがあれば考えた理由が確認できるでしょうか?
他のデータの組み合わせでも実行してみてください!
もしも新たな発見をした人は、自由研究としてまとめてみてはいかがでしょうか?