こんにちは。今日もPerlを使った横浜市の人口データを収集を進めます♪

 

前回の記事「Perlで横浜市統計webから人口データを入手する」で、個別のHTMLソースファイルから目的の人口データを入手するスクリプトを作成しました。今回はこのスクリプトを拡張して、区別データを自動入手、ファイル書き出しまで行います。

 

横浜市の区別年齢別人口データを入手する

横浜市の区別年齢別の人口データは、下記のサイトに掲載されています。

http://www.city.yokohama.lg.jp/ex/stat/jinko/age/new/age-j.html

 

区名タブを押すと、区別の人口データが出て来ますよね。これらを手でコピペするのも大変なので、Perlで自動収集して、最後にJSONファイルで書き出すスクリプトを作成しました。

 

read_yokohama_stat.pl

 

L40〜のget_content_by_urlで、WebサイトにアクセスしてHTMLソースを入手するsubルーチンが定義されています。

L54〜のget_stat_from_htmlは、前回記事で作成したスクリプトをほぼ流用しています。↑のHTMLソースコードから、0−5歳各年齢別人口と総計値を入手してhashテーブルにまとめるsubルーチンです。

 

L16〜のforeachループで、上の2つのsubルーチンを呼び出して、行政区毎に処理を行うようにしてあります。

 

・・・

JSONファイルが出来ました♪

 

次はこのJSONファイルを元にD3.jsを使ってグラフでも描いてみようかと思います。

それでは、よい1日をお過ごしください♪