こんにちは。今日もPerlを使った横浜市の人口データを収集を進めます♪
前回の記事「Perlで横浜市統計webから人口データを入手する」で、個別のHTMLソースファイルから目的の人口データを入手するスクリプトを作成しました。今回はこのスクリプトを拡張して、区別データを自動入手、ファイル書き出しまで行います。
横浜市の区別年齢別人口データを入手する
横浜市の区別年齢別の人口データは、下記のサイトに掲載されています。
http://www.city.yokohama.lg.jp/ex/stat/jinko/age/new/age-j.html
区名タブを押すと、区別の人口データが出て来ますよね。これらを手でコピペするのも大変なので、Perlで自動収集して、最後にJSONファイルで書き出すスクリプトを作成しました。
read_yokohama_stat.pl
L40〜のget_content_by_urlで、WebサイトにアクセスしてHTMLソースを入手するsubルーチンが定義されています。
L54〜のget_stat_from_htmlは、前回記事で作成したスクリプトをほぼ流用しています。↑のHTMLソースコードから、0−5歳各年齢別人口と総計値を入手してhashテーブルにまとめるsubルーチンです。
L16〜のforeachループで、上の2つのsubルーチンを呼び出して、行政区毎に処理を行うようにしてあります。
・・・
JSONファイルが出来ました♪
次はこのJSONファイルを元にD3.jsを使ってグラフでも描いてみようかと思います。
それでは、よい1日をお過ごしください♪