【エンビジ!】 伝わるデータ・ビジュアル術

※この「エンビジ!」では、エンジニアに役立つであろうビジネス書をご紹介しつつ、著者の方にもお話を聞いていきます。



皆さんは仕事でデータを扱っていますか? そのデータ、数字の羅列ではなく、分かりやすく見せることができていますでしょうか。今回は、データをいかに可視化できるのかという話を聞いていきたいと思います。お話を聞くのは書籍『伝わるデータ・ビジュアル術』の監修者である五十嵐康伸さんです。

――五十嵐さん、よろしくお願いします。

はい、よろしくお願いします。


――五十嵐さんはその『伝わるデータ・ビジュアル術』の監修をされていらっしゃいますが、そもそもデータの可視化というものをどう考えていらっしゃいますか?


データ可視化が必要な人は増えてきている

データを可視化する仕事がすごく増えてきたな、と思います。データ活用が重要視されはじめた数年前にはデータサイエンスに特化した部署が多くの会社で新設され、その中にビジネス、アナリティクス、エンジニアリングの専門家が配属されました。けれど今は、どこの部署でも日常的にデータを使うようになりましたよね。

――確かにデータを使っている人は増えたように思います。

マーケティングの人はユーザーがサービスをより楽しく使えるためにデータを使っていますし、人事の人は従業員がより楽しく仕事に取り組めるようにするためにデータを使っています。ただ、データを扱う人は増えたのですが、そういった人に対する“データ可視化教育”の良い教科書が存在しないな、とずっと思っていました。

――ああ、社内教育で「データ可視化」とか、あまり聞かないですね。データの活用は叫ばれていますけども。

データの活用の仕事は、ざっと挙げてみると次のような仕事があるかと思います。

▼社外向けの場合

・マッチングやリコメンドのエンジンを作る

▼社内向けの場合

・データベースを作る
・分析環境を作る

▼経営企画や営業企画などの場合

・時事刻々と変わるサービスの状況を把握するためにデータ分析する(PythonやR)
・一定期間のサービスの状況をまとめて振り返るためにデータ分析する(BIツール)




――こう見ると、エンジニアもデータを扱う仕事が増えましたよね。

ただ、エンジニアとしては単にデータを扱えるだけじゃダメですよね。

――といいますと。

世の中にPythonや機械学習の本はたくさんありますが、ただ「プログラミングができる、ライブラリーを動かせる」というだけでバリューを発揮できる時代ではなくなってきています。今は自分自身が会社の中でどういった役割を持っていて、どういったアウトプットが期待されているのかを理解しないと、成果にうまく結びつけられません。

――エンジニアに求められるものも複雑化しているわけですね。

そういう私自身もエンジニアです。奈良先端科学技術大学院大学の情報科学研究科で博士号を取得後、東北大学にて研究員、助手として画像認識の研究をしていました。その後は奈良先端科学技術大学院大学の特任助教や、オリンパスソフトウェアテクノロジー株式会社(現オリンパス株式会社)のエンジニアなどを経て、2016年に株式会社インテリジェンス(現パーソルキャリア株式会社)に入りました。


――今は何をされているんでしょうか?

現在はデータを使った新規事業開発に携わっています。並行して、データ可視化を研究する団体「E2D3.org」を立ち上げ、総務大臣賞や日本統計学会 統計教育賞なども受賞しました。

――すごいですね。今回の本はその「E2D3.org」の有志で書かれていて、五十嵐さんは監修を担当されたということですよね。なぜこの本を企画されたのでしょう?

大きな会社だとデータ分析に携わるエンジニアが多くいて、社内でもデータの活用の事例共有会があります。でも、世の中に多くある小さい会社ですと、データ分析に携わるエンジニアが少なく、社内で事例共有される機会も少ないので、外に情報を取りに行かないといけません。勉強会とかカンファレンスとか。

――データ分析の勉強会などに情報を取りに行く、と。

ただ、「データ可視化」に関しては、データ可視化ツールの会社が主催する勉強会は個別にたくさんあるけれど、複数のデータ可視化ツールを一度にまとめて比較できるような勉強会がないと気づいたんです。

――ないのであれば作ろう、というわけですか。

その通りです。しかも、日本中の誰もが簡単にアクセスできる本という形で。でも、本にまとめようとすると、ひとつひとつのツールを深掘りできないもどかしさはありましたね。浅く広く情報をまとめないといけないので、たくさん伝えたいことがあるプロとして、書く内容を適度な量に絞り込む勇気が必要でした。


データ可視化ツールの種類

――具体的にどのようなツールについて触れているのでしょうか。

例えば統計グラフとして『Power BI Desktop』というツールを取りあげています。『Power BI Desktop』はMicrosoftが提供しているもので、オンプレミスおよびクラウドベースの数百ものデータベースにアクセスできてグラフを作成することができます。


『Power BI Desktop』公式サイトより


このパートを執筆してくださったデータアナリストの小林寿さんは、Microsoft MVPにも選出されたような優秀な人です。

――え、じゃあこの人だけで1冊書けてしまうぐらいですよね。

ええ、でも『Power BI Desktop』には紙面の都合上9ページしか割いていませんので、選りすぐった情報しか載せていないのです。

――それはかなり凝縮されていそうですね。

さらに、人や情報の繋がりを可視化する「ネットワーク」の章では『Cytoscape』というツールを取りあげていますが、そのパートを執筆くださった大野圭一朗さんは『Cytoscape』の開発者ですからね。

――開発者が自ら!

しかも19ページという少ないページの中で、今回の書籍のために「ノーベル賞を受賞した山中教授の研究論文の引用関係を可視化する」という独自のテーマをわざわざ考えて、新規にデータも集めて執筆くださいました。


『Cytoscape』公式サイトより


――すごいなあ。他にはどんなツールを取りあげているんでしょうか?

あとは地図ツールですね。地理情報システムのQGISで東京都の犯罪件数をヒートマップにしてみたり、ArcGIS Onlineで東京都の保育園事情をマッピングしてみたりしています。こういったツールを多くの人が使い始め、データの可視化に興味を持ってもらえたら、世の中で色々なことが変わると思っていて。

――それはどういうことですか?

例えば選挙。立候補者が出した施策について有権者が主観ではなく、データを基づいて客観的に「どれくらいの税金をつかって、どのような政策を実行しようとしていますか?」と聞けるようになると選挙がもっと建設的になりますね。ですから、例えばこの本に書いているような地図ツールを使いながら立候補者に対して「この現状をどう考えていますか?」などと、いい意味で上げ足をとってほしいと思っています。

――なるほど、確かに。ただ「世の中を良くしろ」と抽象的に言うのではなく、図を使って具体的に議論しようよ、ということですね。

その方が議論も楽しいですしね。

――大きなところまで見ていらっしゃるんですね。他にツールは載ってますか?

あとはインフォグラフィックですね。インフォグラフィックはアイコンや写真を使いながらストーリーを伝えられるのでわかりやすくて面白いと思います。例えば、Excelに記入された「100m走の記録表」をインフォグラフィックとして表現したものがこちら。


「E2D3.org」より

――わあ、これは分かりやすいですね。何を使っているんですか?

これはオープンソースのソフトウェア 『E2D3(Excel to D3.js)』を使っています。ちなみに冒頭で私が立ち上げたというのがこの『E2D3』を開発する団体「E2D3.org」です。

――こういうのが増えるとデータも楽しくなりますね。

まさに、「E2D3.org」では「データって楽しい」という経験を増やしたいと思って活動をしています。人生において最初の体験はすごく重要なので、子ども達に「データって楽しい」と思ってもらうにはどうしたらいいか、と考えながら開発しています。

――そんな思いもこの本に繋がっているわけですね。


アウトプットを刷りあわせるためにも「可視化」を

――実際に多くの方が執筆者として携わっていますが、どのようにして決めていったのでしょうか。

まず本を作ることは決まっていて、何を載せるべきかという仮の目次を作っていきました。そして、誰がどのパートを書くかは立候補制にしたんです。「E2D3.org」の活動は約6年やっていますが、何をするにも立候補制です。とはいえ、レベルが高い人たちばかりなので、誰が手を挙げてもいいものはできるだろうと。

――なるほど。そもそも「E2D3.org」という団体はどんな繋がりでできていったのですか?

「E2D3.org」は前職に所属している時に同僚と作ったんですが、今は社外の人だけで構成されています。出会いは「もくもく会」や「ハッカソン」などですね。

――以前にconnpassを取材したことがありますが、ああいったツールを使って出会っていったわけですね。

<参考>【Pythonのパイセン!】 Python仲間を作れる最高のプラットフォームを、利用する立場から運用する立場へ /connpassの的場さん

そうですね。他にも大きいカンファレンスなどをきっかけに色んな人に会っていきましたね。実際「E2D3.org」には北海道や名古屋、愛媛、倉敷、佐賀など色んな地域の方が所属しています。


――では最後に、この本はどのような人に読んでほしいと思っていますか?

Excelを使って標準的なグラフを作っているけど物足りない人や、「新しい表現をしてみたいけど何から手を付けていいか分からない」という人には是非手にとってもらいたいですね。データ可視化の全体像をみてもらうことで、自分が作りたい可視化の方法を見つけることができると思います。さらに“学びたいデータ可視化ツール”を見つけられた人向けに、各節の最後にはより深く学ぶための参考文献もご紹介しています。

――網羅的になっているんですよね。

そうです。この本は各ツールを徹底的に説明した辞書的な本ではなくて、イメージとしては料理本のイメージに近いです。“初心者の方が気軽につまみ食いできるデータ可視化のサンプル本”と思ってもらえれば良いと思います。

――エンジニアの皆さんに気軽に読んで可視化のレシピを身につけてもらえる、と。

はい。エンジニアさんはデータにまつわる仕事が多くあります。現状把握やPDCAサイクルを回すのにデータは必要です。ただ仕事を始める前に、お客さんや上長にどういったアウトプットを出すのかというイメージをどのように具体化したらよいか分からずに困っている人が多いと思うんです。だけど、仕事の始めにアウトプットを刷りあわせておかないと業務の最後に「言っていたアウトプットと違うじゃないか」ということになって問題が生じてしまいます。

――あるあるですね。

そんな時にアウトプット事例集があると良いのですが、これまでに出版されていたデータ可視化の本ではあまり体系的にまとまっていませんでした。それをしっかりとまとめたのもこの本の特徴です。


データ可視化ツールはいっぱいありますが、この本は上手くカテゴライズされているので全体を眺めるだけでも参考になると思います。

ぜひ皆さんも、手元に1冊置いてみてはいかがでしょうか。


『伝わるデータ・ビジュアル術』(技術評論社)


五十嵐さん、ありがとうございました!


取材協力:E2D3.org技術評論社
取材+文:プラスドライブ

この記事が気に入ったらいいね!しよう

いいね!するとi:Engineerの最新情報をお届けします

プライバシーマーク