秋田魁新報社記者に聞く
データの深掘り、見せ方の3つのコツ

秋田魁新報社
デジタル編集部記者
斉藤 賢太郎 さいとう けんたろう さん

秋田魁新報社
(外部サイトに移動)
デジタル技術の活用が進む中で、データを活用して売上の予測や課題の可視化などを行っていくことが、これまで以上に重要になっています。また、行政においてもEBPM(Evidence Based Policy Making:データ・合理的根拠に基づく政策立案)が推進されています。しかし、データを活用したいという思いはあるもののデータ分析・活用の具体的なイメージが膨らまないという声も聞こえてきます。
秋田魁新報社の特集記事「データ読み解き」では、秋田県に関するさまざまなデータを深掘りし、動くグラフなどを使いながら、秋田県の特徴や課題を分かりやすく紹介しています。今回はデジタル編集部記者の斉藤さんから効果的なデータ収集の方法や収集したデータの可視化のコツを伺いました。

紙面とは異なる特徴のあるデジタル記事

「デジタル編集部」はどのようなことをしていますか。

デジタル編集部はWebサイト「秋田魁新報電子版」運営をしています。紙面に載った記事を秋田魁新報電子版にも掲載しているほか、デジタルの特性である即時性を生かして記事を配信。デジタルならではの表現を用いた独自記事も公開しています。

紙面掲載とWeb掲載で記事の作成の仕方は変わりますか。
紙面では、最初に最も大切なことを「見出し」で表し、「リード」「本文」の順に詳細を伝える「逆三角形型」の文章構成とするのが基本です。
しかし、Webの記事では、「見出し」で全体像が分かってしまうと、その先を読んでもらいにくくなると言われており、例えば「秋田の新ブランド米・サキホコレ、Twitterでの反響は?」など、見出しで続きを読みたくなるようなタイトルを意識しています。
また、Webの記事はパソコンよりも、スマートフォンで見られる方が多いので、スマートフォンで見たときにはどのように表示されるのかをチェックするなど、ユーザーにとって見やすいコンテンツづくりを心掛けています。
そのほか、紙面の場合は、記者が記事を書き、紙面レイアウトは別の部署が担当するなど分業化されていますが、Webの記事の場合は見出しづくりから写真のレイアウトまで自分で完結させることが多いです。こうして記者自身が取材、記事・グラフィックス作成、見出し・レイアウト、さらにはSNS発信、アクセスデータ(読まれ方)の確認まで手掛けることで、PDCAサイクルを回せるようになります。紙面作りとはひと味違う面白さがあります。
ほかにWeb記事ならではの特徴はありますか。

紙面との大きな違いのひとつは、Webの記事はアクセス解析をすることで、自分たちが書いた記事がどのくらい、どのように読まれているかを知ることができる点です。日々、記事へのアクセス経路を分析していますが、いつもよりもTwitterからの流入が多いと思ったらインフルエンサーが記事を紹介してくれていたり、Googleディスカバーでの露出が増えると流入数が増えたりするなど、デジタルの世界は自社単独では完結せずに情報を流通構造全体、生態系のようなイメージで捉える必要があると感じています。

秋田魁新報社・斉藤記者のツイート。
公開後、個人のTwitterアカウントでも記事に関する情報を発信している。
コメントなどで、読者の反応を直に知ることができるのもWebの特徴。

データの深掘りで明らかになる秋田のあれこれ

特集「データ読み解き」のテーマはどのように決めていますか。
私自身は人口減少、少子化、防災、気候変動などに関心があり、そうした分野のデータを深掘りして記事にすることが多くなっています。
その1つの“データで見る若者流出と少子化 止まらない「縮小ループ」”では、国勢調査のデータを活用し、戦後70年間の人口データと将来推計を分析しました。
また、“ハタハタよ、どこへ行った?漁獲量 変化「動くグラフ」”では、秋田県民に関心が高いハタハタの漁獲量データから過去60年の推移を動くグラフで表現しました。
最近では“凍結路面で交通事故多発の小路も…オープンデータと地図で危険箇所を探る”というテーマで、警察庁が発表している2019年から2021年の約100万件の人身事故データの中から県内で発生した4192件を抽出して地図上にマッピングし、家の回りや通勤・通学路など身近な場所のリスクを可視化しました。

■特集「データ読み解き」記事一覧ページ(外部サイトに移動)

データ分析による記事に対する周囲の反応はいかがですか。
記事によってさまざまです。当初は自分の興味関心に応じて気候変動やマクロ経済に関するデータを基に記事を書きましたが、正直アクセス数はあまり伸びませんでした。
そこで少し頭を切り替えて、読者が親しみやすい題材やその時々でトレンドになっている話題にデータを掛け合わせるという手法を取り入れました。季節ハタハタの時期に合わせて漁獲量の長期推移の動くグラフを公開したり、毎年「ギョーザ支出額日本一」がニュースになる家計調査を使って秋田市の日本一を調べたりしたのですが、こういった記事はアクセス数が比較的伸びました。
気象庁の約1400万件の降水量データを分析した記事をTwitterで紹介したところ、メディア関係者やデータ分析・可視化界隈の方たちから大きな反響をいただくことができました。地方紙の記者がPythonを使って大量のデータを分析・可視化した例はあまりなく、興味深く受け止めてもらえたようです。
また、先にご紹介した人身事故データから事故発生場所をマッピングした記事などが評価され、マップ作成を手伝ってくれた若手エンジニアと一緒に2022年の社長賞を受賞するなど、データを活用した報道が社内でも評価されています。
データ分析の記事を拝見するとグラフや表などが分かりやすくまとめられていますが、どのようにして学ばれたのですか。
私がデジタル編集部に配属されたのは、2021年の4月でしたが、その頃はExcelで少しだけ関数が使えるというレベルでした。
デジタルならでのは多様な表現を模索し、オンラインコミュニティや勉強会などで技術を習得し始めたのですが、その時に意識しているのは最終成果物のイメージを固めてから技術を取り入れることです。
データ分析や可視化のためのツールはたくさんありますが、どのようなツールや技術を使えば最短距離で最終成果物に辿り着けるのか。逆算することにより、習得コストを下げるようにしています。ただ、このやり方には知識や技術がつぎはぎになってしまうという問題点もあります。分析や可視化に取り組む中で、統計学やプログラミング、GIS(地理情報システム)といった分野を体系的に学ぶ必要性も感じています。

(秋田魁新報電子版 記事「秋田の新ブランド米・サキホコレ、Twitterでの反響は?デビュー後1週間の投稿を分析すると…」から引用)

データ分析のコツは仮説構築、可視化、網羅性

データを活用する際に心がけていることは何ですか。
データ収集の前にまずは仮説を構築することです。仮説がないままにデータを収集してしまうと情報の海に溺れ、結果として何にもつながらないことが起きかねません。このデータから何が分かったら面白いのかを考えながら進めるということが大事なのではないでしょうか。
気象庁の1400万件の気象データを分析した記事では、2022年夏の大雨を踏まえ「秋田県内でも気候変動の影響で短時間強雨が増えているのかもしれない」という仮説を構築し、検証するためにデータを収集しました。
また、警察庁の人身事故データを扱ったときは「春夏と秋冬とでは歩行者事故の発生件数に違いが生じるのではないか」という仮説を立て、他地域との比較などを通じてそれを検証しました。仮説構築、検証、そしてそれを観察していくというプロセスがデータ活用では必要と考えます。
データ分析をする方にアドバイスをお願いします。
私がデータ活用をしている目的は2つあり、1つ目はデータにより今まで分からなかった興味深い事実をあぶり出すこと、2つ目は明らかになった事実から社会課題の解決に繋げていくことです。
それに向けて「ここが分かれば面白いのでは」という切り口を明確にすることで、効果的にデータ分析ができると思います。地域別や性別、年代別などさまざまな切り口で仮説を構築し、検証しています。
可視化については、データから得られた「発見」や「洞察」を効果的に伝えるために必要なことだと考えており、ユーザーが操作できるグラフや色分け地図などの工夫をしています。SNSでデータの可視化をしている方もいらっしゃるので、そうした方の作品もとても参考になります。
また、可視化の際にはできる限り網羅性のある形でデータを見せることも心掛けています。例えば、大学進学データでは過去10年にどこの大学へ何人が進学したかを調べられるチャートを作り、交通事故データでは3年間の全人身事故4192件の発生地点をマップに落とし込みました。こうして網羅性を確保することで、より多くのユーザーが記事の主題を「自分ごと」として受け入れやすくなると考えています。
データの深掘りの際には行政のオープンデータを活用されている例も多いと思いますが、今後のオープンデータに関して、期待することを教えてください。
行政はデータの提供者としての役割を担っており、国及び地方公共団体はオープンデータに取り組むことが義務付けられました。しかし、現状、オープンデータが思うように進んでいないのは、人的リソースが足りないほか、自分たちのデータがどのように活用されるかがイメージできないということが大きいのではないかと思います。
ただ、その時にお聞きしたいのは活用したいと思っている方とコミュニケーションを取っていますか?ということです。秋田市が昨年開催したオープンデータ意見交換会では、議会に関するデータで、どのようなデータの公開を望んでいるのか、どのような形式で公開して欲しいのかなどについて意見交換した結果、議会の委員会資料が公開されるようになりました。データ形式はPDFのため活用という点では不十分ですが、情報がオープンになったのは大きな一歩です。
行政のデータは公開することが目的ではなく、データを活用してもらい、それが地域課題の解決につながることが目的だと思うので、活用してもらうためにはどうすれば良いかというコミュニケーションを取ることは大切ですし、データを作成してもそれをPDFに格納するのではなく、生データとして他の人が扱いやすい形で残し、自分たちだけで閉じないという意識が必要なのではないでしょうか。
データは多くの人の目に触れ、さまざまな視点が加わることで、社会課題解決や地域経済活性化につながるアイデアが生まれるはずです。

無償で使えるソフトウェアなども使用し、読者が関心を持つための工夫をしている。