
自動車からのリアルな走行データを保有するHondaと、Yahoo!検索やYahoo!知恵袋などのオンラインデータを保有するLINEヤフー、それぞれで分析業務に携わる2人が対談しました。
前半では、交通安全を実現するために活用できるデータについて。様々なデータで実現できる未来について語ります。
後半では、データアナリスト2人の仕事の流儀をテーマに、データ分析業務に携わるようになったきっかけや、今後の展望について聞きました。

池宮 伸次氏
LINEヤフー株式会社
MSカンパニー データソリューション企画開発本部
シニアデータアナリスト

杉本 佳昭
本田技研工業株式会社
電動事業開発本部 SDV事業開発統括部
SDV戦略・企画部 UX戦略課
アシスタントチーフエンジニア
データ分析業務に携わる2人が語る「仕事の流儀」
後半は、データ分析業務に携わるようになったきっかけや、達成感がある場面、心がけていること、仕事への取り組み方、今後実現したいことについて。2人の仕事の流儀をお話しいただきました。
データ分析業務に携わるようになったきっかけ
私はデータとはあまり関係ないキャリアを歩んできました。学生の専門は機械工学だったため、実験データを扱ったり統計学などを学んだりはしましたが、いわゆるデータサイエンスが専門ではありませんでした。
そこからデータを扱う仕事に出会ったのは?

小さなころから乗り物が好きで、機械工学を専攻したのち、Hondaに入社しました。入社後はHondaJetやレース車両の開発などを担当していました。
そのような技術の仕事をする中で「Honda内の優れた技術をもっと世の中に届けたい」と感じ、企画や事業開発ができる部署に社内公募で異動しました。
異動先では様々な新しい事業の企画や実証が行われていて、その中の1つが車両データを用いた事業でした。このデータ活用事業が世の中に出ていく顛末は福森のインタビュー記事にて詳しく語られています。たまたま、別件をきっかけに私たちが持っているリアルな移動データに興味を持ってくださったお客様のご要望にお応えする方法を模索し、そこから水平展開して他の企業様や自治体に営業して分析レポートを納品していました。そのうち、気がつけば社内からも「なんか面白いことでお金を稼いでいる人」という存在になってきたように思います。
私はもっと特殊で、データとはまったく無縁の学生時代を過ごしました。本を作りたかったので出版社に入り、編集者として仕事をしていました。その後、編集プロダクションを経て、転職活動でYahoo! JAPANを使って就職情報を調べたのがきっかけでした。
トップページの一番下に「採用情報」へのリンクがあり、編集者を募集していたのです。しかし、編集といってもコンテンツを作るのではなく、検索エンジンのデータをメンテナンスする業務で、入社後は検索結果の評価やメンテナンスを担当していました。
そこからデータ分析と出会ったのは?
検索結果を評価するには、検索データを理解する必要があり、「日本語的な意味」と「検索キーワード」というデータの組み合わせが面白くて、多角的に分析していました。
そして、Yahoo!検索の公式ブログに「キーワードから分析したネタ」の記事を投稿することにしました。例えば、「北海道と長野県にはゴキブリが少ないという検索的推察 ―地域検索の世界―」といった記事です。このような記事を投稿していると、社内でいつの間にかデータを分析する人だと思われて、データ分析の依頼が届くようになったのです。

達成感がある場面とは
Hondaの場合は、どのようにして仕事の依頼が来るのですか?
主にWebサイトのお問い合わせフォームから連絡をいただきます。
そこからお客様の実現したいことをお伺いして、そのために必要なデータをご提供しています。私が分析レポートを書くこともありますが、それよりはお客様が作成するレポート用のデータをご用意することが多いです。
先ほどもお話しした通り、元々データサイエンス領域は専門外でしたが、誰よりもHondaの車両データの活かし方を知っているし、お客様が実現したいことも理解できる。最終的な成果を世の中の役に立てるご提案をするのが私の仕事です。一言で説明しづらいので自己紹介のときにいつも困ってしまいます。
コンシェルジュみたいな感じですね。
ありがとうございます。とても素敵な表現ですね。
交通安全に車両データを活用したいとお考えのお客様からは、ブレーキの踏み方や、ABSや横滑り防止装置が作動した地点のように、とても細かい車両データのご要望をいただくことがあります。
しかし、細かい操作情報まで見なくても速度の変化だけで危険な場所や施策の効果は分かるので、「まずはシンプルに施策前後の速度変化を見てみませんか?」等とご提案します。そのデータを見て、仮説と異なる点や意外な結果が出てきたら、そこを深掘りする次の一手までも含めて、お客様の成果を最大にするお手伝いをしています。
また、個人情報や機密情報の観点から社外へはご提供できかねるご要望をいただくことも少なくありません。そのようなときは、各種ガイドラインを参照しながら個人情報等は削除した上で、お客様のご要望にお応えできる必要十分な集計データをご提案します。

私もデータ分析をしていると、経験的にデータの構造などを見るだけで、ある程度は予測が立つようになってきます。事前に想定した仮説に近い結果が出ると、「やはりこうだったか」と感じるのは面白いですよね。
具体的にはどのような例があるのでしょうか。
新型コロナウイルスの感染状況についての分析があります。厚生労働省から報告されている定点当たりの患者報告数というデータを用いて、感染者数が増える前にどのような行動をしているのかを検索のアクションから分析しました。
例えば、感染者数が増加する1週間ほど前に先行してどのような検索行動が増加するのか、といった相関を調べるのです。実際に分析してみたところ、感染者数が増える1週間前の動きに相関しているキーワードとして、プールやお出かけ系といったものが抽出される傾向があり、やはり人々が活動的になったり対面接触が増えるような行動が増加すると、感染症も増える傾向にあるのではないか、といった可能性が見えてきました。
このように、「社会における動き」が検索から見えるのは興味深いですね。

たしかに、仮説を立てて、実際にそのような結果が出たときは嬉しいですね。そしてそれを自分が最初に見られること、人に見せてリアクションが得られる瞬間が楽しいです。
膨大なデータから必要な要素を抽出して整え、分析結果を説明しやすいように可視化して、見せたかった結果を出せると達成感があります。チームメンバーやお客様に結果をお見せすると、彼らの仮説が裏付けられることや、逆に裏切ることもありますが、いずれにしても必ず心が動く瞬間があります。自分が提供した1枚の図表で人の心が動いたときが最も達成感があります。
データ分析業務に取り組むうえで心がけていること
その他にも仮説と異なる結果が出たときは力が入りますね。テストの問題文をようやく読み終わった感じで、「さぁここからだ」と深掘りするポイントだと思います。そのようなことはありますか?
データ分析をしていると、分析した結果として「差がない」という答えが出ることがよくあります。ただ、お客様への報告として、「AとBを比べてみましたが、差がありませんでした」というとがっかりされてしまうことが多々あります。
お客様からすると、「何も発見がなかった」と感じるのかもしれませんが、私は「差がない」という事実が分かったことが重要だと思っています。「変わった」という結果が得られることだけが重要なのではなく、「変わらなかった」という結果も重要です。そこを意識して分析するようにしています。

他社と比較することもありますよね。他社は売り上げが下がっているけれど、貴社は変わっていない、という状況であれば相対的には良い結果といえます。
分析には比較対象が必要なので、時系列での比較なのか、競合との比較なのか、比較軸は様々あると思います。その中で、お客様が喜ぶ結果だけでなく、データの普遍的な部分や差異を見つめることが重要です。
今後実現したい「データを使った未来」
技術は「生み出す」だけでなく、世の中に届けて「使われる」ようになっていくことが重要だと思っています。特に、自動車ならではのデータ活用ソリューションを生み出したいと、個人としても会社としても考えています。
気象データについても、点ではなく面で捉えられるのが自動車のデータの強みだと思っています。例えば、この図は大阪の北部で夕立が降ったときの車両データを可視化した例です。
時系列で見ると、雨が降った地域ではワイパーが動き、ヘッドライトも点灯します。日射量も徐々に減り、その後に気温が下がることも読み取れます。もちろん、道路管理者も気温や降水量が分かる気象観測局を設置していますが、数が限られていますし、ライブカメラの映像を常に誰かが見ていられるわけではありません。
常に全国を走っている自動車だからこそ、点ではなく面としてリアルタイムにデータを取得できます。このように、Hondaが持っている技術を世の中にお届けできたらいいなと思っています。

LINEヤフーでは検索データを分析することが多く、利用者のニーズや悩みについてデータを取得しています。しかし、取得できないデータもたくさんあります。
例えば、「EV 自動車」というキーワードの検索頻度が増えている、というデータが得られたとします。検索回数は増えていても、それが世の中で実際に流行っているかはそれだけでは分かりません。ここでHondaのドライブデータや、小売店のPOSデータ、クレジットカードの決済情報のようなリアル側のデータとの組み合わせが必要です。
LINEヤフーではインターネット上の行動データは多く取得していますが、リアル側のデータと組み合わせて初めて、「検索数が増えた」という結果と、「本当に流行っている」という因果関係が証明できます。
今後はそのような連携をしたいと考えています。