位置情報の概要と活用例の紹介

KDDIのグループ会社であるARISE analyticsでは、人々の動きを把握できる位置情報を分析し、様々な課題の解決に取り組んでいます。本記事では、KDDIおよびARISE analyticsが分析している位置情報の特徴や、その活用例を紹介します。

位置情報とは

1. 位置情報の概要

位置情報とは、人や動物、車両など、動く物体の位置を測位した情報のことを指します。位置を測位する方法は様々ありますが、ARISE analyticsでは主にauユーザーのスマートフォンから得られる位置情報を分析しています。スマートフォンを介して取得できる位置情報には、GPSと基地局による2種類のデータがあります。GPSデータは、スマートフォンに搭載されたGPS機能を用いて、ユーザーの緯度や経度などの情報を直接的に測位し蓄積したデータです。基地局データは、各ユーザーのスマートフォンが通信・通話のために接続している基地局の緯度や経度をもとに、ユーザーの位置を間接的に測位し蓄積したデータです。
本記事および今後の記事では、GPSデータなどの位置情報を用いた分析事例やそれに必要な技術を紹介していきます。なお、位置情報を分析する際には、ユーザーの個人特定につながらないよう、十分なプライバシー保護措置がとられています(参考資料1)。例えば、分析に用いるデータは、位置情報利用規約に同意したユーザーから取得されたデータに限定され、氏名や住所など個人を特定する情報は削除されます。分析結果も、該当ユーザー数が少人数となる属性の組合せについて、集計値を秘匿化するなどの措置がとられています。

2. GPSデータの特徴

GPSは衛星から送信される信号を受信することで、ユーザーの緯度、経度を数分から数十分間隔で測位し、同時に測位日時、測位誤差などの情報を取得します。測位されたGPSデータを用いると、図1のように人が移動した軌跡を知ることができます。このような情報と、建物や道路の位置などの地理情報を結びつけることで、様々な分析を行うことができます。ただし、地下や建物内、ビルに囲まれた場所などでは、測位できない場合や、測位されたとしても間違った地点を記録してしまいノイズとなる場合があるため、分析時には誤差に注意する必要があります。

図1: GPSデータによる軌跡のイメージ

図1: GPSデータによる軌跡のイメージ

3. GPSデータの活用例

災害復旧、交通誘導、警備計画

災害復旧やイベント時の交通誘導、警備計画では、その時点でどこにどの程度の人がいるかを把握することが重要になります。そこで、異常検知と呼ばれる手法を用いることで、平常時と比較して大幅な人口変化が生じているエリアを検出し、計画立案に活用することができます。例えば、台風や地震など大規模な災害によって平常時より人口が減少したエリアから、被災により通行できなくなった道路を把握して復旧活動につなげることが可能です。他にも、花火大会やコンサートなどのイベントによって平常時より人口が増加したエリアを検出し、イベントにより混雑している道路を網羅的に把握し、警備計画や交通誘導に組み込むなどの活用例が考えられます。

交通事業者のサービス効率化

交通事業者向けの活用として、サービス利用者の動態を把握することで、周辺地区の活性化や交通計画の改善につなげることができます。位置情報データを用いれば、移動手段や移動経路などの情報を推定することで交通事業者のサービスに活用することができます。例えば、徒歩、自動車、電車など人が移動する手段や移動した経路を推定し、定期的に往復の電車移動を行っている人を電車通勤者とします。乗車している区間の長さに応じて、短距離通勤者・長距離通勤者の人数を推定します。短距離通勤者に対してバスによる移動を促し、電車混雑率の緩和につなげるなど、人々の移動情報をMaaS(Mobility as a Service)事業に活かすことができます。

分析事例: 異常エリア検出

1. 分析目的と実現までの課題

ここでは、上述した災害復旧や交通誘導、警備計画向けに用いられる異常値検知と呼ばれる手法の一例について説明します。異常値検出では、平常時と比較して大幅な人口変化が生じたエリア、すなわち異常エリアを検出します。ただし、GPSデータでの異常エリア検出を実現するためには、以下で述べるように、図2に示すような課題を解決する必要があります。
まず、GPSデータのノイズに対処する必要があります。GPSデータには、不適切な緯度・経度情報や測位日時を持つレコードが含まれています。そこで、極端な移動速度となる測位点を除去する、スムージングにより誤差の影響を小さくする、などの対応が必要です。
次に、異常エリア検出はエリアに注目した分析であるため、全国の様々なエリアを網羅的、統一的に定義する必要があります。そのために、多くの位置情報分析では標準地域メッシュと呼ばれるエリア定義を用います。地図に対してメッシュ状に正方形を敷き詰め、各正方形にコードを振ることで様々なエリアを統一的に表現します(参考資料3)。これにより、網羅的、統一的なエリア定義が可能になります。
メッシュによってエリアを定義した後、異常判定のための指標を定義する必要があります。ここでは、メッシュごとに蓄積されたGPSデータを用いて、過去の一定期間の傾向から大きく乖離しているかを統計的に判定することで異常度を算出します。
算出されたメッシュ別異常度のデータは、基本的にメッシュコードと異常度の羅列であり、そのままでは意味を読み取ることが困難です。このデータを地図上に表示し、市区町村名や道路、地形などの地理情報と紐づけなければ有用な示唆を得ることができません。この課題に対しては、異常エリアを地図上に表示することで、異常エリアの分布と地理情報を紐づけやすくします。

図2: 異常メッシュ検出までの課題と対処

図2: 異常メッシュ検出までの課題と対処

2. データ処理フロー

前述した多くの課題に対処しながら、GPSデータを処理して異常エリアを検出し、可視化するまでの処理フローを紹介します。処理フローは大きく、前処理、加工・集計、分析、可視化の4つのステップに分かれます(図3)。各ステップの概要は以下の通りです。

図3: データ処理フローの概要

図3: データ処理フローの概要

まず前処理のステップでは、不適切な緯度・経度や日時などの測位情報を持つと判定されたレコードの除去や、スムージングによる誤差への対応などの処理を行います。次に加工・集計のステップでは、前処理済みのGPSデータを用いて、全国の全メッシュに対して時間帯ごとの人口などを計算し、時系列データとして蓄積します。
分析ステップでは、蓄積されたメッシュ別のGPSデータを用いて異常度を算出します。メッシュごとに、異常を検出したい日の測位ユーザー数と、過去の一定期間における測位ユーザー数を比較します。平常時と比較して乖離が大きい場合に大きな値をとるような異常度を定義し、全国のすべてのメッシュについて異常度を算出します。
最後に可視化ステップでは、算出されたメッシュ別異常度のうち、閾値を超えたメッシュをドットマップとして地図上に表示します。可視化することで、異常メッシュと地理情報を紐づけやすくなり、異常度とメッシュコードの羅列ではわからなかった示唆を得ることができます。

2. 異常メッシュ検出の結果と示唆

上述のデータ処理フローを実行することで得られる分析結果と示唆の一例を紹介します。ここでは、例として2018年8月15日(水)に開催された諏訪湖祭湖上花火大会を取り上げます。
まず、2018年8月15日の異常メッシュの検出結果を可視化した図4を確認します。この図は、全国的な異常メッシュの分布がわかるようなズームレベルに設定しています。点の大きさが平常時の人口の多さを表し、赤い点は平常時と比較して人口が増加しているメッシュ、青い点は人口が減少しているメッシュを表しています。また、色の濃淡で異常度の大きさを表しています。全国で多くの異常メッシュが検出されていますが、ズームインしていくと、複数の異常メッシュが集中的に検出されている場所があることがわかります。その1つが図5に示した諏訪湖周辺です。

図4: 2018年8月15日の全国の異常メッシュ検出結果

図4: 2018年8月15日の全国の異常メッシュ検出結果

図5: 2018年8月15日の諏訪湖周辺の異常メッシュ

図5: 2018年8月15日の諏訪湖周辺の異常メッシュ

諏訪湖周辺に着目すると、諏訪湖の南東側に集中的に赤い点が分布しています。これは、花火大会当日に、このエリアに平常時よりも多くの人が集中していたためと考えられます。また、このエリアを訪れた人が当日に測位された場所を可視化し、平常時と比較することで、当日に混雑していた道路を把握することができます。
図6の右側は、花火大会当日の15時以降に諏訪湖南東側のエリアに訪れた人が、当日中に測位されたメッシュを示しています。左側は、諏訪湖周辺で大きなイベントがなかった1週間前の8月8日に、同様の可視化を行った結果です。これら2つの図を比べると、諏訪湖周辺と上田、佐久、松本、上伊那の各方面を結ぶ高速道路などの主要道路だけでなく、主要道路を結ぶ県道67号、県道460号、国道152号も平常時と比較して混雑していることがわかります。これらの結果から、当日の交通誘導においては、主要道路以外の、上記のような主要道路を結ぶ道路も考慮する必要性が示唆されます。以上のような分析を行うことで、花火大会当日の警備計画や交通誘導への示唆を得ることできます。

図6: 人口集中エリア来訪者の測位メッシュの分布

図6: 人口集中エリア来訪者の測位メッシュの分布

まとめ

本記事では、KDDIおよびARISE analyticsが分析しているGPSデータを中心とする位置情報の特徴や、GPSデータの活用例、分析事例を紹介しました。分析事例で述べたように、GPSデータの分析を実現するには多くの課題が存在します。このような課題へ対応するためには、ノイズ除去、メッシュ別データへの集計、時系列データとしての蓄積、必要な統計量の算出、可視化による地理情報との紐づけなど、多くの処理が必要です。ARISE analyticsは、位置情報の活用に向けて、今後もこのようなデータ処理フローの効率化や、分析内容の高度化に取り組んでいきます。

参考資料

  1. 1. KDDI株式会社『「位置情報ビッグデータ」の活用』
       https://www.kddi.com/corporate/kddi/public/bigdata/
  2. 2. 総務省『地域メッシュ統計について』
  3.    https://www.stat.go.jp/data/mesh/m_tuite.html