こんにちは、ARISE analyticsでデータ分析支援業務を中心に行う「データコンサル」キャリアトラックに所属している徳元です。本記事では、前回の記事に続き、ACM SIGSPATIAL 2024本会議への参加内容についてご紹介します。
ACM SIGSPATIALとは?
ACM SIGSPATIALは、ACM(Association for Computing Machinery: 米国計算機学会)の地理空間情報分野に特化した特別研究グループ(SIGSPATIAL)が主催する、年間最大規模のイベントです。この国際会議は1993年にシンポジウムやワークショップの形で始まり、地理空間データに関わる分野を中心とした国際会議です。
提出された論文の内、本会議への採択率が毎年約20%〜30%と難関であることから、地理空間情報分野における世界的に重要なカンファレンスとして認識されています。第32回となる今年は、アメリカ合衆国ジョージア州アトランタにて、10月29日から11月1日までの4日間、ワークショップを含む多彩なプログラムが開催されました。
参加のきっかけ
今回参加したACM SIGSPATIALに併設された、ユーザーの行動軌跡の推定精度を競うコンペティション「HuMob’2024」に社内メンバーで参加し入賞。さらに現地で発表する機会を得たことが、現地参加の大きなきっかけとなりました。
私自身、それまで位置情報に関するデータを扱った経験はありませんでしたが、このコンペへの参加を通じて位置情報に強い関心を持つようになりました。そして、アトランタで開催される本カンファレンスに参加し、最新の技術トレンドを学びたいと考え、社内の後押しもあり、初めての海外出張に行くことができました。
特に印象に残った発表
ACM SIGSPATIALでは多数の発表があり、非常に充実した時間を過ごすことができました。すべてを紹介するのは難しいのでその中でも個人的に特に印象に残った発表をご紹介します。
The Rise of the Data Science Assistant: LLM Agents in Action
Dr. Hongxu Ma: Staff AI Research Scientist at Google
Googleの生成系AI「Gemini」を基盤とした「Data Science Agent」について紹介されていました。
Googleの生成系AIであるGeminiをベースに、データセットと行いたいデータ分析を指示することで、agent AIが自動で必要なPythonコードと処理内容の説明を含むノートブックを作成します。データクリーニング、探索的データ分析 (EDA)、統計分析、予測モデリング、モデルのパフォーマンス評価まで行うことができます。
現段階では、米国内でのみ利用可能であり、表形式データ以外や少量データにおける課題が残されていますが、データサイエンティストの日常業務がLLMによって大幅に効率化される未来を予感させる内容でした。
Prompt Mining for Language Models-based Mobility Flow Forecasting
Hao Xue: University of New South Wales
Tianye Tang: University of New South Wales
Ali Payani: Cisco Research
Flora D. Salim: University of New South Wales
この発表では、LLMと位置情報データの組み合わせにおける研究について紹介されていました。データの構造や特徴を考慮して、自然言語での最適なプロンプトテンプレートを自動生成・改良する手法についての研究内容です。
従来では、テンプレートを用いて位置情報データを文章化し、LLMにインプットするのはよくある手順ですが、効果的でないテンプレートを用いた場合、モデルの性能を最大限に引き出せない可能性があります。
本研究では、プロンプトの品質を評価する「プロンプト品質評価器」を導入し、情報エントロピーや分類器を用いて最適化。初期生成 → 改良 → 高度な論理構造(Chain of Thought)を加え、段階的なプロセスを採用。最適な形に調整される自然言語表現のテンプレートを生成することを目指しています。
効率的に位置情報データなどをLLMに理解させる技術として今後の展開が楽しみな内容でした。
Keynote 1: Dr. Moustafa Youssef, The Indoor Positioning System: A Journey through Space and Time
Moustafa Youssef: The American University in Cairo
屋内の位置情報に関する研究紹介になります。GPSは広く使われる屋外の位置特定技術と見なされてきましたが、これに匹敵する屋内向けのソリューションは依然として実現されていません。
屋内の位置情報取得が難しいのは周知のとおりですが「人間は89%の時間を屋内にいる、よって屋内での位置情報は重要」との課題感から屋内位置情報のソリューション技術に着目して研究されておりました。
屋内のデータ活用においての課題は屋内構造の情報が取得できない課題があり、屋内での行動データをもとにレイアウト構造を推定することを試みた研究内容、また廉価スマホの場合さらに屋内の位置情報の取得が難しくなるのでスマホ側にfingerprint機能の実装を導入すべきとの提言をされているなどデータドリブンな製品改善をされていて非常に興味深かったです。
また本研究の応用先としては公共施設の非常出口のルート設計や、駅などの人口密集地へのソリューション展開などを考えているとのことで、我々の日常生活にも密接に関わる研究内容でした。
DeepSoil: A Science-guided Framework for Generating High Precision Soil Moisture Maps by Reconciling Measurement Profiles Across In-situ and Remote Sensing Data
Paahuni Khandelwal: Department of Computer Science, Colorado State University
Sangmi Lee Pallickara: Department of Computer Science, Colorado State University
Shrideep Pallickara: Department of Computer Science, Colorado State University
複数設置されたセンサーと衛星写真を使って各地の土壌水分量を測定する研究が紹介されていました。
各所に設置したセンサーだけで各地の水分量把握を網羅しようとすると、コストがかかりすぎるので衛星写真などのリモートセンシング技術を組み合わせた予測モデルを開発した成果について発表されていました。
U-Netベースのアーキテクチャ、土壌科学の知見を活かした科学的知見を反映したマルチパート損失関数を採用したモデル構成により、正確で高精度な解像度30mの土壌水分分布図を生成することに成功。
土壌の水分量と、一見地味そうな話ではあるが、農業やインフラ管理、環境保全、気候変動予測などにも貢献できる分野とのこと。
また、同じセッションにて地球科学的課題も扱っている研究(氷塊の同定や海面位置特定の研究など)も紹介されており、地球規模の社会課題に対しても取り組めるこの分野の面白味を感じることができました。
今後活かせる知見
位置空間情報×LLMに関する研究が目立ったものの、地理空間情報を扱うための最新の技術トレンドからスケールの大きな地球規模の社会課題解決のためのアプローチなど幅広い内容について勉強することができました。
今回のカンファレンスでも触れられていましたが、位置空間情報はプライバシー保護の観点などから、オープンデータの整備や分析活用については以前から課題感があり、まだまだ課題が山積みな分野です。
弊社では位置情報データを用いた課題解決にも積極的ですので、今後新たな位置情報データの活用を提案続けていきたいと思っています。
終わりに
私自身この分野の学会参加が今回が初めてで、得るものが多く非常に楽しい経験をすることができました。来年もHuMobコンペは開催されるとのことでまた入賞して、来年の現地参加も目指したいと思ってます。
最後まで読んでいただきありがとうございました。こちらの記事を読んでARISEに興味が湧きましたら、ぜひお問い合わせ・お声がけください。