English

Location Based Search

レストランやホテルなど、実世界では「場所」が非常に重要なケースが存在する。これらの情報は、従来、雑誌や書籍といった紙媒体メディアや、地域ポータルサイトなどで検索していた。しかし紙媒体メディアやポータルサイトは網羅性や客観性が必ずしも高いとは言えず、ウェブ上に多数存在する第三者が発信する情報の獲得が重要な課題として注目されている。

より具体的には、住所や電話番号を含むWebページを収集し、対応する「場所」に関連づけることができれば、実生活で活用することができる。このような「位置情報検索」を実現するには、Webぺージの高度な処理技術が必要となる。

本研究では、住所などの場所表記を自然言語処理により抽出するジオパース技術(geoparse)、抽出した場所表記を経緯度に変換するジオコード技術(geocode)、Webページの構造理解など、さまざまな情報と手法を組み合わせることにより、精度の高い位置情報検索を実現した。

右図は、東京都内のレストラン情報をWebから抽出したデータベースの検索結果例である。

(相良 毅)


www-admin@tkl.iis.u-tokyo.ac.jp