Research on Novel Database Core Technologies for the Era of Big Data

Our research group has been exploring and developing novel database core technologies for enabling Big Data management and analytics at a scale, a depth and efficiency that were ever thought to be impossible. The endeavor focuses on systems software such as database systems, storage systems and operating systems, but is not limited to them; the group also ventures to the fusion of infrastructure systems and cutting-edge social and business applications. One of the recent work is a super-fast database engine that the group successfully developed based on a novel execution principle. This brand-new engine is being deployed into more production systems in the market.
Database en Machine

Very Large scale web solutions

ウェブ・ソーシャルメディア等のサイバー空間と実世界は密接に連動しており、サイバー空間と実世界センサデータの融合解析による社会課題解決を目標とした研究を推進しています。1999年から継続的に日本語ウェブページを大規模収集し、数百億URL、数十億ブログ記事、Twitterの数百億つぶやき等を含む ウェブアーカイブを構築するとともに、ドライブレコーダデータ、交通トラフィックデータ、気象データ等の実世界データの収集・蓄積を行い、その構造、内容、時間変化等を解析するシステムを開発中です。膨大なサイバー空間・実世界データを、データマイニング、機械学習、リンク解析、自然言語処理、画像処理等を用いて解析し、様々な切り口で探索可能な可視化システムを大規模ディスプレイウォール上に実装しています。
Visualization1 Visualization2

Natural Language Processing and Computational Linguistics towards understanding human and society using fast and accurate language technologies

Humans think with language, and verbalize their experiences in the real world to convey them to others. Aiming to observe humans and the real world from text and aiding our language activities, our laboratory studies on natural language processing (NLP) that computerizes text efficiently and accurately. The pursuit of efficient but accurate NLP models leads to computational linguistics (CL) that reveals the mechanism of languages as natural phenomena that behave both regularly and probabilistically and ultimately human intelligence.

Nlp1 Nlp2

Petabyte-class global environment digital library

多種多様かつ膨大な地球観測データを統合・解析することにより、科学的・社会的に有用な情報に変換するアプリケーションのためのプラットフォームの構築を進めています。 大規模データアーカイブ、メタデータ管理、高性能データ解析処理、ビジュアライゼーション等に関する技術の研究開発に加え、長期的安定的なシステム運用、国際的な地球環境ポータルの構築にも取り組んでいます。 堅牢なデータベースと巨大な解析空間を有し、多分野からの莫大な量の地球環境データが蓄積されているだけでなく、さまざまなデータ処理・解析ツールも用意された統合的データ基盤を目指しています。 [詳細]