超大規模データ時代のための先進的データベースコア技術の研究
超大規模データ時代に向けて、かつてない高速性、省エネルギー性等を可能とする新たなデータベースコア技術の創出に取り組んでいます。データベースシステム、ストレージシステム、オペレーティングシステム等のシステムソフトウェアを中心に据えつつ、先進的な応用ソフトウェアとの融合にも挑戦しています。近年は、新型ソフトウェア実行原理に基づく超高速データベースエンジンの開発に成功しました。当該データベースエンジンは、徐々に社会の様々な場に於ける実用化が進んでいます。![Database ja](/new/assets/database_ja-6fe8de4115ebbb068e3460b5674d2ec61fd25ea45b720082aa0f68dfb8961b28.png)
![Machine](/new/assets/machine-b95442c1571a2e94be679d67be0d8c727106c71db5b8cf9a918bfda238c1cc0f.png)
超大規模サイバー空間・実世界データのインタラクティブ解析システム
ウェブ・ソーシャルメディア等のサイバー空間と実世界は密接に連動しており、サイバー空間と実世界センサデータの融合解析による社会課題解決を目標とした研究を推進しています。1999年から継続的に日本語ウェブページを大規模収集し、数百億URL、数十億ブログ記事、Twitterの数百億つぶやき等を含む ウェブアーカイブを構築するとともに、ドライブレコーダデータ、交通トラフィックデータ、気象データ等の実世界データの収集・蓄積を行い、その構造、内容、時間変化等を解析するシステムを開発中です。膨大なサイバー空間・実世界データを、データマイニング、機械学習、リンク解析、自然言語処理、画像処理等を用いて解析し、様々な切り口で探索可能な可視化システムを大規模ディスプレイウォール上に実装しています。![Visualization1](/new/assets/visualization1-c88505c759b4be6f1c7a2f5d32794642d7c44060849da57c1697ebee069a4952.png)
![Visualization2](/new/assets/visualization2-dd2d36974604de2f19999747cf8f821f764954b58c1120196a99b580fd7e8cb0.png)
自然言語処理・計算言語学: 言葉を速く、正しく「計算」する技術で人のこころと社会の動きを読み解く
人は言語を用いて考え、社会での体験を記録し、他人に伝えることができます。本研究室では、人が紡ぐ膨大な言葉からその心と社会の動きを読み解き、さらに人が行う様々な言語活動を代替・支援することを目指して、言葉を速く、正しく「計算」する工学的研究(自然言語処理)に取り組んでいます。最速かつ最高精度の言語処理モデルを追求することが、ときに確率的に、ときに規則正しく振る舞う、自然現象としての言語の「かたち」に迫る理学的研究(計算言語学)、究極的には人間の知能の働きの解明に繋がると考えています。
![Nlp1](/new/assets/nlp1-c220ea375241892a894caf2516e042f36d96f0e3ed79d9a7b65fede7794247e0.png)
![Nlp2](/new/assets/nlp2-8b589325e11a1f531cf6074e82ff284ac135e749e2905773a903c4e88aac16c3.png)
ペタバイト級地球環境情報融合システム
多種多様かつ膨大な地球観測データを統合・解析することにより、科学的・社会的に有用な情報に変換するアプリケーションのためのプラットフォームの構築を進めています。 大規模データアーカイブ、メタデータ管理、高性能データ解析処理、ビジュアライゼーション等に関する技術の研究開発に加え、長期的安定的なシステム運用、国際的な地球環境ポータルの構築にも取り組んでいます。 堅牢なデータベースと巨大な解析空間を有し、多分野からの莫大な量の地球環境データが蓄積されているだけでなく、さまざまなデータ処理・解析ツールも用意された統合的データ基盤を目指しています。![Server](/new/assets/server-fc2e52ef34f3ec3a5bcf6d721b8bf1de93e43f21ffbf346c04cf6d501fede4aa.png)