データレイク研究開発センターの概要

データレイク研究開発センターの概要

近年の人工知能(AI)技術は数年で大きく進展し、ChatGPT等の生成系AIのサービスが提供され、現代社会の在り方に多大な影響を与えています。大量・多様なデータを学習するAIモデルでは、利用する立場からの分かりやすさ、透明性、安心・安全の担保が求められます。当センターでは、進化するAIモデルとデータを一つの情報基盤として管理し、モデルおよびデータの来歴を明示し、最新のコンテンツ参照が容易なフレームワークを構築します

データレイク情報基盤フレームワークとは

データレイクでは、構造化データ、非構造化データを問わず、多種多様なデータを一元的に参照、利用が可能とし、コンテンツの収集、管理を容易にします。当センターでは、さらに、データから学習されたAIモデルも、コンテンツと同様に管理し、参照可能とします。コンテンツとモデルの一元的管理環境を提供することで、データの利活用とAI技術の研究、開発を共に促進するフレームワークを構築し、我が国に将来の情報基盤として、以下のような機能を実現します。

  • コンテンツの継続的蓄積とコンテンツの来歴管理、ベクトル索引技術の確立
  • モデルの持続的管理とモデルの学習コンテンツ情報、学習過程も含めた来歴情報の管理等モデル運用時に関する先端的技術の提供
  • 大学共同利用機関として、セキュリティ技術に支えられた堅牢なシステムを構築し、産学官における様々な最先端研究分野へ安心・安全な利用環境の提供
  • データ利活用における社会的な課題への対応として、個人情報保護法、著作権法等の法律課題、生命に関連した社会倫理課題を洗い出し、安全、安心な人工知能技術およびコンテンツの利用環境の提供

データレイク研究開発センターの運用