Director SliderAIとデータを取り巻く様々な課題の解決従来の分析で外部データを活用するのと異なり、AI、機械学習の場合は、 外部データが形を変え学習結果として永続する事でその持つ価値が大きく異なります。 当協議会はアノテーション含めAIを取り巻く様々な課題に取り組んでいきます。 知的財産・契約 AI(深層学習)・ML(機械学習)で用いる学習データの知的財産、契約について検討し、契約のモデルテンプレートの作成を行います。 AI研究 AI研究に資するデータの検討とそれらデータを用いた社会課題の解決方法について検討を行います。 ユースケース創出 データ所有者、アノテーター、そしてデータ利用者によるデータ流通・活用を促進に資する活動を行います。 データ基盤 目的とするデータを見つけるためのカタログサービス、様々な種類のデータに対応したデータストア媒介サービスの為のデータ基盤を提供します。 従来の使い捨てを前提としたデータ取引 売り上げ分析などの一般的なデータ分析による外部データ利用の多くは、ワンタイム利用であり、作業の完了とともにその役目を終えます。その為、現在のデータ取引契約は、データが二次的な価値を直接的には創出しないことを前提としています。(外部データは、分析の完了と共に役目を終え、分析結果に元データは原則出現しない。) データが形を変え永続するAI/ML AIの学習用データとして用いる外部データは、形を変え永続します。その為、従来のデータ売買における契約では、データの価値を担保することができません。一方で、データを使用する側も様々なリスクを抱えることになります。学習用データとして外部データを使用する場合は、知的財産(特許、著作権、意匠権、商標権に加えて、説明責任(製造物責任)を含むデータの来歴についても考慮しなくてはなりません。 対象とする問題により異なるアノテーション基準 対象とする問題により異なるアノテーションの仕様は様々です。オリジナルデータだけでなく、クレンジング済み、アノテーション済みのデータも流通の対象とする場合、その仕様、基準の明確化、標準化は重要です。AIデータ活用コンソーシアムは、データのスムーズな共有、流通を促進するため、データクレンジング、アノテーションの仕様、基準の書式等についても検討を行います。 重要性を増す来歴管理 半田ごてをフォークとアノテーション ナイフをペンとアノテーション 線路を横断歩道とアノテーション データの確からしさをどのように保障するのか、またAIがシステムに組み込まれ、生じた結果の責任の所在の重要性が増しています。悪意あるクレンジング、アノテーション、そして意図しないデータの偏りをどのように防ぐのか。AIを取り巻くセキュリティの一つとして重要性が増しています。 データの来歴【Data Provenance】【何が、誰が】何時、どのように生成したデータなのか【何が、誰が】何時、どのようにクレンジングしたデータなのか【何が、誰が】何時、どのようにアノテーションしたデータのか【何が、誰が】何時、どのよう評価したデータなのか 重要性を増すデータの来歴管理