2023年10月3日 東京
国連大学のチリツィ・マルワラ学長、エレノア・フルニエ=トムズ博士(UNU-CPR)およびサージ・スタンクウィッチ博士(UNU Macau)が、技術ブリーフ「AIモデルのトレーニングにおける合成データの利用:持続可能な開発に向けたチャンスとリスク」を発表しました。
合成データ、すなわち人工的に生成されたデータを用いたAIアルゴリズムのトレーニングは、大きな潜在的可能性を秘めた急成長の手法です。この手法は、データの不足、プライバシー、バイアスといった問題の解決につながる可能性がある一方で、データの品質、セキュリティ、倫理的意味といった面で懸念を生じさせる可能性もあります。こうした問題はグローバル・ノースに比べてデータ不足がはるかに深刻なグローバル・サウスにおいて、特に顕著となっています。合成データは、欠測データの問題を解決し、うまくいけばデータセットにおける母集団の代表性を高め、より公平な結果をもたらします。しかしそうであるからといって、合成データを現実世界の実際のデータより優れている、または同等であるとみなすことはできません。実際、合成データの利用は、サイバーセキュリティリスク、バイアス伝播、およびモデル誤差の単純な増加など、多くのリスクをともないます。今回発表した技術ブリーフでは、AIトレーニングにおける合成データの責任ある利用のための提言と、合成データの利用を規制するための関連指針を示しています。
技術ブリーフは下記リンクからダウンロードいただけます。