AI活用事例データベース AI活用事例データベース
About ログイン curated by Arcana Technology
2024年

情報通信研究機構(NICT)

KDDIと大規模言語モデル(LLM)に関する共同研究を開始。NICTの600億件超のWebページデータとKDDIのハルシネーション抑制技術を組み合わせ、高性能な日本語LLMの開発を推進。

企業規模大企業(1,000名〜)
地域日本
導入段階実証実験(PoC)
使用ツールNICT LLM、WISDOM-LLMプラットフォーム

背景・課題

海外製LLMの学習データに含まれる日本語データはわずかであり、日本語に強い高性能LLMの開発が国家的課題であった。ハルシネーション(事実に基づかないテキスト生成)の抑制も重要課題。

取り組み内容

2024年7月よりKDDIと共同研究を開始。NICTが蓄積した600億件超のWebページデータで事前学習を担当し、KDDIがハルシネーション抑制技術とマルチモーダルAI技術の高度化を担当。

成果・効果

600億件超のWebページ学習データ活用

WISDOM-LLMプラットフォームにより、LLMが生成したテキストの裏取りや根拠ある反論の生成が可能に。対話システムの信頼性向上と地理空間情報等を扱うマルチモーダル対応を推進。

教訓・ポイント

日本語LLM開発では、高品質な日本語データの蓄積が最大の差別化要因。ハルシネーション抑制は実用化における最重要課題であり、専門機関間の連携が解決の鍵。

元記事を読む