AI活用事例データベース AI活用事例データベース
About ログイン curated by Arcana Technology
2025年

NHK

NHK放送技術研究所が約40年分のニュース原稿・番組字幕など約2,000万文を追加学習させた独自LLMを開発。報道された事実に関する誤回答率を約1割削減し、番組制作の情報収集支援への実用化を目指す。

企業規模大企業(1,000名〜)
地域日本
導入段階実証実験(PoC)
使用ツールNHK独自LLM(放送局データ追加学習)

背景・課題

番組制作の準備段階では、過去のニュースや番組内容に関する情報収集が不可欠だが、膨大な蓄積の中から必要な情報を効率的に検索・活用することが困難だった。汎用LLMでは報道特有の正確性要件を満たせないことも課題であった。

取り組み内容

過去約40年分のNHKニュース原稿・ニュース記事・番組字幕などの放送局データ(約2,000万文)をベースのLLMに追加学習。さらに、ニュース速報の高速手話翻訳向けにLlama 3ベースの7億パラメータモデルも別途構築している。

成果・効果

報道された事実に関する誤回答率を約1割削減

評価実験で、報道された事実に関する誤った回答をする割合が学習前と比較して約1割減少。2026年までに番組制作での実用化を目指す計画。マルチモーダル化(映像・音声の情報も扱う)にも着手中。

教訓・ポイント

放送局が保有する40年分の放送データという高品質アセットは、専門特化LLMの学習資源として極めて価値が高い。報道の正確性という特殊要件に対応するには、汎用LLMのファインチューニングが有効。

元記事を読む