AI活用事例データベース AI活用事例データベース
About ログイン curated by Arcana Technology
2024年

日本経済新聞社

日本経済新聞社が経済情報に特化した独自の大規模言語モデル「NIKKEI Language Model(NiLM)」を開発。約40年分のグループ記事のみで学習させた130億・700億パラメータの2モデルを構築。

企業規模大企業(1,000名〜)
地域日本
導入段階部門導入
使用ツールNIKKEI Language Model(NiLM):130億・700億パラメータ

背景・課題

汎用LLMでは経済情報の正確性や専門性に課題があり、日本の経済に特化した高品質な言語モデルが求められていた。また、著作権の観点からも自社データのみで学習するモデルの需要があった。

取り組み内容

日経新聞・日経産業新聞・日経MJ・日経ヴェリタス・NIKKEI Prime・日経BPなどグループが著作権や使用権を持つ記事のみを使用し、約40年分のデータ(約1兆トークン)で学習。130億パラメータモデルは完全独自アーキテクチャ、700億パラメータモデルはMeta社のLlama 2/3をベースに開発した。

成果・効果

約40年分・約1兆トークンの記事データで学習

インターネット上の公開情報を一切使用せず、日本の経済情報に専門特化した言語モデルの構築に成功。自社の事業活用やAIツール開発に向けた研究開発を進めている。

教訓・ポイント

新聞社が保有する40年分の高品質な記事データは、専門特化LLMの学習資源として極めて高い価値を持つ。著作権問題をクリアした自社データモデルの先行事例として注目される。

元記事を読む