AI活用事例データベース AI活用事例データベース
About ログイン curated by Arcana Technology
2024年

メタ(Meta)

Metaは2024年4月にオープンソース大規模言語モデル「Llama 3」をリリース。8Bと70Bパラメータの2サイズで提供し、15兆トークンで学習。推論・コーディング能力でClaude SonnetやGPT-3.5を上回る性能を実現した。

企業規模大企業(1,000名〜)
地域海外
導入段階全社展開
使用ツールMeta Llama 3, PyTorch

背景・課題

Metaはオープンソース戦略によりAI業界全体のイノベーションを加速させることを目指していた。前世代のLlama 2は2兆トークンで学習されていたが、推論やコーディングの性能向上が求められていた。

取り組み内容

15兆トークン以上のデータで事前学習を行い、8Bと70Bの2つのパラメータサイズでリリース。128Kトークンの語彙を持つトークナイザーを採用し、Grouped Query Attention(GQA)で推論効率を最適化。30言語以上の多言語データを含み、コードデータは前世代の4倍に増量した。

成果・効果

15兆トークンで学習(Llama 2の7倍)、MMLUスコア79.5(Llama 2から10.6pt向上)、ダウンロード数6億回超

MMLUベンチマークで70Bモデルが79.5を達成(Llama 2の68.9から大幅向上)。8Bモデルも66.6(Llama 2 7Bの45.3から向上)。推論・コーディング能力でClaude Sonnet、Mistral Medium、GPT-3.5を上回る性能を示した。AWS、Google Cloud、Azure、NVIDIA NIMなど主要クラウドプラットフォームで利用可能。

教訓・ポイント

オープンソース戦略によりエコシステム全体のイノベーションを加速できる。学習データの量と質の改善が性能向上の最大の要因であり、モデルアーキテクチャの効率化も重要。

元記事を読む