AI活用事例データベース
Metaは2024年4月にオープンソース大規模言語モデル「Llama 3」をリリース。8Bと70Bパラメータの2サイズで提供し、15兆トークンで学習。推論・コーディング能力でClaude SonnetやGPT-3.5を上回る性能を実現した。
Metaはオープンソース戦略によりAI業界全体のイノベーションを加速させることを目指していた。前世代のLlama 2は2兆トークンで学習されていたが、推論やコーディングの性能向上が求められていた。
15兆トークン以上のデータで事前学習を行い、8Bと70Bの2つのパラメータサイズでリリース。128Kトークンの語彙を持つトークナイザーを採用し、Grouped Query Attention(GQA)で推論効率を最適化。30言語以上の多言語データを含み、コードデータは前世代の4倍に増量した。
MMLUベンチマークで70Bモデルが79.5を達成(Llama 2の68.9から大幅向上)。8Bモデルも66.6(Llama 2 7Bの45.3から向上)。推論・コーディング能力でClaude Sonnet、Mistral Medium、GPT-3.5を上回る性能を示した。AWS、Google Cloud、Azure、NVIDIA NIMなど主要クラウドプラットフォームで利用可能。
オープンソース戦略によりエコシステム全体のイノベーションを加速できる。学習データの量と質の改善が性能向上の最大の要因であり、モデルアーキテクチャの効率化も重要。
気になった事例をリストに集めて、PDFや共有リンクでまとめて共有できます。メールアドレスだけで始められます(パスワード不要)。
登録をもって利用規約・プライバシーポリシーに同意したものとみなします。当社から業務上のご連絡・ご案内をお送りする場合があります(配信停止可)。
メールに届いた6桁のコードを入力してください(5分間有効)。