AI活用事例データベース AI活用事例データベース
About ログイン curated by Arcana Technology
2024年

クラウドフレア(Cloudflare)

エッジクラウド大手がWorkers AIプラットフォームを拡張し、GPUを活用したサーバーレスAI推論をグローバルに提供。複数AIモデルの同時実行基盤「Omni」を独自開発。

企業規模大企業(1,000名〜)
地域海外
導入段階全社展開
使用ツールWorkers AI、Omniプラットフォーム、FLUX.2、Leonardo.Ai、Deepgram連携

背景・課題

AI推論の需要が急増する中、開発者がインフラ管理なしにAIモデルを低遅延で実行できるサーバーレスプラットフォームの需要が高まっていた。

取り組み内容

Workers AIを大幅アップグレードし、高性能GPU、動的モデルカタログ、簡素化された価格体系を導入。内部プラットフォーム「Omni」で軽量アイソレーションとメモリオーバーコミットにより単一GPUで複数AIモデルを同時実行。Leonardo.Ai(画像生成)やDeepgram(音声認識・合成)のパートナーモデルを追加。

成果・効果

より高性能なGPUで高速推論、動的モデルカタログで任意モデル実行可能、価格モデル簡素化

ユーザーに近い場所でのAI推論が可能に。FLUX.2(Black Forest Labs)をWorkers AIに搭載。画像生成・テキスト生成・音声処理を統合したマルチモーダルAI推論環境を提供。

教訓・ポイント

エッジでのAI推論はインフラの効率化(メモリ共有、軽量分離)が鍵。パートナーモデルの統合によりエコシステムの魅力を高めることが重要。

元記事を読む