AI AI
AI Gateway AI Gateway
AI Gateway giúp quản trị calls tới AI providers (routing, caching, observability, cost). Lớp quản trị request tới nhiều provider (OpenAI, Anthropic, …): cache, log, rate limit, chi phí. AI Gateway governs AI calls (routing, caching, observability, cost). Govern requests to multiple providers (OpenAI, Anthropic, …): cache, logs, rate limits, cost.
Là gì? What is it?
AI Gateway giúp quản trị calls tới AI providers (routing, caching, observability, cost). Lớp quản trị request tới nhiều provider (OpenAI, Anthropic, …): cache, log, rate limit, chi phí. AI Gateway governs AI calls (routing, caching, observability, cost). Govern requests to multiple providers (OpenAI, Anthropic, …): cache, logs, rate limits, cost.
Tại sao quan trọng? Why it matters
Thêm AI vào app mà không tự host GPU — inference và RAG chạy trên mạng Cloudflare. Add AI to apps without hosting GPUs — inference and RAG run on Cloudflare’s network.
Khi nào nên dùng? When to use it
- Khi bạn cần giải pháp AI Gateway trên Cloudflare thay vì tự host When you need AI Gateway on Cloudflare instead of self-hosting
- Khi team mới bắt đầu và muốn bản free/low-ops để thử When your team is starting out and wants a low-ops free tier to experiment
- Khi tài liệu chính thức gợi ý sản phẩm này cho use case của bạn When official docs recommend this product for your use case
Ví dụ đơn giản Simple example
Ví dụ: một team SME bật AI Gateway cho website onboarding — họ thấy lợi ích ngay mà chưa cần kiến trúc phức tạp. Example: an SME team enables AI Gateway for an onboarding site — they see value quickly without a complex architecture.
Đừng nhầm AI Gateway với toàn bộ nền tảng Cloudflare — đây là một mảnh ghép; kết hợp với DNS/proxy và sản phẩm liên quan. Don’t confuse AI Gateway with the entire Cloudflare platform — it’s one piece; combine it with DNS/proxy and related products.
Hình ảnh trực quan (Cloudflare Docs) Visual guides (Cloudflare Docs)
Composable AI architecture Composable AI architecture
The architecture diagram illustrates how AI applications can be built end-to-end on Cloudflare, or single services can be integrated with external infrastructure and services. The architecture diagram illustrates how AI applications can be built end-to-end on Cloudflare, or single services can be integrated with external infrastructure and services.
Thuật ngữ: Concepts: Workers AI · AI Gateway · External LLM · Composable stack
Sơ đồ chính thức ↗ Official diagram ↗ · AI Artificial Intelligence (AI)
Sản phẩm liên quan Related products
- Workers AI Workers AI
Workers AI chạy inference (LLM/embeddings/vision) trên Cloudflare và tích hợp qua binding. Model inference (LLM, embedding, vision) qua binding Workers — trả tiền theo usage, chạy gần user. Workers AI runs inference (LLMs/embeddings/vision) on Cloudflare and integrates via bindings. Model inference (LLM, embeddings, vision) via Workers bindings — pay per use, runs near users.
- Vectorize Vectorize
Vectorize là vector database để làm semantic search/RAG trên nội dung học. Vector database cho RAG / semantic search — lưu embedding, query từ Workers AI hoặc model ngoài. Vectorize is a vector database for semantic search/RAG over your learning content. Vector database for RAG / semantic search — store embeddings, query from Workers AI or external models.
Tiếp theo Next step
Quay lại bản đồ sản phẩm hoặc chọn lộ trình học phù hợp. Return to the product map or pick a learning track.