AI AI

Workers AI Workers AI

Workers AI chạy inference (LLM/embeddings/vision) trên Cloudflare và tích hợp qua binding. Model inference (LLM, embedding, vision) qua binding Workers — trả tiền theo usage, chạy gần user. Workers AI runs inference (LLMs/embeddings/vision) on Cloudflare and integrates via bindings. Model inference (LLM, embeddings, vision) via Workers bindings — pay per use, runs near users.

Workers AI
Sơ đồ tham chiếu từ Cloudflare Developer Docs — bấm vào sơ đồ bên dưới để xem bản đầy đủ. Reference figure from Cloudflare Developer Docs — see diagrams below for the full official version.

Là gì? What is it?

Workers AI chạy inference (LLM/embeddings/vision) trên Cloudflare và tích hợp qua binding. Model inference (LLM, embedding, vision) qua binding Workers — trả tiền theo usage, chạy gần user. Workers AI runs inference (LLMs/embeddings/vision) on Cloudflare and integrates via bindings. Model inference (LLM, embeddings, vision) via Workers bindings — pay per use, runs near users.

Tại sao quan trọng? Why it matters

Thêm AI vào app mà không tự host GPU — inference và RAG chạy trên mạng Cloudflare. Add AI to apps without hosting GPUs — inference and RAG run on Cloudflare’s network.

Khi nào nên dùng? When to use it

  • Khi bạn cần giải pháp Workers AI trên Cloudflare thay vì tự host When you need Workers AI on Cloudflare instead of self-hosting
  • Khi team mới bắt đầu và muốn bản free/low-ops để thử When your team is starting out and wants a low-ops free tier to experiment
  • Khi tài liệu chính thức gợi ý sản phẩm này cho use case của bạn When official docs recommend this product for your use case

Ví dụ đơn giản Simple example

Ví dụ: một team SME bật Workers AI cho website onboarding — họ thấy lợi ích ngay mà chưa cần kiến trúc phức tạp. Example: an SME team enables Workers AI for an onboarding site — they see value quickly without a complex architecture.

Đừng nhầm Workers AI với toàn bộ nền tảng Cloudflare — đây là một mảnh ghép; kết hợp với DNS/proxy và sản phẩm liên quan. Don’t confuse Workers AI with the entire Cloudflare platform — it’s one piece; combine it with DNS/proxy and related products.

Hình ảnh trực quan (Cloudflare Docs) Visual guides (Cloudflare Docs)

Figure 1: Composable AI architecture

Composable AI architecture Composable AI architecture

The architecture diagram illustrates how AI applications can be built end-to-end on Cloudflare, or single services can be integrated with external infrastructure and services. The architecture diagram illustrates how AI applications can be built end-to-end on Cloudflare, or single services can be integrated with external infrastructure and services.

Thuật ngữ: Concepts: Workers AI · AI Gateway · External LLM · Composable stack

Sơ đồ chính thức ↗ Official diagram ↗ · AI Artificial Intelligence (AI)

Figure 1: Knowledge seeding

Retrieval Augmented Generation (RAG) Retrieval Augmented Generation (RAG)

RAG kết hợp retrieval (Vectorize/KV) với Workers AI để chatbot trả lời chính xác hơn — seeding knowledge và query path tách biệt. RAG combines retrieval with generative models for better text. It uses external knowledge to create factual, relevant responses, improving coherence and accuracy in NLP tasks like chatbots.

Thuật ngữ: Concepts: RAG · Vectorize · Workers AI · Knowledge seeding · Embeddings

Sơ đồ chính thức ↗ Official diagram ↗ · AI Artificial Intelligence (AI)

Sản phẩm liên quan Related products

Tiếp theo Next step

Quay lại bản đồ sản phẩm hoặc chọn lộ trình học phù hợp. Return to the product map or pick a learning track.