Blog entry by Mo. CoPAI

Anyone in the world

🧠 Giới thiệu

Trong thời đại AI Agent đang phát triển mạnh mẽ, việc xây dựng một agent không chỉ có khả năng “hiểu và suy nghĩ” mà còn có thể “hành động” là điều cần thiết. Bài viết này tổng hợp và diễn giải chi tiết nội dung từ bài gốc của Nguyễn Hải TrườngXem tại đây.

🏗️ Kiến trúc tổng thể

Theo tác giả, hệ thống AI Agent bao gồm 4 thành phần chính:

  • 1. User – Người dùng tương tác thông qua giao diện web.
  • 2. Agent – Xây dựng bằng Google Agent Development Kit (ADK), chịu trách nhiệm điều phối giữa model và các công cụ.
  • 3. Model – Bộ não sử dụng Gemini 3 hoặc 2.5 Flash để suy luận và quyết định hành động.
  • 4. Tools – Các công cụ bên ngoài, được triển khai dưới dạng MCP Server (Model Context Protocol) trên Google Cloud Run.

⚙️ Xây dựng MCP Server

MCP hoạt động như một “cầu nối” giúp model gọi các API thực tế. Với thư viện fastmcp, bạn có thể định nghĩa các tool như:

def get_current_weather(city: str):
    """Lấy thông tin thời tiết hiện tại của thành phố"""
    return requests.get(f"https://api.weatherapi.com/v1/current.json?q={city}")

Các tool này được đóng gói thành một MCP Server chạy trên Google Cloud Run với Docker, cho phép mở rộng linh hoạt và tiết kiệm chi phí. Khóa API được bảo mật thông qua Google Secret Manager.

🤖 Xây dựng AI Agent bằng Google ADK

Tiếp theo, bạn triển khai agent bằng Google ADK và kết nối đến MCP server thông qua cấu hình:

uv run adk web --model gemini-3-pro --mcp https://your-mcp-server-url

Lệnh này giúp mở giao diện web chạy tại http://localhost:8000, cho phép người dùng giao tiếp với agent.

🚀 Quy trình hoạt động của Agent

Khi người dùng nhập câu hỏi, ví dụ “What’s the weather in Hanoi right now?”, quy trình diễn ra như sau:

  1. Gemini phân tích câu hỏi và xác định cần gọi hàm get_current_weather.
  2. Agent gửi yêu cầu JSON-RPC đến MCP Server.
  3. Server gọi API thời tiết và trả lại dữ liệu JSON.
  4. Gemini xử lý kết quả và tạo phản hồi tự nhiên cho người dùng.

🧩 Lợi ích và Ứng dụng

  • Remote MCP cho phép chia sẻ các công cụ giữa nhiều agent khác nhau.
  • Google ADK cung cấp giao diện web sẵn, giảm thời gian phát triển.
  • Cloud Run cho phép triển khai serverless, tiết kiệm tài nguyên.
  • Gemini đóng vai trò bộ não, ra quyết định thông minh theo ngữ cảnh.

💡 Kết luận

Việc kết hợp ADK + Gemini + MCP mở ra hướng đi mới cho việc xây dựng các AI Agent có khả năng tương tác sâu với thế giới thực. Cấu trúc này đặc biệt phù hợp với các doanh nghiệp muốn mở rộng khả năng tự động hóa bằng AI.

Model là người nghĩ – Agent là người làm – MCP là cầu nối giữa hai bên! 🚀

[ Modified: Monday, 29 December 2025, 3:49 PM ]