KHÔNG CẦN BIẾT SQL vẫn HIỂU ĐƯỢC DỮ LIỆU – ĐÓ LÀ Vanna AI
Bạn có bao giờ nghĩ mình có thể hỏi cơ sở dữ liệu (database) những câu hỏi đơn giản bằng tiếng Việt, thay vì phải viết những dòng mã SQL (Structured Query Language) phức tạp? Vanna.ai chính là giải pháp giúp biến ước mơ đó thành hiện thực!
Vanna AI là gì?
Đây là một công cụ đặc biệt giúp bạn “trò chuyện” với dữ liệu của mình bằng ngôn ngữ thông thường, giống như bạn đang nói chuyện với một người bạn vậy.
Điều thú vị và đặc biệt về Vanna.ai là khả năng làm cho dữ liệu trở nên dễ tiếp cận với tất cả mọi người, ngay cả những ai không có kiến thức về lập trình hay cơ sở dữ liệu. Vanna.ai hoạt động như một phiên dịch viên thông minh, giúp bạn khai thác thông tin mà không cần phải học một ngôn ngữ kỹ thuật mới.
Bản chất của Vanna.ai

Vanna.ai là một thư viện Python (Python library) được thiết kế để chuyển đổi các câu hỏi được đặt bằng ngôn ngữ tự nhiên (natural language) thành các câu lệnh SQL chính xác. Mục đích chính của Vanna.ai là giúp những người dùng không chuyên về kỹ thuật (non-technical users) có thể dễ dàng truy vấn dữ liệu (query data) từ cơ sở dữ liệu mà không cần phải biết cách viết mã SQL.
Nguyên tắc hoạt động của Vanna.ai

Cách Vanna.ai hoạt động có thể được hình dung qua các bước sau:
Đầu tiên, Vanna.ai cần được huấn luyện (training). Quá trình này bao gồm việc cung cấp cho Vanna.ai cấu trúc của cơ sở dữ liệu (database schema) của bạn, tức là các định nghĩa về bảng (table definitions) và cột (columns) trong cơ sở dữ liệu, thường được gọi là DDL (Data Definition Language).

Ngoài ra, bạn cũng có thể cung cấp các ví dụ về câu lệnh SQL (example SQL queries) đã có sẵn và các tài liệu (documentation) liên quan đến dữ liệu hoặc các quy tắc kinh doanh (business logic) cụ thể của bạn.
Việc huấn luyện này rất quan trọng vì nó giúp Vanna.ai hiểu rõ hơn về ngữ cảnh và cấu trúc dữ liệu riêng của bạn, từ đó tạo ra các câu lệnh SQL chính xác hơn.
Sau khi Vanna.ai đã được huấn luyện, bạn có thể bắt đầu đặt câu hỏi. Bạn chỉ cần gõ câu hỏi của mình bằng ngôn ngữ thông thường, ví dụ như “Doanh thu của 10 khách hàng lớn nhất là bao nhiêu?“.
Tiếp theo, Vanna.ai sẽ sử dụng thông tin đã được huấn luyện cùng với một mô hình ngôn ngữ lớn (LLM – Large Language Model) để tạo ra câu lệnh SQL phù hợp với câu hỏi của bạn. Vanna.ai sử dụng một kỹ thuật gọi là RAG (Retrieval Augmented Generation) để đảm bảo rằng câu lệnh SQL được tạo ra không chỉ chính xác mà còn có ngữ cảnh phù hợp với dữ liệu của bạn.
Cuối cùng, câu lệnh SQL được tạo ra có thể được thực thi trực tiếp trên cơ sở dữ liệu của bạn. Vanna.ai sau đó sẽ hiển thị kết quả cho bạn, và thậm chí có thể tạo ra các biểu đồ (charts) hoặc hình ảnh trực quan (visualizations) từ dữ liệu để giúp bạn dễ dàng hiểu thông tin hơn.
Xem thêm:
Tính năng nổi bật của Vanna.ai
Vanna.ai tương thích với nhiều mô hình ngôn ngữ lớn (LLM-agnostic), có nghĩa là Vanna.ai có thể hoạt động với các LLM khác nhau như OpenAI, Mistral, Anthropic, Google Gemini, Ollama, Azure OpenAI và các mô hình tương thích OpenAI (OpenAI Compatible).
Vanna.ai cũng hỗ trợ mọi cơ sở dữ liệu SQL (supports any SQL database), vì vậy dù bạn đang sử dụng loại cơ sở dữ liệu SQL nào, Vanna.ai đều có thể kết nối và làm việc.
Vanna.ai còn cung cấp một giao diện người dùng (User Interface – UI) đơn giản, giúp bạn dễ dàng đặt câu hỏi và xem kết quả. Giao diện này có thể được tích hợp vào các môi trường phổ biến như Jupyter Notebooks, Streamlit hoặc Flask.
Một điểm đáng chú ý khác là khả năng tự học và sửa lỗi (self-correcting) của Vanna.ai. Nếu Vanna.ai tạo ra một câu lệnh SQL không chính xác, bạn có thể cung cấp phản hồi (feedback) để Vanna.ai học hỏi từ lỗi đó và cải thiện độ chính xác cho những lần sau.
Về bảo mật và quyền riêng tư (security and privacy), Vanna.ai được thiết kế để dữ liệu thực tế của bạn không rời khỏi môi trường của bạn. Vanna.ai chỉ gửi các siêu dữ liệu (metadata) như cấu trúc bảng và các ví dụ câu lệnh đến LLM, không phải dữ liệu nhạy cảm của bạn.
Để bắt đầu sử dụng Vanna.ai, bạn cần thực hiện một vài bước cài đặt và sử dụng cơ bản. Đầu tiên, bạn có thể cài đặt Vanna.ai bằng lệnh pip install vanna. Sau đó, bạn sẽ cần chọn một mô hình ngôn ngữ lớn (LLM) mà bạn muốn Vanna.ai sử dụng và cung cấp khóa API (API key) nếu mô hình đó yêu cầu. Bước tiếp theo là huấn luyện Vanna.ai bằng cách cung cấp cấu trúc cơ sở dữ liệu (DDL), các câu lệnh SQL mẫu và tài liệu liên quan. Cuối cùng, bạn có thể bắt đầu đặt câu hỏi bằng ngôn ngữ tự nhiên và để Vanna.ai tạo ra các câu lệnh SQL và hiển thị kết quả cho bạn.
Vanna.ai – Chat with your SQL database
Vanna.ai mở ra một cách tiếp cận dữ liệu hoàn toàn mới, giúp việc tương tác với cơ sở dữ liệu trở nên đơn giản và trực quan hơn bao giờ hết. Với Vanna.ai, bạn không cần phải là một chuyên gia kỹ thuật để khai thác sức mạnh của dữ liệu. Hãy thử khám phá và xem Vanna.ai có thể giúp bạn tương tác với dữ liệu dễ dàng như thế nào nhé!
Dánh sách các kết nối mà Vanna.ai đang hỗ trợ (nguồn Github)
Supported LLMs
OpenAI
Anthropic
Gemini
HuggingFace
AWS Bedrock
Ollama
Qianwen
Qianfan
Zhipu
Supported VectorStores
AzureSearch
Opensearch
PgVector
PineCone
ChromaDB
FAISS
Marqo
Milvus
Qdrant
Weaviate
Oracle
Supported Databases
PostgreSQL
MySQL
PrestoDB
Apache Hive
ClickHouse
Snowflake
Oracle
Microsoft SQL Server
BigQuery
SQLite
DuckDB
Xem thêm tại: https://github.com/vanna-ai/vanna