Lập Trình iOS

Lập Trình iOS Chia sẻ kiến thức lập trình trên hệ điều hành iOS. Cộng đồng yêu thích lập trình iOS

Biến tài liệu thành dữ liệu sẵn sàng cho LLM!Giới thiệu Agentic Doc – một thư viện Python dành cho việc trích xuất tài l...
25/07/2025

Biến tài liệu thành dữ liệu sẵn sàng cho LLM!

Giới thiệu Agentic Doc – một thư viện Python dành cho việc trích xuất tài liệu dạng agentic.

Nó cho phép lấy dữ liệu có cấu trúc từ các tài liệu phức tạp về mặt hình ảnh như bảng, biểu đồ, hình ảnh… và trả về định dạng JSON phân cấp kèm vị trí chính xác của từng thành phần.

Khác với các phương pháp OCR truyền thống hay chuyển PDF sang văn bản chỉ tập trung vào text, cách tiếp cận agentic sẽ phân tích tài liệu theo từng thành phần, hiểu cấu trúc và mối quan hệ giữa chúng.

Tính năng nổi bật:

🗂️ Hỗ trợ PDF, hình ảnh, và cả URL

📚 Xử lý tài liệu dài trên 1000 trang với tính năng tự chia nhỏ

🧩 Trả về dữ liệu dưới dạng JSON có cấu trúc + Markdown

👁️ Có định vị trực quan: hộp đánh dấu + bản xem trước toàn trang

🏃 Hỗ trợ xử lý theo lô (batching) và xử lý song song ngay từ đầu

github: landing-ai/agentic-doc

Con hàng MCP ưng ý nhất mình dùng gần đây:Serena - Unlock 100% sức mạnh cho AI Coding Agents!---Bạn có bao giờ nghĩ rằng...
25/07/2025

Con hàng MCP ưng ý nhất mình dùng gần đây:
Serena - Unlock 100% sức mạnh cho AI Coding Agents!

---

Bạn có bao giờ nghĩ rằng AI code agent xịn sò như Claude Code, Cursor mà bạn đang dùng mỗi ngày thực ra chỉ đang hoạt động ở mức 30% công suất không?

Sự thật đấy. Mỗi khi bạn yêu cầu AI sửa một đoạn code hay thêm một tính năng, nó phải "lội" qua hàng ngàn dòng code không liên quan, xử lý những file chẳng ăn nhập gì tới yêu cầu của bạn. Việc này không chỉ làm AI chậm đi, tốn token vô ích mà còn làm giảm độ chính xác của nó vì "nhiễu" thông tin (context window bị lộn xộn).

Và Serena ra đời để giải quyết chính xác nỗi đau này!

---

Serena là cái chi?

Serena là một MCP Server (ai chưa biết MCP là gì thì xem lại bài cũ của tui nghen), nó ứng dụng công nghệ tìm kiếm ngữ nghĩa (semantic search) và RAG (Retrieval-Augmented Generation) cho chính codebase của bạn.

Thay vì để AI "đoán mò" và đọc toàn bộ dự án, Serena sẽ:

1. Lập chỉ mục (Index) toàn bộ codebase của bạn.
2. Khi bạn đưa ra yêu cầu, nó sẽ dùng tìm kiếm ngữ nghĩa để xác định chính xác những đoạn code, những file nào có liên quan nhất.
3. Cuối cùng, nó chỉ "mớm" những thông tin siêu liên quan này vào context của AI.

Kết quả là AI có một ngữ cảnh "sạch", tập trung, từ đó đưa ra phản hồi nhanh và chính xác hơn rất nhiều (lại còn tiết kiệm rất nhiều tokens 🤑)

---

Tại sao Serena là một "Game Changer"?

* Hiệu suất và độ chính xác vượt trội: Khi ngữ cảnh gọn gàng, AI có thể làm việc hiệu quả hơn và cho ra kết quả tốt hơn. Cửa sổ ngữ cảnh sạch hơn đồng nghĩa với phản hồi nhanh và chính xác hơn.

* Tiết kiệm chi phí và tokens: Bằng cách chỉ nạp những thông tin cần thiết, bạn sẽ tiết kiệm được một lượng lớn token, đặc biệt hữu ích với các mô hình trả phí theo lượt sử dụng hoặc khi bạn sắp chạm đến giới hạn tin nhắn hàng ngày. Mình dùng Claude Code Max ($100) rất dễ chạm limit của Opus và fallback về Sonnet, từ ngày dùng Serena thì ít bị hơn hẳn!

* Tương thích đa nền tảng: Vì là một MCP server, Serena không chỉ giới hạn ở một công cụ. Bạn có thể dùng nó với Claude Code, Cursor, Windsurf, và bất kỳ AI tools nào hỗ trợ MCP.

* Local dashboard: Nó còn đi kèm một dashboard dạng web chạy trên local để bạn xem log và quản lý server một cách trực quan.

---

Cài đặt và sử dụng

Việc cài đặt khá đơn giản:

1/ Bạn chỉ cần chạy lệnh cài đặt Serena vào thư mục dự án bạn muốn sử dụng.

claude mcp add serena -- uvx --from git+https ://github.com/oraios/serena serena-mcp-server --context ide-assistant --project $(pwd)

2/ Sau đó chạy lệnh để nó bắt đầu "lập chỉ mục" (index) toàn bộ codebase.

uvx --from git+https ://github.com/oraios/serena index-project

3/ Cuối cùng & quan trọng: trước khi dùng AI, bạn cần prompt cung cấp hướng dẫn ban đầu để nó biết cách "nói chuyện" với công cụ Serena, ví dụ trường hợp của mình:

Sau khi khởi động Claude Code (hoặc bất kỳ AI Coding tool nào), prompt “read Serena's initial instructions” để agent nắm được code base index và các tools của Serena

(khúc này hơi phiền nhỉ, DX chưa được tốt lắm, mình làm thêm cái alias command khởi động CC nhúng sẵn prompt đó cho tiện đỡ phải gõ lại, nhưng mỗi lần /clear thì vẫn phải type lại)

Lưu ý:
* Serena cần được cài đặt cho mỗi dự án bạn muốn dùng (chứ không nên cài ở scope "user" vì dữ liệu index sẽ bị nhập nhằn ở các dự án khác nhau)
* Cần thực hiện bước (3) mỗi lần khởi động Claude Code để agent nạp hết đống tools của Serena trước khi làm việc.
* Việc lập chỉ mục hoạt động tốt nhất với các ngôn ngữ lập trình phổ biến như TypeScript, Python,... chứ không dành cho các dự án chỉ có HTML đơn thuần (mà thật ra mấy cái code base đơn giản như này thì cũng không cần tới con “dao mổ bò” này)

---

Túm lại

Serena là một công cụ cực kỳ mạnh mẽ cho bất kỳ lập trình viên nào đang sử dụng AI để hỗ trợ công việc. Nó giải quyết triệt để vấn đề "nhiễu" ngữ cảnh, giúp bạn khai thác tối đa sức mạnh của AI, tiết kiệm thời gian, chi phí và nâng cao trải nghiệm lập trình (DX).

Đây đúng là một case study điển hình về việc xây dựng công cụ giải quyết một "nỗi đau" rất thực tế của dev. Ae nên thử ngay và luôn cho nóng!

RapidChart – Vẽ sơ đồ hệ thống bằng AI, nhanh như chớp!Link chính thức:https://www.rapidcharts.ai/Bạn đã từng……phải ngồi...
25/07/2025

RapidChart – Vẽ sơ đồ hệ thống bằng AI, nhanh như chớp!

Link chính thức:

https://www.rapidcharts.ai/

Bạn đã từng…

…phải ngồi hàng giờ chỉ để vẽ sơ đồ luồng hệ thống, auth flow, hoặc kiến trúc microservices?

Giờ thì quên chuyện đó đi. Mình mới thử một tool AI tên là RapidChart – và phải nói là đỉnh của chóp! Nó giúp mình tạo sơ đồ kỹ thuật chỉ bằng… vài dòng mô tả. Không cần kéo thả, không cần canh chỉnh thủ công!

RapidChart có gì ngon?

Tạo sơ đồ bằng AI: Bạn chỉ cần viết vài câu mô tả, AI sẽ vẽ sơ đồ UML, system flow, hoặc database schema cho bạn.

Tốc độ thần tốc: “Create diagrams in minutes, not hours” – đúng như slogan của họ. Mình test thử sơ đồ auth flow, chưa tới 1 phút đã ra sơ đồ hoàn chỉnh.

Hỗ trợ nhiều loại sơ đồ:

Authentication flow

E-commerce database schema

Microservices architecture

CI/CD pipeline, API sequence…

Giao diện siêu dễ dùng: Có khung nhập lệnh tự nhiên (như đang chat), chọn model AI (hiện đang dùng Claude Sonnet 3/4), rồi xuất sơ đồ ra ngay.

Cách dùng (cực đơn giản)

1. Truy cập rapidchart.io

2. Nhập mô tả hệ thống bạn muốn vẽ (ví dụ: “User signs in → Token is issued → Data is fetched from DB”)

3. Chọn model AI (Claude hoặc GPT)

4. Nhấn nút và boom – có ngay sơ đồ!

Bạn có thể chỉnh sửa, kéo thả, tùy biến lại sơ đồ sau đó nếu muốn. Thậm chí còn lưu template hoặc xuất file dễ dàng.

Kết luận

Nếu bạn là dev backend, PM, sinh viên IT hay ai đó cần vẽ nhanh sơ đồ mà không muốn vật lộn với tool rối rắm, thì RapidChart là cứu tinh thật sự.

Tiết kiệm thời gian

Giao diện gọn, hiện đại

Có AI lo phần khó nhất cho bạn

Hãy thử một lần. Mình nghĩ bạn sẽ bất ngờ!

Cùng 8 Sync Dev, chinh phục thế giới lập trình!

Nguồn: 8 Sync Dev

💡 MindsDB – Nền tảng truy vấn liên kết dữ liệu, 100% mã nguồn mở (hơn 33.000 sao trên GitHub)Trong doanh nghiệp hiện nay...
14/07/2025

💡 MindsDB – Nền tảng truy vấn liên kết dữ liệu, 100% mã nguồn mở (hơn 33.000 sao trên GitHub)

Trong doanh nghiệp hiện nay, dữ liệu thường nằm rải rác ở nhiều hệ thống khác nhau từ cơ sở dữ liệu truyền thống, kho dữ liệu, các ứng dụng SaaS đến mạng xã hội. Việc kết nối và khai thác dữ liệu từ từng nguồn riêng lẻ đòi hỏi phải có connector riêng, khiến AI khó có thể "hiểu" và xử lý được toàn cảnh bức tranh dữ liệu.

MindsDB giải quyết bài toán đó bằng một công cụ truy vấn liên kết (federated query engine) có sẵn máy chủ MCP tích hợp, cho phép bạn truy vấn mọi nguồn dữ liệu chỉ với tiếng Anh tự nhiên hoặc cú pháp SQL đơn giản – nhanh, chính xác và không cần kỹ năng lập trình phức tạp.

🔍 Tính năng nổi bật:
Kết nối hơn 200 nguồn dữ liệu chỉ trong một nền tảng duy nhất từ cơ sở dữ liệu, data lake, đến các ứng dụng SaaS như Salesforce, Google Sheets, Slack,...

MCP Server tích hợp sẵn, sẵn sàng để các agent AI truy cập và khai thác tri thức ngay lập tức.

Tích hợp Vector Database xây dựng kho tri thức nội bộ (knowledge base) với khả năng nhúng tự động (auto-embedding), giúp AI hiểu ngữ nghĩa sâu hơn thay vì chỉ đơn thuần "tìm kiếm".

🎯 Toàn bộ hệ thống đều là mã nguồn mở và bạn hoàn toàn có thể tự triển khai, tự chủ toàn bộ dữ liệu. Phù hợp cho các doanh nghiệp cần giải pháp nội bộ, bảo mật cao, hoặc muốn tự phát triển thêm các tác vụ AI phức tạp.

14/07/2025

Python tool for converting files and office documents to Markdown. - microsoft/markitdown

Address

Ho Chi Minh City
70000

Website

Alerts

Be the first to know and let us send you an email when Lập Trình iOS posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Share