Startup Việt và cái hố đen đốt tiền mang tên LLM Tiếng Việt ?
Xây dựng mô hình ngôn ngữ riêng không dành cho kẻ yếu tim. Đã đến lúc PM Việt Nam phải tỉnh táo trước khi thuyết phục sếp làm gì hãy đừng hành động vội vàng mà không chuẩn bị kỹ lưỡng về nâng lực.
Góc nhìn cá nhân về một vài thứ sảy ra về đầu tư công nghệ cơ bản ví dụ 2025 rầm rộ khái niệm LLM Tiếng Việt. Gần đây vài thứ khác nữa có thứ đúng có thứ cá nhân mình nghĩ sẽ sai nhưng hi vọng mình kém nghĩ sai. Nhưng cá nhân mình nghĩ phải trên 50% các việc có vẻ chưa cần làm mà nên dùng nguồn lực làm các thứ thật sự quan trọng thay vì để chứng minh VN làm chủ công nghệ trên tinh thần.
“Làm sản phẩm AI bằng tiếng Việt không có nghĩa là bạn phải xây lại cả một cái mô hình ngôn ngữ ngốn hàng triệu đô. Ranh giới giữa ‘Tự chủ công nghệ’ và ‘Đốt tiền vô nghĩa’ thực ra rất mỏng manh. Chìa khóa thành công không nằm ở Model, mà nằm ở Data.”
Nhớ cái hồi ChatGPT mới nổi, các sếp công nghệ ở Việt Nam hay ngồi trà đá vỗ đùi nhau bảo: “Phải xây một LLM tiếng Việt của riêng mình thôi em ạ. Mấy con AI Mỹ nó không hiểu văn hóa mình, văn phong mấy ông X,Y,Z cũng lủng củng lắm chỉ có người VN mới làm được”
Thế là rất nhiều Founder và PM nhiệt huyết hăm hở lao vào cuộc đua train mô hình ngôn ngữ lớn nội địa. Lời hứa hẹn luôn rất hào nhoáng: Một con trợ lý chuẩn Việt, hiểu tiếng lóng, hiểu ngữ cảnh văn hóa, và quan trọng nhất là bảo mật dữ liệu tuyệt đối không lo Mỹ soi dòm, tàu chêm vào ít chữ. Ghi danh muôn đời nước non với AI.
Nhưng tiến nhanh tới 2026, chúng ta hãy nhìn thẳng vào cái hố sâu mà các đội ngũ đó đang vùng vẫy hoặc mình quá kém để đánh giá nó đã thành công thật hay chưa.
Vấn đề đầu tiên đập thẳng vào mặt bạn không phải là thuật toán kém, mà là tiền. Xoay GPU để ráp nối huấn luyện một con LLM không khác gì bạn định dùng núi tiền giấy để duy trì lửa tinh thần.
Trong khi bạn cố nhịn ăn nhịn mặc để vắt ra được vài chục tỷ đồng chạy cụm máy chủ, thì một công ty công nghệ lớn ở tận thung lũng Silicon đã lấy chừng đó tiền mua cái card màn hình để test code buổi sáng.
Trớ trêu thay, sau hai năm ròng rã tự train con AI tiếng Việt của riêng bạn, bạn sung sướng vì độ thông minh của nó đã bằng 70% ChatGPT đời đầu. Thế rồi ngày hôm sau OpenAI hay Anthropic tung ra một bản cập nhật nhẹ, mô hình của họ đột nhiên bắt đầu làm toán, làm thơ lưu thủy bằng tiếng Việt thậm chí còn sõi hơn cả một học sinh chuyên Ngữ thời nay. Nhạc chưa kịp cất lên, bạn đã không còn muốn nói về cái cũ.
Thực tế tàn nhẫn của mảng AI Product Management là: Trừ khi bạn là một tập đoàn nắm trong tay hệ sinh thái dữ liệu độc quyền khổng lồ của cả một quốc gia, đừng đọ sức xây mô hình cơ sở chưa nên nói về Foundation Model.
PM cần lách cửa nào?
Kỹ sư thích code công nghệ lõi vì đó là danh dự của nghề làm kỹ thuật. Nhưng PM thì phải tỉnh táo. Nhiệm vụ của bạn không phải đoạt giải Turing, mà là kiếm khối tiền về nuôi công ty.
Thay vì chạy để chứng minh, hãy dùng công nghệ làm móng nhà người khác để cất cái nóc nhà mình.
Sức mạnh thực sự của một ứng dụng AI tiếng Việt giờ đây nằm ở thứ gọi là RAG (Retrieval-Augmented Generation) và Fine-tuning. Người dùng không cần một con AI thứ thiệt để nói chuyện sáo rỗng. Họ cần một hệ thống hỏi đáp chăm sóc khách hàng AI nắm trong tay bảng báo giá của công ty bạn, lịch sử mua hàng, và quy định đổi trả bằng tiếng Việt mà người nước ngoài không biết hay các đội lớn chưa ưu tiên và bạn có một sự hiểu biết sâu sắc về thị trường bạn ở.
Làm sản phẩm, 90% ngân sách và tâm huyết phải đổ vào việc quan trọng.
Đề xuất cho PM
Bỏ ngay cái tư duy gì cũng Xây lại từ đầu. Hãy ngồi xuống với team Dev, thống nhất tư tưởng là sẽ đứng trên vai người khổng lồ. Vọc vạch dùng các model mã nguồn mở nhỏ nhẹ (Ví dụ như Llama 3) rồi fine-tune (tinh chỉnh) bằng kho từ vựng nội bộ ngành nghề của công ty bạn hay các chuyên môn khác biệt.
Đầu tư vào lớp Data (Data Layer) chứ không phải lớp Mô hình (Model Layer). Là PM, bạn hãy xắn tay áo vào đi thu gom, làm sạch toàn bộ kho tài liệu, nhật ký chat với khách hàng, các quy trình ngầm định. Càng biến nhưng dữ liệu chưa có giá trì gì thành dữ liệu vàng, sản phẩm AI của bạn càng quan trọng ở thị trường ngách. Ai có Data và quy trình phù hợp, người đó có thể thắng thị trường AI tại Việt Nam.
T.D
T3.2026


