Google chia sẻ toàn bộ tài liệu hướng dẫn sử dụng AI Gemini, Nano Banana, Veo3.

Đình Dũng

Moderator
Tiếp tục mình tím được, link tài liệu AI chính chủ từ Google hướng dẫn anh em cài xài các công cụ AI của Google ép cho ra bã. Từ Google Gemini, tạo ảnh Nano Banana, Veo3,...Mình đã cày qua và phải công nhận Google nó chỉ bạn đi thẳng vào cách viết prompt sao để có kết quả xịn nhất., chứ ko vòng vo lý thuyết đâu.

1. Tài liệu hướng dẫn dùng Gemini 3
Google chia sẻ gì không phải mấy câu lệnh chung chung kiểu "hãy viết cho tôi...". Tài liệu này dạy anh em các cấu trúc prompt nâng cao luôn.
Nó chỉ cách nhét context, đưa dữ liệu mẫu và định dạng đầu ra sao cho AI hiểu. Rất hợp để anh em muốn làm tự động hóa mà kết quả trả về luôn đúng form bảng biểu mong muốn.

2. Nano Banana PRO
Đây là tài liệu cho model tạo ảnh Nano Banana. Google hướng dẫn cách dùng text để kiểm soát 100% bố cục, thông số ánh sáng, và phong cách đầu ra bạn mong muốn. Điểm hay là cách prompt sao để ra đúng phong cách. Ví dụ anh em muốn tạo ra những bức ảnh visual hơi hướng editorial, đánh sáng tương phản mạnh hoặc màu cinematic đặc trưng như phim Vương Gia Vệ, tài liệu này sẽ chỉ rõ cách dùng từ khóa nhiếp ảnh để AI hiểu và render chính xác mood & tone đó.

3. VEO 3
Khác với việc gõ prompt hên xui, Google chỉ thẳng bạn công thức 5 bước : Góc máy - Chủ thể - Hành động - Bối cảnh - Phong cách. . Ngoài ra anh em có thể prompt để Veo tự sinh ra cả âm thanh vd tiếng động môi trường, SFX,... khớp với video.

4. Gemini-Text-to-Speech
Này cũng khá hay, mặc dù mình ít dùng. Google hướng dẫn cách chỉnh tốc độ, ngữ điệu, và cách chèn các thẻ ngắt nghỉ để làm voiceover cho Shorts, Reels,..

5. Files API
Lúc đầu mình cũng ko quan tâm nhưng đọc mới thấy khá quan trọng. Google chỉ cách upload file PDF, Doc, file text... lên cho Gemini đọc và cách đặt câu hỏi để nó trích xuất chính xác thông tin từ đống tài liệu đó. Cái này phù hợp cho ae nào cần làm báo cáo, thì ép con Gemini đọc hết report, researh

6. Antigravity
Này chủ yếu về code, ko phải chuyên môn mình, chủ yếu là cho phép AI tự viết code, tự chạy terminal, và tự mở trình duyệt web để test lỗi,... kiểu thay vì anh em phải copy/paste code, giờ giao cho nó nguyên một task kiểu "Viết cho tôi tool tự động xuất ra file Excel". Nó sẽ tự động.

Tất cả tài liệu này đều là hàng chính chủ và hoàn toàn MIỄN PHÍ. anh em tiện lưu lại ngâm cứu nhé!

1. Gemini 3: https://ai.google.dev/gemini-api/docs/prompting-strategies

2. Nano Banana (PRO): https://ai.google.dev/gemini-api/docs/image-generation

3. VEO: https://cloud.google.com/blog/products/ai-machine-learning/ultimate-prompting-guide-for-veo-3-1

4. Gemini-TTS: https://docs.cloud.google.com/text-to-speech/docs/gemini-tts

5. Files API: https://ai.google.dev/gemini-api/docs/files#prompt-guide

6. Antigravity: https://codelabs.developers.google.com/getting-started-google-antigravity?hl=vi#0
 
Cái Gemini 3 prompting này hay vãi. Mình đang xài và thấy Gemini 3 khác hẳn 2.5 — nó follow instruction ngắn tốt hơn nhiều, không cần viết prompt dài dòng như trước nữa. Nhiều khi viết ngắn lại ra kết quả xịn hơn
 
Mình hay dùng Gemini TTS để làm voiceover cho Reels nhưng chưa biết chỉnh ngữ điệu. Link tài liệu này xịn thiệt, lần đầu thấy Google hướng dẫn cách chèn thẻ ngắt nghỉ. Cảm ơn bạn nhiều!
 
Antigravity này mình biết từ hồi Google I/O. Thực ra nó là Google Project IDX + Gemini tích hợp sâu hơn, cho phép AI tự chạy code, debug, mở browser test luôn mà không cần copy paste. Kiểu agentic coding
 
Veo 3 công thức 5 bước hay đấy. Mình thử rồi — bước quan trọng nhất là Cinematography (góc máy). Nếu không specify góc máy rõ ràng thì Veo nó tự chọn theo pattern training data, nhiều khi ra góc không như mình muốn.
 
Gemini TTS hiện có mấy giọng đọc tiếng Việt không bạn? Mình cần giọng đọc chuẩn cho podcast và Reels tiếng Việt nhưng mấy cái TTS khác giọng còn robot quá.
 
Nano Banana tạo ảnh product photography đẹp hơn mình nghĩ nhiều. Mình thử prompt kiểu: white minimalist studio, backlit product shot, subtle rim lighting, commercial photography, ultra sharp focus — ra ảnh khas ngon
 
Mình dùng Files API để upload giáo trình PDF rồi nhờ Gemini soạn câu hỏi trắc nghiệm theo từng chapter, ra đề thi, tạo flashcard. Trước mất cả buổi, giờ 15 phút xong. Cái này ai cũng xài được hết.
 
mình hay xài Nano Banana tạo thumbnail YouTube. Mình thấy keyword dramatic lighting, high contrast, eye-catching composition + mô tả màu brand → ra thumbnail . Thêm no text overlay để không bị AI tự thêm chữ vào.
 
mình hay xài Nano Banana tạo thumbnail YouTube. Mình thấy keyword dramatic lighting, high contrast, eye-catching composition + mô tả màu brand → ra thumbnail . Thêm no text overlay để không bị AI tự thêm chữ vào.
Workflow mình đang xài cho YouTube channel:
1. Gemini 3 → viết script video
2. Gemini TTS → đọc script thành voiceover
3. Nano Banana → tạo ảnh
4. Veo 3 → animate ảnh
Tất cả đều Google tools, sync rất mượt.
 
Workflow mình đang xài cho YouTube channel:
1. Gemini 3 → viết script video
2. Gemini TTS → đọc script thành voiceover
3. Nano Banana → tạo ảnh
4. Veo 3 → animate ảnh
Tất cả đều Google tools, sync rất mượt.
Mình cũng xài Nano Banana tạo ảnh sản phẩm cho ecom. dùng ảnh sản phẩm thật làm reference, prompt Nano Banana đặt sản phẩm vào background lifestyle mong muốn. Tuy không thay hoàn toàn nhưng dùng cho concept test và ảnh phụ thì rất ổn và tiết kiệm chi phí .
 
Back
Bên trên