Tóm tắt: Bài viết hướng dẫn từng bước cài đặt môi trường đầy đủ để bạn có thể huấn luyện mô hình ngôn ngữ lớn (LLM) với LoRA và GRPO, cụ thể trên Llama 3.2-1B. Bạn sẽ nắm được yêu cầu phần cứng, phần mềm, các thư viện cần thiết và cách thiết lập nhanh chóng để bắt đầu huấn luyện ngay.
Table of Contents
Yêu cầu phần cứng
Để huấn luyện LLM với LoRA + GRPO hiệu quả, bạn cần máy có GPU (tối thiểu 16 GB VRAM). Khuyến nghị:
Phần cứng | Khuyến nghị tối thiểu |
---|---|
GPU | NVIDIA RTX 3090 / A6000 hoặc tương đương (≥24 GB VRAM càng tốt) |
RAM | ≥32 GB |
Ổ cứng | ≥100 GB (ưu tiên SSD) |
CPU | ≥8 cores |
Lưu ý: Nếu không có GPU mạnh, bạn có thể dùng Google Colab Pro, Kaggle, hoặc rental cloud GPU (VD: LambdaLabs, Vast.ai).
Yêu cầu phần mềm
Phần mềm | Phiên bản khuyến nghị |
---|---|
Ubuntu | 20.04 hoặc 22.04 |
Python | ≥3.9 |
CUDA Toolkit | CUDA 11.8 hoặc mới hơn |
PyTorch | ≥2.1 (có hỗ trợ GPU) |
Kiểm tra phiên bản Python:
bashSao chépChỉnh sửapython3 --version
Nếu chưa có Python 3.9+, cài đặt:
bashSao chépChỉnh sửasudo apt update
sudo apt install python3.9 python3.9-venv python3.9-dev
Tạo môi trường ảo (khuyến nghị)
Để tránh xung đột thư viện, nên tạo venv riêng:
bashSao chépChỉnh sửapython3.9 -m venv lora_env
source lora_env/bin/activate
Cài đặt thư viện cần thiết
1. Cập nhật pip
bashSao chépChỉnh sửapip install --upgrade pip
2. Cài đặt PyTorch (có GPU)
Truy cập: https://pytorch.org/get-started/locally/
Ví dụ lệnh cài CUDA 11.8:
bashSao chépChỉnh sửapip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
Kiểm tra PyTorch nhận GPU:
pythonSao chépChỉnh sửaimport torch
torch.cuda.is_available()
# Output: True
3. Cài thư viện huấn luyện
Cài Unsloth, vLLM, Datasets, trl (GRPO)
bashSao chépChỉnh sửapip install unsloth vllm==0.7.3 datasets trl
4. (Tùy chọn) Cài thêm thư viện tiện ích
bashSao chépChỉnh sửapip install wandb tqdm scikit-learn
Cấu hình sử dụng GPU hiệu quả
Khi load mô hình bằng Unsloth, nên cấu hình:
pythonSao chépChỉnh sửagpu_memory_utilization=0.8 # Sử dụng 80% GPU
fast_inference=True # Tăng tốc sinh văn bản
load_in_4bit=False # Không lượng tử hóa (để reasoning chính xác hơn)
Nếu VRAM thấp (<24 GB) → bạn có thể bật 4-bit quantization:
pythonSao chépChỉnh sửaload_in_4bit=True
Kiểm tra toàn bộ môi trường
Tạo file check_env.py
:
pythonSao chépChỉnh sửaimport torch
from unsloth import FastLanguageModel
from vllm import SamplingParams
from datasets import load_dataset
from trl import GRPOConfig, GRPOTrainer
print("GPU Available:", torch.cuda.is_available())
print("Unsloth OK")
print("vLLM OK")
print("Datasets OK")
print("trl OK")
Chạy:
bashSao chépChỉnh sửapython check_env.py
Quản lý GPU (hữu ích)
Xem tình trạng GPU:
bashSao chépChỉnh sửanvidia-smi
Nếu GPU bị tràn bộ nhớ (Out of memory):
- Giảm
max_seq_length
, - Giảm batch size,
- Bật 4bit (
load_in_4bit=True
).
Tóm tắt lệnh nhanh (cheatsheet)
bashSao chépChỉnh sửa# Tạo venv
python3.9 -m venv lora_env
source lora_env/bin/activate
# Cài PyTorch (CUDA 11.8)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
# Cài thư viện chính
pip install unsloth vllm==0.7.3 datasets trl
# Cài thư viện tiện ích (tùy chọn)
pip install wandb tqdm scikit-learn
Kết luận
Chỉ với 7–10 phút, bạn đã sẵn sàng một môi trường hoàn chỉnh để:
- Tinh chỉnh LLM bằng LoRA,
- Huấn luyện bằng Reinforcement Learning (GRPO),
- Giải toán trắc nghiệm tiếng Việt với hiệu quả cao.
[+++]
Lưu ý: Bài viết chỉ cung cấp góc nhìn và không phải là lời khuyên đầu tư.
Đọc các Sách chính thống về Blockchain, Bitcoin, Crypto
Để nhận ưu đãi giảm phí giao dịch, đăng ký tài khoản tại các sàn giao dịch sau:👉 Nếu bạn cần Dịch vụ quảng cáo crypto, liên hệ Click Digital ngay. 🤗
Cảm ơn bạn đã đọc. Chúc bạn đầu tư thành công. 🤗
Giới thiệu token Saigon (SGN):
- Đầu tư vào các công ty quảng cáo blockchain hàng đầu bằng cách MUA token Saigon (SGN) trên Pancakeswap: https://t.co/KJbk71cFe8/ (đừng lo lắng về tính thanh khoản, hãy trở thành nhà đầu tư sớm)
- Được hỗ trợ bởi Công ty Click Digital
- Nâng cao kiến thức về blockchain và crypto
- Lợi nhuận sẽ dùng để mua lại SGN hoặc đốt bớt nguồn cung SGN để đẩy giá SGN tăng.
- Địa chỉ token trên mạng BSC: 0xa29c5da6673fd66e96065f44da94e351a3e2af65
- Twitter X: https://twitter.com/SaigonSGN135/
- Staking SGN: http://135web.net/
- If you’d like to invest in top blockchain advertising companies, just BUY Saigon token (SGN) on Pancakeswap: https://t.co/KJbk71cFe8/ (do not worry about low liquidity, be the early investor)
- Backed by Click Digital Company
- Enhancing blockchain and crypto knowledge
- The profits will be used to repurchase SGN or burn a portion of the SGN supply to drive up the SGN price.
- BSC address: 0xa29c5da6673fd66e96065f44da94e351a3e2af65
- Twitter X: https://twitter.com/SaigonSGN135/
- Staking SGN: http://135web.net/
Digital Marketing Specialist