DBRX: Mã nguồn mở LLM của Databricks mạnh gần bằng GPT-3.5

Một đối thủ hoàn toàn mới đã bước vào vòng đua của các mô hình ngôn ngữ lớn (LLM). Databricks, một công ty chuyên xử lý dữ liệu, đã tiết lộ DBRX, tuyên bố đây là LLM nguồn mở mạnh mẽ nhất từ ​​trước đến nay. Nhưng nó có ủng hộ những tuyên bố đó không? Hãy cùng tìm hiểu.

132 tỷ tham số là một con số lớn – GPT-3.5 có 175 tỷ tham số

DBRX sử dụng kiến ​​trúc máy biến áp và có tới 132 tỷ thông số khổng lồ. Nó thúc đẩy một cách tiếp cận độc đáo được gọi là mô hình Hỗn hợp các chuyên gia (MoE), bao gồm 16 mạng lưới chuyên gia riêng lẻ. Trong bất kỳ nhiệm vụ nào, chỉ có 4 chuyên gia trong số này hoạt động, sử dụng 36 tỷ tham số để đạt hiệu quả. GPT-4 cũng sử dụng mô hình MoE.

Databricks so sánh DBRX với các LLM nguồn mở nổi bật khác như Llama 2-70B của Meta, Mixtral (từ MixtralAI của Pháp) và Grok-1 (được phát triển bởi xAI của Elon Musk). DBRX được cho là vượt trội so với các đối thủ của mình trong một số lĩnh vực chính:

  • Hiểu ngôn ngữ:  DBRX đạt số điểm 73,7%, vượt qua GPT-3,5 (70,0%), Llama 2-70B (69,8%), Mixtral (71,4%) và Grok-1 (73,0%).
  • Khả năng lập trình:  Ở đây, DBRX thể hiện sự dẫn đầu đáng kể với số điểm 70,1%, so với 48,1% của GPT-3.5, 32,3% của Llama 2-70B, 54,8% của Mixtral và 63,2% của Grok-1.
  • Toán học:  DBRX giành thêm một chiến thắng nữa với số điểm 66,9%, vượt qua GPT-3,5 (57,1%), Llama 2-70B (54,1%), Mixtral (61,1%) và Grok-1 (62,9%).

Databricks gán tốc độ của DBRX cho kiến ​​trúc MoE của nó, được xây dựng dựa trên các dự án nguồn mở và nghiên cứu MegaBlocks của họ. Điều này cho phép mô hình xuất mã thông báo với tốc độ rất cao. Ngoài ra, Databricks định vị DBRX là mô hình MoE nguồn mở tiên tiến nhất hiện có, có khả năng mở đường cho những tiến bộ trong tương lai trong lĩnh vực này.

Bản chất nguồn mở của DBRX cho phép cộng đồng nhà phát triển chấp nhận và đóng góp rộng rãi hơn . Điều này có thể đẩy nhanh sự phát triển hơn nữa và có khả năng củng cố vị thế của DBRX với tư cách là LLM hàng đầu.

Rate this post

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *