OpenAI cung cấp GPT-4 Turbo với API Vision, giúp các doanh nghiệp tích hợp khả năng ngôn ngữ

Mẫu ngôn ngữ GPT-4 Turbo với Vision, một công nghệ mạnh mẽ kết hợp khả năng hiểu ngôn ngữ và hình ảnh, đã chính thức được OpenAI cung cấp thông qua API của họ. Điều này mở ra nhiều cơ hội mới cho các doanh nghiệp và nhà phát triển để tích hợp tính năng tiên tiến này vào ứng dụng của mình.

GPT-4 Turbo với Vision là sự tiếp nối của việc OpenAI giới thiệu tính năng tải lên âm thanh và hình ảnh cho GPT-4 hồi tháng 9 năm ngoái, và việc ra mắt mẫu GPT-4 Turbo tăng áp tại hội nghị nhà phát triển của OpenAI vào tháng 11.

GPT-4 Turbo hứa hẹn những cải tiến đáng kể về tốc độ, cửa sổ ngữ cảnh đầu vào lớn hơn lên tới 128.000 token (tương đương khoảng 300 trang) và tăng khả năng chi trả cho các nhà phát triển.

Một cải tiến quan trọng là khả năng yêu cầu API sử dụng khả năng phân tích và nhận dạng tầm nhìn của mô hình thông qua định dạng văn bản JSON và gọi hàm. Điều này cho phép các nhà phát triển tạo các đoạn mã JSON có thể tự động hóa các hành động trong ứng dụng được kết nối, chẳng hạn như gửi email, mua hàng hoặc đăng trực tuyến. Tuy nhiên, OpenAI đặc biệt khuyến nghị nên xây dựng các luồng xác nhận của người dùng trước khi thực hiện các hành động tác động đến thế giới thực.

Một số công ty khởi nghiệp đã tận dụng GPT-4 Turbo với Vision, bao gồm cả Cognition , tác nhân mã hóa AI Devin của họ dựa vào mô hình để tự động tạo mã đầy đủ.

Healthify, một ứng dụng sức khỏe và thể dục, sử dụng mô hình này để cung cấp các phân tích và đề xuất dinh dưỡng dựa trên ảnh các bữa ăn:

https://twitter.com/OpenAIDevs/status/1777769466371162317

TLDraw, một công ty khởi nghiệp có trụ sở tại Vương quốc Anh, sử dụng GPT-4 Turbo với Vision để cung cấp năng lượng cho bảng trắng ảo của mình và chuyển đổi bản vẽ của người dùng thành các trang web chức năng:

Mặc dù phải đối mặt với sự cạnh tranh gay gắt từ các mô hình mới hơn như Claude 3 Opus của Anthropic và Gemini Advanced của Google, việc ra mắt API sẽ giúp củng cố vị thế của OpenAI trên thị trường doanh nghiệp khi các nhà phát triển đang chờ đợi mô hình ngôn ngữ lớn tiếp theo của công ty.

Rate this post

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *