Các mô hình ngôn ngữ lớn là một số phát triển ấn tượng gần đây nhất trong lĩnh vực lập trình ngôn ngữ tự nhiên và mạng nơ-ron.
GPT-3 của OpenAI nổi bật là một trong những mô hình hoạt động tốt nhất hiện có. Đầu ra của mô hình thường không thể phân biệt được với văn bản đến từ con người.
Tuy nhiên, GPT-3 vẫn là một mô hình mã nguồn đóng. Mặc dù cực kỳ mạnh mẽ, nhưng có một số hạn chế nhất định có thể khiến nó không phù hợp với một số trường hợp sử dụng nhất định.
Trong bài viết này, chúng ta sẽ xem xét một số mô hình ngôn ngữ có thể cạnh tranh với hiệu suất thô của GPT-3.
Tại sao Tìm kiếm một giải pháp thay thế OpenAI GPT-3?
Mô hình GPT-3 của OpenAI sử dụng nâng cao học kĩ càng mô hình để tạo ra văn bản giống như con người. Đây là mô hình dự đoán ngôn ngữ thế hệ thứ ba từ phòng thí nghiệm nghiên cứu của OpenAI.
Mô hình này ban đầu được phát hành dưới dạng beta kín trước khi OpenAI cuối cùng mở API ra công chúng vào cuối năm 2021.
Hiện tại, GPT-3 có bốn mẫu cơ bản cho bạn lựa chọn. Ada, mô hình rẻ nhất và nhanh nhất chỉ có giá 0.0004 đô la cho mỗi 1000 mã thông báo. Mô hình mạnh mẽ nhất của OpenAI, Davinci, có giá 0.02 đô la cho mỗi 1000 mã thông báo, hoặc đắt hơn khoảng 50 lần.
OpenAI cũng yêu cầu nhà phát triển tuân theo hướng dẫn sử dụng. Nhà phát triển cũng sẽ cung cấp một hạn ngạch sử dụng giới hạn có thể được tăng lên khi ứng dụng của nhà phát triển được phê duyệt thông qua quá trình xem xét thủ công.
Mặc dù đầu ra GPT-3 nổi tiếng với đầu ra chất lượng cao, nhưng đây không phải là mô hình dự đoán ngôn ngữ duy nhất có sẵn để bạn sử dụng.
Hãy xem xét một số mô hình cạnh tranh mà bạn có thể sử dụng thay thế cho GPT-3.
1. GPT-J
GPT-J là một mô hình ngôn ngữ mã nguồn mở của nhóm Eleuther AI.
Hiệu suất zero-shot gần như ngang bằng với GPT-3 và gần hơn nhiều về hiệu suất so với nhiều triển khai GPT khác.
Mô hình tạo văn bản tự động khôi phục tham số 6 tỷ tham số đã được đào tạo trên tập dữ liệu được gọi là “The Pile”.
Đống thực sự là sự kết hợp của 22 bộ dữ liệu nhỏ hơn được kết hợp với nhau. Nó có kích thước tệp kết hợp là 825 GiB và đã được quan sát là có sự tập trung nhiều hơn vào các nguồn học thuật và chuyên nghiệp.
Bạn có thể tự mình kiểm tra mô hình thông qua điều này ứng dụng web miễn phí.
Tôi đã có thể kiểm tra mô hình với một lời nhắc đơn giản. GPT-J đã thành công trong việc liệt kê “những cách tốt nhất để học một ngôn ngữ mới hiện nay”.
Tuy nhiên, hiệu suất hơi bị lỗi khi tôi cố gắng yêu cầu nó giải thích mô hình tạo văn bản tự động hồi phục là gì.
Mặc dù kết quả đầu ra có ý nghĩa, nhưng nó không thực sự trả lời lời nhắc một cách có ý nghĩa.
GIÁ CẢ
Vì GPT-J là một mô hình mã nguồn mở, bạn thực sự có thể tự chạy phiên bản của riêng mình. Theo kho chính thức, mô hình được thiết kế để chạy trên bộ xử lý tensor (TPU). Mặc dù tối ưu, đây có thể không phải là lựa chọn hiệu quả nhất về chi phí vì rẻ nhất của Google chi phí TPU đám mây khoảng $ 4.50 / giờ.
Về lâu dài, có thể ít tốn kém hơn khi sử dụng GPU của riêng bạn hoặc thuê một máy chủ GPU chuyên dụng thông qua các dịch vụ như rộng lớn.ai or ngăn xếp chất lỏng.
2. Kỷ Jura-1
Jurassic-1 là một mô hình ngôn ngữ được phát hành bởi AI21 Labs, một công ty AI của Israel chuyên về NLP. Giống như OpenAI, họ cũng cung cấp một API cho phép bạn truy cập vào mô hình ngôn ngữ của họ.
Bạn có thể tạo một tài khoản trên trang mạng truy cập ứng dụng web sân chơi để kiểm tra mô hình cho chính bạn.
AI21 Studio cũng bao gồm một tính năng mà bạn có thể đào tạo và truy vấn các phiên bản tùy chỉnh của riêng mình cho các mô hình Jurassic-1 của chúng. Theo một bài đăng trên blog chính thức, các mô hình tùy chỉnh với ít nhất XNUMX ví dụ có thể hoạt động tốt hơn kỹ thuật nhanh chóng bằng cách sử dụng mô hình ban đầu.
GIÁ CẢ
Họ cung cấp giá cả dựa trên mức sử dụng linh hoạt cho từng mô hình trong ba mô hình cơ sở của họ. Ví dụ: họ tính phí 0.25 đô la cho mỗi 1000 mã thông báo được tạo bởi mô hình. Trung bình, mỗi mã thông báo có khoảng 1 từ hoặc sáu ký tự.
Điều này có nghĩa là bạn có thể sử dụng mô hình tốt nhất của AI21 để tạo một tài liệu 4000 từ chỉ với 1 đô la. Tuy nhiên, một điều bạn cần nhớ là bạn vẫn cần phải trả tối thiểu $ 29 hàng tháng để sử dụng mô hình này.
3. Tổng hợp văn bản
TextSynth là một dịch vụ web NLP khác mà bạn có thể sử dụng để tạo văn bản. Không giống như hai ví dụ trước, TextSynth không phải là một mô hình độc lập. Dịch vụ này hoạt động bằng cách cấp cho người dùng quyền truy cập vào các mô hình ngôn ngữ lớn mã nguồn mở khác như GPT-NeoX, M2M100 và thậm chí là GPT-J.
Các nhà phát triển có thể sử dụng REST API để tích hợp các mô hình ngôn ngữ vào các ứng dụng của riêng chúng. Bạn có thể thử kiểm tra miễn phí của họ trang sân chơi để xem mỗi mô hình có sẵn hoạt động như thế nào.
GIÁ CẢ
Gói miễn phí của họ cung cấp cho bạn quyền truy cập vào tất cả các mô hình ngôn ngữ của họ với một số giới hạn tỷ lệ. Dịch vụ giới hạn mỗi yêu cầu ở độ dài 200 mã thông báo.
Kế hoạch tiêu chuẩn loại bỏ giới hạn về số lượng mã thông báo được tạo. Mô hình định giá dựa trên tín dụng để tránh các chi phí không mong muốn. Số lượng tín dụng tối thiểu để mua là $ 20. Các khoản tín dụng chưa sử dụng sẽ không hợp lệ sau một năm.
Giá của mỗi yêu cầu dựa trên số lượng đầu vào và mã thông báo được tạo. Dựa trên bảng trên trang web chính thức của họ, bạn có thể phải trả khoảng $ 0.75 đến $ 1.25 để sử dụng các mẫu rẻ hơn của họ.
Kết luận
Hy vọng rằng bài viết này có thể giúp bạn tìm được một mô hình ngôn ngữ hiệu quả và giá cả phải chăng mà bạn có thể sử dụng như một Giải pháp thay thế OpenAI GPT-3.
Các mô hình ngôn ngữ lớn rất mạnh mẽ và có thể được sử dụng cho nhiều tác vụ khác nhau. Chúng có thể được sử dụng để tạo văn bản, dịch giữa các ngôn ngữ và hiểu và phản hồi với ngôn ngữ tự nhiên.
Dựa trên nghiên cứu của tôi trong không gian và các thử nghiệm mà tôi đã tiến hành, GPT-3 vẫn hoạt động tốt hơn mọi thứ khác mô hình ngôn ngữ lớn Tôi đã thử. Tuy nhiên, điều này có thể thay đổi trong tương lai khi các nhà nghiên cứu phát triển và đưa ra các mô hình mới.
Các nhà nghiên cứu tại Google, Facebook và các phòng thí nghiệm AI khác sẽ vẫn tiếp tục làm việc để cải tiến LMM của riêng họ. Chắc chắn có khả năng một trong những nhóm AI này sẽ ra mắt một mô hình vượt trội hơn GPT-3.
Bình luận