VNReport»Top»4 sản phẩm trí tuệ nhân tạo của OpenAI

4 sản phẩm trí tuệ nhân tạo của OpenAI

17:16 - 21/03/2023

Ngoài ChatGPT, OpenAI cũng sở hữu những sản phẩm trí tuệ nhân tạo bao gồm ứng dụng tạo hình ảnh DALL-E, ứng dụng nhận diện giọng nói Whisper, và ứng dụng viết mã máy tính Codex.

OpenAI là công ty nghiên cứu trí tuệ nhân tạo (AI) nổi tiếng toàn cầu sau khi giới thiệu ChatGPT – một ứng dụng gây sốt kể từ khi ra mắt vào cuối năm 2022. Nhưng không chỉ ChatGPT, OpenAI còn có các sản phẩm khác sử dụng trí tuệ nhân tạo. Những ứng dụng này có khả năng tạo hình ảnh từ lời mô tả đơn giản, nhận diện giọng nói hay viết mã lập trình máy tính.

  1. ChatGPT

ChatGPT là một chatbot do OpenAI phát triển và ra mắt vào tháng 11/2022. Ở phiên bản đầu tiên, ChatGPT được xây dựng dựa trên mô hình ngôn ngữ AI GPT-3.5, sau đó là mô hình GPT-4 từ ngày 14/3.

Sau khi ra mắt vào ngày 30/11/2022, ChatGPT nhanh chóng thu hút sự chú ý toàn cầu vì những câu trả lời chi tiết và rõ ràng trên nhiều lĩnh vực. Nó có thể tạo ra những nội dung như kịch bản, truyện, viết luận, làm bài kiểm tra, viết thơ và thậm chí cả mã máy tính. Tuy nhiên, một trong những vấn dề mà ChatGPT gặp phải – giống như những chatbot AI khác – là tính chính xác của các câu trả lời.

Sau khi ChatGPT phát hành, định giá ước tính của OpenAI tăng vọt lên 29 tỷ USD. ChatGPT là ứng dụng có 100 triệu người sử dụng trong thời gian nhanh nhất, đạt được cột mốc này vào tháng 1/2023.

  1. DALL-E

DALL-E là mô hình AI có khả năng tạo ra hình ảnh kỹ thuật số từ mô tả bằng ngôn ngữ tự nhiên. DALL-E được OpenAI công bố vào tháng 1/2021. Vào tháng 4/2022, OpenAI công bố phiên bản kế nhiệm DALL-E 2, có khả năng tạo ra những hình ảnh giống thật hơn với độ phân giải cao hơn, kết hợp được các khái niệm, thuộc tính và phong cách.

DALL-E 2 bước vào giai đoạn dùng thử từ tháng 7/2022, với thư mời dành cho 1 triệu người dùng. Mỗi người dùng có thể tạo một số lượng ảnh miễn phí nhất định mỗi tháng, sau đó phải trả thêm tiền. Vào ngày 28/9/2022, DALL-E 2 được mở rộng cho tất cả người đăng ký sử dụng.

DALL-E có khả năng tạo hình ảnh theo các phong cách như giống ảnh chụp, giống tranh hay emoji. Nó có thể biến đổi và sắp xếp lại các đội tưởng trong hình ảnh của mình

  1. Whisper

Whisper là một mô hình nhận diện giọng nói mục đích chung được OpenAI phát hành vào năm 2022. Nó được huấn luyện bằng một tập dữ liệu âm thanh lớn thu thập từ trên mạng, bao gồm nhiều ngôn ngữ, khu vực, giọng địa phương, mức âm lượng. Ngoài khả năng nhận diện giọng nói đa ngôn ngữ, Whisper còn có thể dịch tiếng nói.

Whisper được OpenAI mở mã nguồn, khác với ChatGPT và DALL-E. Theo công ty, đây là một trong những mô hình nhận diện giọng nói tiên tiến nhất thế giới hiện nay.

  1. Codex

Codex là mô hình AI có khả năng tạo mã máy tính từ ngôn ngữ tự nhiên. Đây là công nghệ nền tảng cho GitHub Copilot – công cụ giúp tự hoàn thành các đoạn mã lập trình máy tính. Codex được huấn luyện bằng mã máy tính và văn bản có sẵn trên mạng.

Codex có thể viết mã trong nhiều ngôn ngữ lập trình như Python, JavaScript và Ruby. Ngoài viết mã, Codex cũng có thể sửa mã, giải thích mã hoặc chuyển mã từ ngôn ngữ lập trình này sang ngôn ngữ lập trình khác.