ChatGPT bổ sung thêm tính năng thoại và nhận diện hình ảnh

26/09/2023 13:57

VHO- Những tính năng mới sẽ được bổ sung vào các phiên bản trả phí của dịch vụ ChatGPT, theo đó cho phép người dùng nói chuyện với AI và thậm chí chỉ cho AI xem những gì họ đang nói đến.

ChatGPT bo sung them tinh nang thoai va nhan dien hinh anh hinh anh 1

Người dùng ChatGPT Plus và Enterprise sẽ được trải nghiệm tính năng này trong vài tuần tới. (Nguồn: Getty Images)

Công ty OpenAI - nhà phát triển công cụ trò chuyện (chatbot) ChatGPT, đã bổ sung tính năng thoại và nhận diện hình ảnh cho nền tảng Trí tuệ nhân tạo tạo sinh (generative AI).

Thông báo ngày 25.9 của OpenAI nêu rõ những tính năng trên sẽ được bổ sung vào các phiên bản trả phí của dịch vụ ChatGPT, theo đó cho phép người dùng nói chuyện với AI và thậm chí chỉ cho AI xem những gì họ đang nói đến.

OpenAI cho biết: “Giọng nói và hình ảnh mở ra cho bạn nhiều hướng ứng dụng ChatGPT trong cuộc sống."

OpenAI gợi ý rằng người dùng có thể chụp ảnh một địa danh khi đi du lịch và trò chuyện trực tiếp cùng ChatGPT về điều thú vị ở địa điểm đó; có thể chụp ảnh những thứ có bên trong chiếc tủ lạnh để ChatGPT gợi ý về công thức bữa ăn hoặc chụp ảnh bài tập Toán của con để nhận được lời giải.

Theo Open AI, người dùng ChatGPT Plus và Enterprise sẽ được trải nghiệm tính năng này trong vài tuần tới. Dự án này cũng được phát triển hướng tới hệ điều hành điện thoại thông minh của Apple và Google.

Nhà sáng tạo ChatGPT cho biết: “Giờ đây, bạn có thể sử dụng giọng nói để trò chuyện qua lại với trợ lý của mình. Nói chuyện với công cụ này khi đang di chuyển, yêu cầu kể một câu chuyện trước khi đi ngủ cho các con của bạn, hoặc nhờ công cụ này giải quyết một cuộc tranh luận trên bàn ăn."

OpenAI cũng đã hợp tác với các diễn viên lồng tiếng để khiến các tương tác bằng giọng nói qua ChatGPT trở nên thực tế hơn.

Các chương trình AI tạo sinh của OpenAI đã trở thành tâm điểm chú ý vào cuối năm ngoái, khi ChatGPT thể hiện khả năng tạo ra các bài tiểu luận, bài thơ và cuộc trò chuyện từ những gợi ý ngắn gọn bằng văn bản.

Ngoài Công ty Khởi nghiệp OpenAI, nhiều "gã khổng lồ" công nghệ như Google, Meta và Microsoft... cũng đang chạy đua phát triển AI, trong khi nỗ lực tránh những nguy cơ tiềm tàng của công nghệ này tạo ra những thông tin sai lệch và tiếp tay cho tội phạm mạng.

Trong một thông báo ngày 25.9, Nền tảng Phát nhạc Trực tuyến Spotify có trụ sở tại Thụy Điển cho biết họ đang tận dụng công nghệ của OpenAI để cho phép dịch podcast sang nhiều ngôn ngữ, trong khi vẫn duy trì ngôn ngữ của người nói ban đầu.

Ông Ziad Sultan, Phó Chủ tịch Phụ trách Cá nhân hóa của Spotify, cho biết: “Bằng cách kết hợp giọng nói của chính người sáng tạo, Voice Translation mang đến cho người nghe trên toàn thế giới khả năng khám phá và lấy cảm hứng từ các podcast mới theo cách chân thực hơn bao giờ hết."

Theo Spotify, trong những tuần tới, Công ty này sẽ tung ra những podcast tiếng Anh được dịch sang tiếng Tây Ban Nha, tiếng Pháp và tiếng Đức.

TTXVN