Có phiên bản voice Chat GPT không? ChatGPT là gì thì có lẽ không cần giới thiệu nữa. Bạn có thể hỏi nó bất kỳ câu hỏi nào và Chat GPT trả lời trong nháy mắt. Nhưng câu trả lời sẽ luôn ở dạng văn bản. Điều gì sẽ xảy ra nếu bạn có thể nói chuyện với nó, giống như bạn làm với các trợ lý thoại nổi tiếng như Siri hay Cortana?
Mục lục
Có phiên bản voice Chat GPT không?
Gần đây, OpenAI đã phát hành ChatGPT và API Whisper cho thế giới. Giờ đây, tất cả các nhà phát triển và công ty, bao gồm cả các bản sao, có thể chính thức tích hợp mô hình này vào các ứng dụng và sản phẩm của họ. Tuy nhiên, vẫn còn một câu hỏi: Tại sao OpenAI, tổ chức nghiên cứu AI hàng đầu, không xây dựng Chat GPT ở dạng chuyển văn bản thành giọng nói?
Thực tế, đã có một số mô hình có thể mô phỏng văn bản bằng các giọng nói khác nhau của người nổi tiếng như tổng thống Joe Biden, diễn viên Brad Pitt hay cầu thủ bóng đá Lionel Messi… Nhưng điều này dẫn đến rất nhiều tranh cãi ồn ào về mặt đạo đức của những công nghệ này.
Đó một phần là lý do cho việc tại sao OpenAI không có mô hình voice Chat GPT. Đó là vì họ sợ hậu quả của việc đó. OpenAI có thể sợ AI của họ là Chat GPT sẽ nói một số điều không hay nếu chúng thực sự có tiếng nói.
Nếu muốn dùng voice Chat GPT thì phải làm gì?
Tuy vậy giờ đây khi mà ai cũng có thể tải chat GPT API từ trên mạng, người ta có thể dễ dàng tích hợp nó với bất kỳ ứng dụng chuyển văn bản thành giọng nói nào để xây dựng một thứ gì đó tương đương với voice Chat GPT.
Nhiệm vụ này trước đây đã được thực hiện bởi các tiện ích mở rộng trên trình duyệt, chẳng hạn như ‘chatGPT auto speech’ hoặc ‘Talk-to-ChatGPT’. Nhưng vấn đề với những thứ này là chúng không “tự động” hoặc “tiện dụng”, vì chúng chỉ là những tiện ích mở rộng cho trình duyệt web. Âm thanh được tạo ra từ các chương trình này nghe tương tự như Cortana, Siri hoặc Trợ lý Google – buồn tẻ và đơn điệu.
OpenAI có ý định làm voice Chat GPT không?
CEO Sam Altman của OpenAI thực tế có thể học hỏi từ các công ty khác về mảng này. Công ty ElevenLabs gần đây đã cho ra mặt Voice Design, một AI tổng quát cho âm thanh. Họ nghiên cứu chuyên sâu về tổng hợp và nhân bản giọng nói. Các ứng dụng họ đã phát hành là This Voice Does not Exist, một ứng dụng cho phép người dùng thiết kế các giọng nói tổng hợp hoàn toàn mới.
Mặc dù mô hình này rất thú vị, nhưng một mô hình khác từ ElevenLabs, The First Ai That Can Laugh, mới là mô hình có ý nghĩa nhất. Được phát hành vào cuối năm ngoái, mô hình tạo giọng nói này được đào tạo trên 500 nghìn giờ dữ liệu và có thể hiểu cảm xúc từ văn bản tùy thuộc vào dấu câu, cú pháp và quan trọng nhất là ngữ cảnh.
Nếu công nghệ này có thể được tích hợp vào ChatGPT, nó sẽ có thể tạo ra giọng nói gần như thật, với cảm xúc giống với giọng nói của người thật. Rõ ràng, vẫn có những khía cạnh đạo đức mà công ty đang ngày càng quan tâm, nhưng đây có thể là mảnh ghép duy nhất mà OpenAI hiện đang (hy vọng) đang cố gắng giải với việc tạo ra phiên bản voice Chat GPT của họ.
Kết luận
Giờ bạn đã biết được mọi thông tin liên quan đến phiên bản voice Chat GPT. Công nghệ này được dự kiến sẽ hoàn thành trong một tương lai không xa. Khi đã có giọng nói, GPT chat app được dự kiến là sẽ hỗ trợ cho con người còn tốt hơn nữa. Đó là những hy vọng trong tương lai dành cho công nghệ AI này.
NẾU BẠN CHƯA CÓ TÀI KHOẢN CHATGPT PLUS THÌ CÓ THỂ TẢI MIỄN PHÍ TẠI ĐÂY