fbpx
#AI GIẢ GIỌNG NÓI Y CHANG 1 NGƯỜI CHỈ TỪ 3 GIÂY DỮ LIỆU GIỌNG NÓI CỦA NGƯỜI ĐÓ

#AI GIẢ GIỌNG NÓI Y CHANG 1 NGƯỜI CHỈ TỪ 3 GIÂY DỮ LIỆU GIỌNG NÓI CỦA NGƯỜI ĐÓ

<PHÁT MINH MỚI>

Gần đây, AI đã được đưa vào sử dụng trong đời sống ở nhiều lĩnh vực khác nhau. Mới đây, “Microsoft” đã công bố thêm mô hình AI tổng hợp giọng nói mới có tên “VALL-E”.AI này gần như có thể tái tạo hoàn toàn chất lượng giọng nói của một người, đọc văn bản dài bất kỳ, chỉ cần vỏn vẹn 3 giây dữ liệu giọng nói từ người đó.

Công nghệ cấu tạo của “VALL-E” phức tạp đến mức ngay cả các kỹ sư cũng không thể phân tích. Đây là một mô hình ngôn ngữ dựa trên AI mới, đã học được từ hơn 7.000 giờ nói tiếng anh của hơn 7.000 người khác nhau. Khác với các kỹ thuật tổng hợp giọng nói truyền thống, Microsoft gọi đây là “mô hình ngôn ngữ codec thần kinh”.

Các bản demo nghe thử, được công bố trên báo cáo khiến không ít người đã phải ngạc nhiên. Chỉ dựa trên 3 giây giọng nói ghi âm từ một người, giọng nói của người đó sẽ được AI tái tạo và tạo ra một giọng thu y chang với chất giọng đó đọc bất kỳ gì bạn muốn. Thật sự rất khó để có thể phân biệt đâu là giọng người nói thật và đâu là giọng do AI tạo ra. 😳

Mặc dù đây là một công nghệ tuyệt vời, nhưng có vẻ sẽ khiến nhiều người lo lắng rằng nó sẽ bị lạm dụng. Tuy nhiên, Microsoft cho biết họ sẽ cam kết thực hiện các quy tắc về trách nhiệm của AI của riêng họ.

Hiện tại công nghệ này vẫn chưa được công khai ra ngoài thị trường. Một số biện pháp phòng ngừa sẽ được thực hiện khi nó thực sự được đưa vào sử dụng thực tế.

Không biết AI nghe 3s ca sĩ “Ò ó o ò” hát “oét”thì có thể tái tạo ra giọng của cô í ko nhỉ?

——-

Source: tabi-labo

𝐄𝐝𝐢𝐭𝐞𝐝 𝐛𝐲 𝐍𝐢𝐩𝐩𝐨𝐧𝐜𝐥𝐚𝐬𝐬

Liên hệ QC / Thiết kế banner, poster, video:

Mail: hello@nipponclass.jp

Website: nipponclass.jp

#hako#nipponclass#nhatban#japaneselife#japanese#Japan#news#tintuc#gocnhatban#AI

Bạn phải để đăng bình luận.