AI giả giọng nói: Microsoft mất 3 giây để làm được điều này???

Tháng Ba 11, 2023
Ngọt Digiuni

Microsoft – Ông trùm công nghệ đã chính thức cho ra mắt siêu phẩm AI giả giọng nói. AI giả giọng nói này có tên là VALL-E. VALL-E là thành quả của trí tuệ nhân tạo có khả năng tạo ra bản ghi với giọng nói giống 90% người nói chỉ trong vòng 3 giây (bao gồm cả cảm xúc lẫn giọng điệu).

AI giả giọng nói

1. AI giả giọng nói: Tốt hay xấu?

Theo Microsoft cho biết đây là “Mô hình ngôn ngữ codec thần kinh”. Đại học Cornell đã thử nghiệm VALL-E, Theo báo cáo, cơ sở dữ liệu được sử dụng trong huấn luyện VALL-E do Meta (công ty mẹ của Facebook) tổng hợp nên, và bao gồm 60.000 giờ thoại được thực hiện bởi 7.000 người. Kết quả cực kỳ ấn tượng, tuy nhiên đây vẫn chỉ là máy móc nên còn phải cải thiện nhiều trong tương lai.

AI giả giọng nói

Có rất nhiều ý kiến cho rằng VALL-E (AI giả giọng nói) sẽ bị lạm dụng, chẳng hạn như kẻ xấu dùng giọng giả các cơ quan chính phủ để trục lợi. Một số ngân hàng cũng đang định danh khách hàng của mình bằng giọng nói. Vậy nên nếu để VALL-E được tiếp cận dễ dàng thì nguy cơ tiềm ẩn sẽ xảy đến.

AI giả giọng nói

Chúng ta có thể hiểu về VALL-E như giải thích chính thức của Microsoft: Để tổng hợp ra một giọng nói được cá nhân hóa, VALL-E tạo token âm thanh tương ứng dựa trên token âm thanh của bản ghi âm mẫu dài 3 giây và dữ liệu đầu vào về âm vị, sẽ hạn chế thông tin về nội dung và người nói tương ứng. Cuối cùng, token âm thanh tạo ra từ quá trình này sẽ được sử dụng để tổng hợp thành dải sóng âm, thông qua một giải mã thần kinh của mô hình ngôn ngữ tương ứng.

2. Góc nhìn mới của nhân loại ảnh hưởng trực tiếp tương lai con trẻ:

Những năm gần đây liên tục xuất hiện những AI với khả năng làm điều mà con người không thể. Bên cạnh AI giả giọng nói của Microsoft, các ông lớn công nghệ đã đối đầu gay gắt khi ra mắt hàng loạt sản phẩm Trí Tuệ Nhân Tạo (AI) làm chấn động thế hệ trẻ như con ChatGPT,…

AI giả giọng nói

Như bạn cũng đã thấy, công nghệ luôn dẫn đầu và phát triển trong bất kỳ tình huống. Bây giờ chỉ mới là khởi đầu của cuộc cách mạng công nghệ trước sự xuất hiện của AI giả giọng nói hay ChatGPT. Tương lai, đặc biệt là thế hệ trẻ, sẽ dần đi vào quỹ đạo của sự tân tiến bậc nhất. Không chỉ đơn giản là AI giả giọng nói mà còn rất nhiều thứ chẳng hạn như các ngành nghề đang dần biến mất vì sự thay thế của Robot, nền kinh tế suy thoái và tỷ lệ thất nghiệp bùng nổ,…

Ba mẹ cần chuẩn bị thật tốt cho con mọi kỹ năng công nghệ thiết yếu để đảm bảo một tương lai vững chắc, càng trang bị thật nhiều thì cơ hội sẽ ngày càng rộng mở với các con, đặc biệt là các ngành nghề Hot: Lập trình, thiết kế,…. Các ngành nghề trên hội tụ đầy đủ những yếu tố để duy trì một công việc mơ ước. trong thời đại đầy biến động hiện nay.

AI giả giọng nói

DigiUni đi đầu với xu hướng học bền vững với nền tảng công nghệ số tiên phong về các ngành lập trình và thiết kế: Python, Scratch, Photoshop,… Chúng tôi muốn mang đến một tương lai sáng lạng cho các bé, một cơ hội mới để tiến vào và làm quen với kỷ nguyên công nghệ – dẫn đầu tương lai.

    Để lại thông tin bên dưới

    để được tư vấn và học thử miễn phí ngay

    Thông tin của bạn sẽ được bảo mật. Phần đánh dấu * là bắt buộc

    Thông tin của bạn sẽ được bảo mật.
    Phần đánh dấu * là bắt buộc