Giọng nói nhân tạo bây giờ có lẽ không còn quá xa lạ như những ngày đầu tiên chúng xuất hiện. Người dùng điện thoại thông minh đã dần quen thuộc với những trợ lý ảo như Siri, Alexa. Người dùng mạng xã hội cũng đã thấy hàng tá video tóm tắt phim được sản xuất đơn giản. Chỉ bằng cách chuyển văn bản thành giọng nói trên Google Translate, Vbee, Text To Speech Online,…
Sự ra đời của AI và các thuật toán
Trí tuệ nhân tạo và các thuật toán học sâu (deep learning) ra đời. Nhờ đó đã khiến giọng nói trở nên tự nhiên hơn. Nhờ có AI, một số nhà phát triển đã có thể tạo ra những giọng nói nhân tạo mới. Nó có thể thể hiện nhịp độ, cách phát âm hoặc ngữ điệu giống người thật chỉ với vài giờ đào tạo. Từ một mẫu giọng nói được thu âm từ trước.
Bằng cách này, một giọng nói nhân tạo bây giờ có thể được tạo ra giống con người. Đến nỗi mà bạn không thể phân biệt được chúng. Các thuật toán có thể tạo ra giọng nói có đủ tính cách. Từ ngữ âm, chất giọng địa phương, cách ngắt nghỉ cho tới cả tiếng thở.
Ứng dụng công nghệ giọng nói nhân tạo
Resemble.ai, một công ty thiết kế giọng nói cho quảng cáo và trợ lý thông minh, cho biết họ đã làm việc với khách hàng để khởi chạy các quảng cáo âm thanh được cá nhân hóa như vậy trên Spotify và Pandora.
Các ngành công nghiệp trò chơi và giải trí cũng đang nhìn thấy lợi ích từ đó. Sonantic, một công ty chuyên về giọng nói nhân tạo có cảm xúc – có thể cười, có thể khóc, thì thầm hoặc hét lên, đang làm việc với các nhà sản xuất trò chơi điện tử và các hãng phim hoạt hình để cung cấp phần lồng tiếng cho các nhân vật của họ.
Nhiều khách hàng của công ty chỉ sử dụng giọng nói nhân tạo trong giai đoạn tiền sản xuất sau đó sẽ chuyển sang diễn viên lồng tiếng thực. Nhưng Sonantic cho biết một số khách hàng đã bắt đầu sử dụng chúng trong sản phẩm cuối cùng, đặc biệt là để thay thế các câu thoại ngắn.
*Video giới thiệu game được lồng tiếng bởi giọng đọc nhân tạo của Sonantic
Xem thêm: Vbee ra mắt phiên bản mới Vbee AI Voice Studio với hàng ngàn tính năng mới