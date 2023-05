Khi công chúng đang chuẩn bị thích nghi với tác động đột phá của AI trong công việc và cuộc sống hàng ngày, nhiều người trong ngành sách nói đã cảm nhận rõ sự thay đổi này.

AI hiện nay có thể tạo ra các bản ghi âm thanh giống như con người và ở tốc độ siêu nhanh như trong dây chuyền lắp ráp. Và sự tối tân của công nghệ này đang khiến thế giới dần không cần dùng đến những chuyên gia con người - những người đã kiếm sống bằng giọng nói của họ suốt nhiều năm.

Tác động rõ rệt tới các chuyên gia lồng tiếng

Nhiều người trong số những chuyên gia này đã sụt giảm mạnh về doanh thu.

Tanya Eby là một chuyên gia lồng tiếng toàn thời gian và là một người kể chuyện chuyên nghiệp trong 20 năm. Bà cũng có một phòng thu âm tại nhà.

Nhưng trong 6 tháng qua, khối lượng công việc của bà đã giảm đi một nửa. Lịch đặt hẹn bà làm việc hiện chỉ kéo dài đến hết tháng sáu, trong khi trong một năm bình thường, lịch này sẽ kéo dài đến tháng tám.

Nhiều đồng nghiệp của bà cũng ghi nhận sự suy giảm tương tự. Bà chia sẻ rằng trong khi có nhiều yếu tố ảnh hưởng thì "có vẻ như AI đang tác động đến tất cả chúng tôi".

Mặc dù một hệ lụy rõ ràng nhất là các chuyên gia lồng tiếng mất đi cơ hội việc làm thì họ cũng lo ngại rằng sách nói do họ thuật lại trước đây có thể được sử dụng mà không có sự đồng ý của họ để phát triển các công cụ AI thay thế họ.

Các chuyên gia sách nói đang nhận thấy tác động rõ rệt của AI trong ngành. Ảnh: The Hindu.

Trong khi không có tác phẩm nào ghi rõ giọng đọc được AI hỗ trợ thì các chuyên gia cho biết hàng nghìn cuốn sách nói hiện được lưu hành đang sử dụng giọng nói được tạo ra từ ngân hàng dữ liệu.

DeepZen, một nền tảng cung cấp giọng đọc cho sách nói, đã áp dụng những công nghệ tiên tiến nhất và đang đưa ra mức giá có thể cắt giảm tới 1/4 chi phí sản xuất sách nói hoặc ít nhất là cũng thấp hơn chi phí sản xuất một tác phẩm sách nói truyền thống.

Công ty nhỏ có trụ sở tại London này tạo ra một bộ cơ sở dữ liệu bằng cách ghi lại giọng nói của một số chuyên gia được yêu cầu nói bằng nhiều cung bậc cảm xúc khác nhau.

Giám đốc điều hành DeepZen, Kamis Taylan, cho biết: “Mọi giọng nói mà chúng tôi đang sử dụng, chúng tôi đều ký thỏa thuận cấp phép và chúng tôi trả tiền cho các bản ghi âm”.

Ông cũng thông tin thêm: Đối với mọi dự án sản xuất, chúng tôi đều trả tiền bản quyền".

Theo thông tin từ Giám đốc điều hành Dima, Speechki, một công ty khởi nghiệp có trụ sở tại Texas, sử dụng cả bản ghi âm của riêng họ và giọng nói từ các cơ sở dữ liệu hiện có. Tuy nhiên, việc khai thác dữ liệu này chỉ được lấy sau khi họ đã ký kết hợp đồng về quyền sử dụng, ông Abramov nói.

Tuy nhiên, bà Eby cho biết không phải ai cũng tôn trọng tiêu chuẩn đó. Bà cho biết: “Nhiều công ty mới mở làm việc không tôn trọng đạo đức. Một số công ty dùng các giọng nói trong cơ sở dữ liệu mà không trả tiền”.

Ông Taylan cũng thừa nhận "có một vùng xám" đang bị một số nền tảng khai thác. “Họ lấy giọng của bạn, giọng của tôi, của 5 người khác gộp lại mới tạo ra một giọng riêng… Họ nói rằng giọng đó không của riêng ai”, doanh nhân này chia sẻ.

Tương lai kết hợp giọng đọc AI và con người

Một số chuyên gia trong ngành tiết lộ rằng đã có những nhà xuất bản truyền thống sử dụng các chương trình AI tổng quát (với khả năng tạo ra văn bản, hình ảnh, video và giọng nói từ nội dung hiện có mà không cần sự can thiệp của con người) trong hoạt động của họ.

Giám đốc điều hành HarperCollins tại Ấn Độ Ananth Padmanabhan thì cho biết họ đang “lấy mẫu” giọng đọc AI cho sách nói nhưng vẫn chưa tìm thấy âm thanh họ thích. Ông tin rằng AI có thể giúp sản xuất nhiều sách nói hơn, tiết kiệm nhiều thời gian hơn và giúp phát hành sách dịch nhanh hơn.

Ông Padmanabhan nói: “Tôi có thể nói với bạn, bạn sẽ không nhận thấy sự khác biệt. Đó là mục tiêu ngành đang hướng đến. Trừ khi tôi cung cấp thông tin bản ghi này do AI hay do con người thực hiện thì bạn mới có thể biết được. Trong thể loại phi hư cấu và các thể loại khác, giọng đọc của ai không quá quan trọng. Tôi nghĩ giọng đọc sẽ quan trọng trong tiểu thuyết khi câu chuyện ngắt, nghỉ. Tại những chỗ đó, người kể chuyện mới mang lại được nhiều điều”.

Người phát ngôn của Audible, một công ty con của Amazon và cũng là một gã khổng lồ trong lĩnh vực sách nói của Mỹ, cho biết: “Các giọng đọc chuyên nghiệp luôn và sẽ vẫn là cốt lõi của trải nghiệm nghe trên Audible. Tuy nhiên, khi công nghệ chuyển văn bản thành giọng nói được cải thiện, chúng tôi thấy một tương lai mới, trong đó giọng đọc của con người và nội dung được chuyển tự động từ văn bản sang giọng nói có thể cùng tồn tại".

Chính Amazon cũng đang tham gia sâu vào lĩnh vực AI đang bùng nổ và đều đang theo đuổi lĩnh vực kinh doanh đầy hứa hẹn là sách nói kỹ thuật số.

Đầu năm nay, Apple đã thông báo về việc chuyển sang phát triển sách nói sử dụng giọng đọc AI. Cho tới nay, Apple Books đã phát triển được một số “người kể chuyện kỹ thuật số”: Madison với giọng trầm và có kết cấu cho thể loại tiểu thuyết và lãng mạn, “Jackson” giản dị và thân thiện, “Helena” nghiêm nghị và lè nhè và “Mitchell” khô khan nhưng chuyên nghiệp.

Giọng đọc của AI đang được phát triển ngày càng giống với con người. Ảnh: NanoStockk.

Trên trang web của mình, Apple Books giới thiệu “người kể chuyện kỹ thuật số” của mình sẽ giúp các tác giả và nhà văn độc lập ra mắt sách nói và "đưa sách nói dễ tiếp cận hơn với tất cả".

Google cũng đang cung cấp một dịch vụ tương tự, được gọi là "tường thuật tự động".

Ông Abramov nói: “Giọng đọc của AI mở ra cơ hội cho những cuốn sách cũ chưa bao giờ được chuyển đổi và tất cả cuốn sách trong tương lai thường không được chuyển đổi vì vấn đề lợi nhuận". Doanh nhân này cũng ghi nhận thêm, với mức phí trả cho giọng đọc của con người, chỉ khoảng 5% tổng số sách được chuyển thành sách nói.

Giá trị của giọng nói con người

"Bản chất của kể chuyện là dạy con người cách làm người. Và chúng tôi cảm thấy rằng điều đó không bao giờ nên được trao cho máy móc", Emily Ellet, một chuyên gia thu âm cho sách nói và cũng là người đồng sáng lập Hiệp hội thu âm sách nói (PANA) cho biết.

Bà Emily chia sẻ: “Việc kể chuyện vẫn nên dựa hoàn toàn vào con người vì khi so sánh với bản ghi âm của con người, một sản phẩm AI ‘thiếu khả năng kết nối cảm xúc’".

Tác giả khoa học viễn tưởng và giả tưởng người Ấn Độ Mimi Mondal, người đã nhận được đề cử Giải thưởng Nebula lần thứ hai cho tuyển tập Dungeons & Dragons Journeys Through the Radiant Citadel, cho biết bà “rất phấn khích” trước khái niệm về sách nói do AI kể lại và tương lai của khoa học viễn tưởng đang phát triển mạnh. Tuy nhiên, bà thừa nhận sẽ không giới thiệu hoặc mua những cuốn sách như vậy nếu điều đó khiến con người bị bỏ qua.

Bà chia sẻ: “Về mặt kỹ thuật, đó không phải là lỗi của AI. Chính chúng ta đang đưa nó vào một thế giới bất bình đẳng và biến nó thành một công cụ áp bức khác”.

Về phần mình, bà Emily cũng lo ngại rằng công chúng sẽ quen với giọng đọc do máy tạo ra, "và tôi nghĩ đó là điều đang diễn ra một cách lặng lẽ". Mong muốn của bà Emily chỉ đơn giản là "các công ty sẽ cho người nghe biết họ đang nghe một tác phẩm do AI tạo ra... Tôi chỉ muốn mọi người thành thật về điều đó".