Tuần cuối tháng 3, Internet Trung Quốc lần đầu tiên trở nên sôi động sau một thời gian dài vì Châu Kiệt Luân phát hành album mới "Son of the Sun". Ngay khi album được phát hành đã có rất nhiều sự phấn khích. Các nhà phê bình âm nhạc chỉ trích cách sắp xếp, những người qua đường than thở rằng giọng hát đã bị thoái hóa và người hâm mộ cho rằng giai điệu vẫn giữ nguyên hương vị. Đoạn video ngắn chứa đầy những bản cover và sáng tạo lại, đồng thời số lượt phát các bài hát cũ cũng tăng lên.

Ngoài bản thân album, đây là một hiện tượng hiếm thấy trong làng âm nhạc truyền thống.

Hãy tưởng tượng, lần cuối cùng album mới của một ca sĩ gây ra một cuộc thảo luận lớn và mọi người đầu tư tiền bạc cũng như sự chú ý xung quanh một "con người" cụ thể, những sai sót và tranh cãi sau đó là khi nào... Đó là khi nào?


Từ album đến nhà phê bình âm nhạc đến AI Sản xuất âm nhạc đã bắt kịp làn sóng lưu lượng truy cập này|Nguồn: bilibili

Chỉ trong cùng một tuần, một mẩu tin khác gần như đã bắt kịp đã không thoát khỏi vòng tròn. Nền tảng tạo nhạc AI Suno đã ra mắt phiên bản V5.5, được coi là “bản cập nhật lớn nhất trong lịch sử”.

Trong khi mắt chúng ta vẫn đang tập trung vào ông hoàng làng nhạc Trung Quốc thì giới truyền thông công nghệ nước ngoài đang dõi theo sự “tràn ngập” của ngành công nghiệp âm nhạc AI. Một từ đã bắt đầu được sử dụng thường xuyên trong ngành:

AI Slop (AI Slop) ”.

Dữ liệu từ nền tảng truyền thông trực tuyến Deezer cho thấy hiện bổ sung khoảng 50.000 bài hát AI thuần túy vào nền tảng này mỗi ngày, chiếm 34% tổng số bài hát mới phát hành .

Một bên là những sự kiện văn hóa có thể cảm nhận được, những cuộc thảo luận, những cảm xúc và kỷ niệm mà album mới của Châu Kiệt Luân mang lại; mặt khác, nó giống như dòng nước ngầm dưới sóng, lấp đầy các lỗ rỗng của nền tảng.

Hai quỹ đạo hoàn toàn khác nhau giao nhau trong ngành công nghiệp âm nhạc hiện tại.

AI tràn lan, tiêu diệt tất cả sinh vật trong ngành

AI Tôi thậm chí còn không nghĩ đến việc giết Jay Chou. Nó bỏ qua ánh đèn sân khấu và đi vào hệ thống từ phía bên kia.

Nếu chuyển góc nhìn từ “công việc” sang “hệ thống”, bạn sẽ thấy rằng phản ứng của ngành công nghiệp âm nhạc đối với âm nhạc AI không hề hỗn loạn. Thay vào đó, nó tạo thành nhiều lớp trong một khoảng thời gian ngắn.

Trò chơi “tiêu chuẩn kép” của gã khổng lồ thu âm

Bề ngoài, thủ đô âm nhạc truyền thống đang trong cuộc chiến quyết định với AI.

RIAA (Hiệp hội Công nghiệp Ghi âm Hoa Kỳ), đại diện cho ba công ty thu âm lớn là Universal, Sony và Warner, đã khởi động một vụ kiện chuyên sâu chống lại Suno và Udio. Cáo buộc cốt lõi là họ đã sử dụng một lượng lớn âm nhạc để đào tạo người mẫu mà không được phép.

Theo The Verge, các hãng thu âm tin rằng các hệ thống này “sao chép và tiếp thu các tác phẩm âm nhạc” và sử dụng chúng để tạo ra nội dung mới. Số tiền được yêu cầu trong loại trường hợp này, được tính dựa trên một đơn vị, với mức tối đa là 150.000 USD cho mỗi tác phẩm vi phạm .

Nếu chỉ nhìn vào những hành động này, rất dễ kết luận rằng "ngành công nghiệp đang chống lại AI", nhưng đây chỉ là một nửa sự thật.

Nửa thực tế còn lại là ngay khi Universal Music quay trở lại, họ đã ngồi vào bàn đàm phán với những gã khổng lồ công nghệ như NVIDIA để thảo luận về việc cùng phát triển các mô hình âm nhạc AI tuân thủ và tùy chỉnh riêng.


AI Ứng dụng trong ngành âm nhạc luôn là "mơ hồ"|Nguồn: Rolling Stone

Vậy mấu chốt là không "có dùng được không" mà là "ai dùng được". Những gã khổng lồ không muốn loại bỏ AI, họ muốn loại bỏ “các công cụ AI dân sự”.

Bởi vì các công cụ có sẵn cho tất cả mọi người có nghĩa là bất kỳ ai cũng có thể tạo ra các tác phẩm gần với tiêu chuẩn công nghiệp với chi phí thấp, điều này sẽ trực tiếp làm giảm bớt sự khan hiếm của các công ty thu âm. Lấy lại quyền độc quyền sản xuất là lời kêu gọi cốt lõi của gã khổng lồ thu âm.

Suy nghĩ của những gã khổng lồ kỷ lục này là vì AI không thể giải quyết được nên tốt hơn là nên xây dựng tiêu chuẩn kép và phân tầng ngành.

Lớp trên là "lớp bản quyền có giá trị cao" , nơi có những nghệ sĩ hàng đầu, rào cản bản quyền, mô hình đào tạo tư nhân của các công ty thu âm và quyền định giá tuyệt đối.

Lớp dưới là "lớp cung cấp vô hạn" , cho phép AI bắt chước "âm nhạc lớp trên" và tạo ra nhạc AI với chi phí rất thấp.

Nền tảng truyền thông trực tuyến kiểm soát đường ống phân phối đã đưa ra lựa chọn dựa trên nền tảng kinh doanh của chính mình trước tình trạng nước ngày càng đục trong đường ống.

Âm nhạc phải là một loại hàng hóa hoặc một tác phẩm

Nền tảng truyền thông trực tuyến là vai trò đáng xấu hổ nhất khi đối mặt với âm nhạc AI.

Họ không chỉ phải đối mặt với cơn lũ AI mà còn phải giải quyết tài khoản với chủ sở hữu bản quyền dựa trên số lượng vở kịch, đồng thời họ cũng phải giải quyết những nghi ngờ từ người nghe và nhạc sĩ. Phản hồi của các nền tảng khác nhau phụ thuộc phần lớn vào hoạt động kinh doanh của họ.

Spotify chọn ngồi trên hàng rào. Trước làn sóng âm nhạc AI tràn vào, ưu tiên hàng đầu của nó là giải quyết các vấn đề "kẻ mạo danh" và đánh răng. Ví dụ: Spotify từng xóa hàng chục nghìn bài hát do nền tảng AI Boomy tải lên cùng một lúc (chiếm khoảng 7% tổng thư viện nhạc sau này trên nền tảng này). Tuy nhiên, lý do chính thức của việc loại bỏ không phải là "chống lại việc tạo ra AI" mà là do phát hiện "hoạt động lừa đảo" sử dụng robot để tăng cường phát lại trên quy mô lớn.

Vậy điểm mấu chốt của Spotify là nó không thể gian lận tiền bản quyền . Xét cho cùng, Spotify về cơ bản là một công ty công nghệ được điều khiển bởi các thuật toán đề xuất và nguồn cung cấp nội dung càng lớn thì mô hình càng có nhiều không gian để hoạt động.


Một số người hâm mộ âm nhạc phát hiện ra rằng một bài hát mới (AI Produced)|Nguồn: Reddit

Nền tảng âm nhạc châu Âu Phản ứng của Deezer cấp tiến hơn nhiều. Họ đã nói rõ rằng họ muốn phát triển các công cụ phát hiện AI và cố gắng tách nội dung do AI tạo ra khỏi việc phân phối tiền bản quyền. Lập luận nội bộ là cần phải vạch ra ranh giới trong hệ thống hiện có để ngăn các lượt xem do máy tạo ra làm giảm thu nhập của những người sáng tạo thực sự.

Gen âm nhạc mạnh nhưng bản chất vẫn là Apple Music của một hãng công nghệ, chọn giải pháp lấy trung tâm. tiếp tục nhấn mạnh đến cơ chế quản lý và chỉnh sửa thủ công, đồng thời sử dụng sàng lọc thủ công để phòng ngừa các thuật toán. Tuy nhiên, họ không cưỡng lại được âm nhạc AI. Họ đã ra mắt hệ thống "thẻ AI" và cố gắng sử dụng logic phân loại truyền thống để kết hợp các công nghệ mới .

Bandcamp, một nền tảng tập trung vào các nhạc sĩ độc lập, có thái độ quyết đoán nhất. Nó dựa trên mối quan hệ giao dịch trực tiếp giữa người sáng tạo và người nghe. Mạng lưới giao dịch dựa trên sở thích âm nhạc, kết nối 1-1 và nhận dạng công việc nên phải loại trừ hoàn toàn AI, nếu không sự khan hiếm của nền tảng sẽ không còn tồn tại.


Bandcamp Mô hình kinh doanh của nó là người hâm mộ âm nhạc "mua bài hát" trực tiếp từ các nhạc sĩ|Nguồn: Bandcamp

Vì vậy, cuộc chiến giữa các nền tảng về cơ bản là về việc "âm nhạc có nên tồn tại không" một hàng hóa hay một tác phẩm?”

Thuộc tính công nghệ của nền tảng càng mạnh và càng phụ thuộc vào khả năng kiếm tiền từ lưu lượng truy cập thì nền tảng càng có xu hướng tận dụng nguồn cung không giới hạn do AI mang lại. Nền tảng dựa vào khối lượng càng ít thì càng dựa vào sự gắn kết của cộng đồng và hệ sinh thái nhạc sĩ, nó càng cần phải bám sát vào hào quang sáng tạo của con người.

Nhưng cho dù nền tảng được xác định như thế nào thì cách người sáng tạo sống trong đó đã hoàn toàn thay đổi.

Sự xa lánh của người sáng tạo

Những nghệ sĩ hàng đầu được chú ý có đủ vốn và tự tin để nói không với AI.

Vào năm 2024, hơn 200 nhạc sĩ nổi tiếng trong đó có Billie Eilish đã cùng nhau đưa ra một bức thư ngỏ để phản đối gay gắt việc AI “đào tạo săn mồi” các tác phẩm âm nhạc. Ít nhất là trong số những người sáng tạo hàng đầu, ranh giới bản quyền vẫn được coi là điểm mấu chốt không thể phủ nhận.

Người tiên phong như Grimes đã đi đến một thái cực khác. đã chủ động mở nguồn mẫu giọng nói của riêng mình (Elf.Tech) và thông báo rằng miễn là tiền bản quyền được chia thì bất kỳ ai cũng có thể sáng tạo bằng giọng nói của cô ấy .

Hai tiếng nói này to nhất nhưng không thể đại diện cho đa số người trong ngành. Dòng nước ngầm thực sự dâng trào ở đáy và thắt lưng của sự im lặng.

Nhiều nhạc sĩ độc lập giữ im lặng về AI nhưng đã biến nó thành một phần trong quy trình làm việc của họ một cách riêng tư. Họ đã sử dụng AI để chạy băng gốc, tạo các mẫu chuyển tiếp và nhanh chóng xác minh ý tưởng sắp xếp. Những cách sử dụng này hiếm khi được thảo luận công khai nhưng đã trở nên phổ biến trong sản xuất.

Xét cho cùng, trong thời đại phát trực tuyến, tiền bản quyền cho một lần phát lại chỉ bằng vài phần mười xu. Lợi nhuận ít ỏi buộc các nhạc sĩ ở phía dưới phải bắt đầu "chiến thắng theo số lượng".

Khi AI có thể tạo ra các bài hát trong một giây, việc đánh bóng thủ công trở nên tốn nhiều công sức và kém hiệu quả .


Sự đồng hành này Khối lượng phát nhạc rất cao|Nguồn: YouTube

Những thị trường dọc đã từng hỗ trợ một số lượng lớn các nhà sản xuất phòng ngủ, chẳng hạn như Lo-Fi nhịp điệu hỗ trợ giấc ngủ và nhạc nền trong không khí trò chơi hiện là những lĩnh vực bị ảnh hưởng nặng nề nhất bởi "AI swwill". Giá trị thương mại của con người trên những "đường chức năng" như vậy đã bị AI xóa sạch ngay lập tức.

Vấn đề là lớp này cũng phụ thuộc nhiều nhất vào việc được "khám phá".

Trước đây, những người mới đến dựa vào đề xuất của thuật toán truyền thông trực tuyến để tích lũy lượng người nghe ban đầu và hướng tới con đường của các nhạc sĩ chuyên nghiệp. Nhưng khi hàng chục nghìn tác phẩm ổn định, chi phí thấp được thêm vào nền tảng mỗi ngày, thuật toán không phân biệt giữa "tiềm năng con người" và "đầu ra mô hình". Nó chỉ xử lý tỷ lệ nhấp và tỷ lệ giữ chân, đồng thời phân phối doanh thu tương ứng.

Những người sáng tạo cấp cao nhất có lượng khán giả và mức độ hiển thị ổn định, đồng thời mối đe dọa từ AI thay vào đó đã củng cố nhãn hiệu "nghệ sĩ con người" của họ; những kẻ đầu cơ ở phía dưới không có gánh nặng tâm lý và sử dụng AI để sản xuất hàng loạt tiền bản quyền; Trong khi thiếu tiền và sự tiếp xúc, những người sáng tạo tầm trung nghiêm túc với việc viết bài hát không thể tận dụng hoàn toàn AI, cũng như không thể cạnh tranh với năng lực sản xuất của AI, nhưng không gian sống của họ liên tục bị “AI thu hút”.

Không chỉ âm nhạc, đây là vấn đề phổ biến của "sự dịch chuyển AI" trong các ngành nội dung khác nhau.

Khi "âm thanh hay" trở nên rẻ tiền

Trong ngành công nghiệp thu âm nửa thế kỷ qua, bản thân "good-made" đã là một cơ chế sàng lọc.

Độ phức tạp trong cách sắp xếp, tách nhạc cụ và chất lượng hòa âm không trực tiếp quyết định một bài hát hay hay không mà quyết định xem ai có khả năng tạo ra tác phẩm. Phòng thu âm, thiết bị, kỹ sư, những chi phí này khiến hầu hết mọi người không thể tham gia, đồng thời duy trì cơ chế sàng lọc một cách vô hình.

AI đã nhanh chóng xóa bỏ các rào cản đối với các ngành này.

Khi người dùng không có nền tảng lý thuyết âm nhạc có thể tạo ra một bản nhạc có cấu trúc hoàn chỉnh, âm sắc trong trẻo và hòa âm hoàn hảo trong thời gian ngắn chỉ với một vài lời nhắc, "sức mạnh sản xuất" sẽ mất quyền lọc.

Những bản nhạc này có thể không hay, Nhưng vấn đề không phải là những bản nhạc AI này "không đủ hay" mà là chúng "đủ hay" .

Khi loại nội dung "đủ tốt" này xâm nhập vào nền tảng với quy mô hàng chục nghìn mỗi ngày, sự khác biệt ban đầu được thiết lập bằng cách dựa vào năng lực sản xuất sẽ trở nên vô hiệu. “Dễ nghe” không còn là ưu điểm nữa mà giống một cấu hình cơ bản hơn.


Suno V5.5 đã cho phép người dùng huấn luyện người mẫu bằng âm thanh của chính họ |Nguồn: YouTube

Đây là sự lạm phát về mặt thẩm mỹ hoặc "sự cải tiến" về nội dung cấp độ.

Trong tình trạng lạm phát này, hầu hết âm nhạc AI sẽ trở thành “âm nhạc chức năng”, được nhét vào lỗ chân lông của vô số cảnh cụ thể. Nếu nhìn vào "danh sách phát phổ biến" trên nền tảng, bạn sẽ thấy ngày càng có nhiều lượt phát diễn ra trong các tình huống cụ thể như làm việc, học tập, đi lại và thể thao. Trong những cảnh như vậy, nhạc chuyển sang BGM (Nhạc nền) .

Thói quen nghe nhạc của người hiện đại cũng đã thay đổi. Trong thời đại truyền thông trực tuyến hiện nay, ít người vẫn có thể ngồi thẳng lưng, nghe nhạc theo cách của những người đam mê Hi-Fi và lắng nghe thật kỹ cảm giác về không gian cũng như chi tiết âm bội trong một giai điệu.

Đối với hầu hết mọi người, việc đánh giá âm nhạc cũng xảy ra trước khi nhấp vào. Bìa, tiêu đề, thẻ cảnh, đĩa đơn hot hiện nay, đề xuất của biên tập viên, đề xuất thuật toán... việc chọn nhạc đã được xếp xuống dòng thứ hai.


Phương tiện truyền phát trực tuyến phân loại âm nhạc theo “cảnh chức năng”|Nguồn: Apple Music

AI Bạn không cần phải tạo một bài hát nổi tiếng được mọi người yêu thích trên khắp đất nước, bạn chỉ cần tạo ra một đoạn “âm thanh bạn cần nhất lúc này”. Trong trường hợp này, "đẹp và tầm thường" thay thế cho "độc đáo và sắc nét".

Một cuộc khảo sát mới do Deezer và Ipsos cùng công bố ủng hộ nhận định này. Trong thử nghiệm mù, có tới 97% người nghe không thể biết liệu họ đang nghe thấy AI hay sản phẩm do con người tạo ra .

Trong quá trình này, việc lựa chọn và đánh giá bài hát của khán giả đều do AI và thuật toán phối hợp thực hiện.

Logic của thuật toán đề xuất là khuếch đại các tùy chọn hiện có. Nó sẽ chỉ liên tục đẩy các bài hát đến gần hơn với sở thích của thuật toán thay vì khám phá “Jay Chou tiếp theo”. Những tác phẩm có ranh giới không rõ ràng và phong cách không xác định sẽ khó được khuếch đại liên tục trong cơ chế như vậy.

Có lẽ trong tương lai sẽ có hai loại người nghe nhạc. Một chiếc được tích hợp hoàn toàn vào cơ sở hạ tầng của phương tiện truyền phát trực tuyến, được cung cấp bởi các thuật toán và lấp đầy cuộc sống một cách liền mạch bằng âm thanh AI hoàn hảo.

Loại người khác vẫn giữ sở thích âm nhạc cá nhân, chủ động tìm kiếm âm nhạc, đến các địa điểm ngoại tuyến và đón nhận những sáng tạo của con người với những sai sót và sai sót.

Đây là lý do tại sao, Những lời chế giễu và tranh cãi hiện nay xung quanh album mới "Son of the Sun" của Châu Kiệt Luân thực sự có vẻ hơi cổ điển và dễ thương trong thời đại AI .


Người hâm mộ âm nhạc đã sử dụng AI để khôi phục giai điệu ban đầu của Jay Chou|Nguồn: bilibili

AI Nó có thể tạo ra hàng trăm bài hát cho bạn bất cứ lúc nào, chỉ ở mức âm thanh đỉnh cao vào năm 2004, và cách sắp xếp giống hệt bản gốc của "Jay Chou 25 tuổi".

Nhưng trước sự thay đổi hoàn hảo của AI, những sai sót được các nhà phê bình âm nhạc chỉ ra và những tiếc nuối được người hâm mộ nhai lại chính là bằng chứng cho thấy chúng ta vẫn quan tâm đến âm nhạc và con người.

Chỉ là khi bài hát "Children of the Sun", được khôi phục bằng AI về âm thanh đỉnh cao vào năm 2004, vang lên trong tai nghe, tôi đã phải thừa nhận -

Nó thực sự... hay hơn.