تقوم صناعة الموسيقى ببناء التكنولوجيا للبحث عن أغاني الذكاء الاصطناعي
تحقق كابوس صناعة الموسيقى في عام 2023 ، وبدا مثل دريك.
“القلب على جعبتي” ، وهو ثنائي مزيف مقنع بين دريك و The Weeknd ، يرفع ملايين الجداول قبل أن يتمكن أي شخص من شرح من صنعه أو من أين جاء. المسار لم يذهب فقط فيروسي – لقد كسر الوهم بأن أي شخص كان يسيطر.
في التدافع للرد ، تتشكل فئة جديدة من البنية التحتية بهدوء والتي تم تصميمها حتى لا تتوقف عن الموسيقى التوليدية بشكل مباشر ، ولكن لجعلها يمكن تتبعها. يتم تضمين أنظمة الكشف عبر خط أنابيب الموسيقى بأكمله: في الأدوات المستخدمة لتدريب النماذج ، يتم تحميل المنصات التي يتم فيها تحميل الأغاني ، وقواعد البيانات التي تحقوق حقوق الترخيص ، والخوارزميات التي تشكل اكتشافها. الهدف ليس فقط التقاط المحتوى الاصطناعي بعد الحقيقة. إنه لتحديده مبكرًا ، ووضع علامة عليه بالبيانات الوصفية ، ويحكم كيفية تحركه عبر النظام.
يقول مات أديل ، مؤسس الموسيقي AI: “إذا لم تقم ببناء هذه الأشياء في البنية التحتية ، فستطارد ذيلك فقط”. “لا يمكنك الاستمرار في الرد على كل مسار أو طراز جديد – هذا لا يتوسع. أنت بحاجة إلى بنية تحتية تعمل من التدريب من خلال التوزيع.”
الهدف ليس الإزالة ، ولكن الترخيص والتحكم
تظهر الشركات الناشئة الآن لبناء الكشف في سير العمل الترخيص. قامت منصات مثل YouTube و Deezer بتطوير أنظمة داخلية لعلامة الصوت الاصطناعي حيث يتم تحميلها وتشكيل كيفية أسطحها في البحث والتوصيات. تعمل شركات الموسيقى الأخرى – بما في ذلك Magic Audible Magic و PEX و Rightsify و SoundCloud – على توسيع ميزات الكشف والاعتدال والإسناد عبر كل شيء من مجموعات البيانات التدريبية إلى التوزيع.
والنتيجة هي نظام بيئي مجزأ ولكنه سريع النمو للشركات التي تعالج اكتشاف المحتوى الذي تم إنشاؤه من الذكاء الاصطناعى ليس كأداة إنفاذ ، ولكن كبنية تحتية لمخاطر الجدول لتتبع الوسائط الاصطناعية.
بدلاً من اكتشاف موسيقى الذكاء الاصطناعى بعد انتشارها ، تقوم بعض الشركات ببناء أدوات لوضع علامة عليها من اللحظة التي يتم فيها صنعها. تقوم Vermillio و AI الموسيقية بتطوير أنظمة لمسح المسارات النهائية للعناصر الاصطناعية ووضع علامة عليها تلقائيًا في البيانات الوصفية.
يتعمق إطار تتبع Vermillio بشكل أعمق من خلال تقسيم الأغاني إلى السيقان-مثل النغمة الصوتية ، والصياغة اللحن ، والأنماط الغنائية-وإبلاغ الأجزاء المحددة التي تم إنشاؤها من الذكاء الاصطناعى ، مما يسمح لأصحاب الحقوق بالكشف عن المحاكاة على مستوى الجذعية ، حتى لو كان مسارًا جديدًا فقط يحتسك أجزاء من الأصل.
تقول الشركة إن تركيزها ليس عمليات إزالة ، ولكن الترخيص الاستباقي والإصدار المصادق عليه. يتم وضع TraceID كبديل لأنظمة مثل معرف محتوى YouTube ، والذي غالبًا ما يغيب عن التقليد الدقيق أو الجزئي. تقدر Vermillio أن الترخيص المصادق عليه مدعوم من أدوات مثل TraceID يمكن أن ينمو من 75 مليون دولار في 2023 إلى 10 مليارات دولار في عام 2025. في الممارسة العملية ، هذا يعني أن حامل حقوق أو منصة يمكن أن يدير مسارًا نهائيًا من خلال TraceID لمعرفة ما إذا كان يحتوي على عناصر محمية – وإذا كان الأمر كذلك ، فالتعلم بالنظام للترخيص قبل إصداره.
“نحن نحاول تحديد التأثير الإبداعي ، وليس فقط التقاط النسخ.”
بعض الشركات ستذهب إلى أبعد من ذلك إلى بيانات التدريب نفسها. من خلال تحليل ما يذهب إلى نموذج ، فإن هدفهم هو تقدير مقدار المقترضات التي تم إنشاؤها من الفنانين أو الأغاني المحددة. يمكن أن يمكّن هذا النوع من الإسناد ترخيصًا أكثر دقة ، مع الإتاوات على أساس التأثير الإبداعي بدلاً من النزاعات بعد الإصدار. تعكس الفكرة مناظرات قديمة حول التأثير الموسيقي – مثل دعوى “خطوط غير واضحة” – ولكنها تطبقها على الجيل الخوارزمي. الفرق الآن هو أن الترخيص يمكن أن يحدث قبل الإصدار ، وليس من خلال التقاضي بعد الحقيقة.
تعمل الذكاء الاصطناعى الموسيقي على نظام الكشف أيضًا. تصف الشركة نظامها على أنه طبقة عبر الابتلاع والتوليد والتوزيع. بدلاً من تصفية المخرجات ، فإنه يتتبع مصدرًا من النهاية إلى النهاية.
يقول شون باور ، مؤسس الشركة: “يجب ألا يبدأ الإسناد عند الانتهاء من الأغنية – يجب أن تبدأ عندما يبدأ النموذج في التعلم”. “نحن نحاول تحديد التأثير الإبداعي ، وليس فقط التقاط النسخ.”
قام Deezer بتطوير أدوات داخلية للعلامة على المسارات التي تم إنشاؤها بالكامل من الذكاء الاصطناعي عند التحميل وتقليل وضوحها في كل من التوصيات الخوارزمية والتحريرية ، خاصةً عندما يظهر المحتوى غير المرغوب فيه. يقول كبير مسؤولي الابتكار أوريلين هيرولت إنه اعتبارًا من شهر أبريل ، كانت هذه الأدوات تكتشف ما يقرب من 20 في المائة من التحميلات الجديدة كل يوم على أنها تم إنشاؤها بالكامل-أكثر من ضعف ما رأوه في يناير. تظل المسارات التي حددها النظام متاحًا على النظام الأساسي ولكن لا يتم الترويج لها. يقول Hérault إن Deezer تخطط للبدء في وصف هذه المسارات للمستخدمين مباشرة “في غضون بضعة أسابيع أو بضعة أشهر”.
يقول هيراولت: “نحن لسنا ضد الذكاء الاصطناعي على الإطلاق”. “لكن يتم استخدام الكثير من هذا المحتوى بسوء نية – ليس من أجل الخلق ، ولكن لاستغلال المنصة. لهذا السبب نحن نولي الكثير من الاهتمام.”
يؤدي تفريخ DNTP من الذكاء الاصطناعي (لا تقم بتدريب بروتوكول) إلى دفع الكشف حتى في وقت مبكر – على مستوى مجموعة البيانات. يتيح بروتوكول إلغاء الاشتراك للفنانين وحاملي الحقوق تصنيف عملهم على أنه محظور للتدريب النموذجي. في حين أن الفنانين المرئيين لديهم بالفعل إمكانية الوصول إلى أدوات مماثلة ، فإن عالم الصوت لا يزال يلعب اللحاق بالركب. حتى الآن ، لا يوجد إجماع ضئيل حول كيفية توحيد الموافقة أو الشفافية أو الترخيص على نطاق واسع. قد يجبر التنظيم في النهاية القضية ، ولكن في الوقت الحالي ، لا يزال النهج مجزأًا. كان الدعم من شركات تدريب الذكاء الاصطناعى الكبرى غير متناسق ، ويقول النقاد إن البروتوكول لن يكتسب قوة ما لم يحكم بشكل مستقل وعلى نطاق واسع.
يقول درايهيرست: “يجب أن يكون بروتوكول إلغاء الاشتراك غير ربحية ، يشرف عليه عدد قليل من الجهات الفاعلة المختلفة ، ليتم الوثوق به”. “لا ينبغي لأحد أن يثق في مستقبل الموافقة على شركة مركزية غير شفافة يمكن أن تنفد من العمل – أو ما هو أسوأ بكثير.”