شاهد: Seedance 2.0 يولّد صوتًا متزامنًا أصليًا - بدون معالجة لاحقة
مزامنة سمعية بصرية أصلية
نهاية عصر الذكاء الاصطناعي الصامت
بُني Seedance 2.0 على محوّل انتشار ثنائي الفرع (Dual-Branch Diffusion Transformer) يولّد الفيديو والصوت في آنٍ واحد عبر جسر انتباه مشترك. على عكس كل نموذج منافس يضيف الصوت كخطوة معالجة لاحقة منفصلة، ينمّي Seedance 2.0 الصوت جنبًا إلى جنب مع الصورة. والنتيجة هي مزامنة مثالية على مستوى الإطار: الزجاج يتحطم في اللحظة الدقيقة لاصطدامه بالأرض، والخطوات تتطابق مع مادة السطح، والحوار يتوافق مع حركات الشفاه. هذا يلغي خط أنابيب إنتاج الصوت بالكامل.
