الرئيسية

ثورة بصرية جديدة.. غوغل تكشف عن أداة مبتكرة و متقدمة لتوليد الفيديوهات بالذكاء الإصطناعي

هومبريسي فيلال 

أعلنت شركة غوغل، عن إطلاق نموذجها الجديد Veo 3، المخصص لتوليد مقاطع الفيديو باستخدام الذكاء الاصطناعي، و ذلك ضمن منصة Gemini، في أكثر من 159 دولة حول العالم. 

ويُعد هذا الإطلاق خطوة استراتيجية تعكس طموح غوغل في تعزيز حضورها في مجال الذكاء الاصطناعي التوليدي، وتوسيع نطاق أدواتها الإبداعية عالميًا.

النموذج الجديد يتيح للمستخدمين إنشاء مقاطع فيديو قصيرة تصل مدتها إلى 8 ثوانٍ، باستخدام أوصاف نصية بسيطة، ويُتاح حصرًا لمشتركي باقة AI Pro المدفوعة، مع حد أقصى يبلغ 3 مقاطع فيديو يوميًا. 

ويهدف هذا التقييد إلى ضمان جودة التجربة الرقمية الشاملة ومراقبة الأداء الفني والتقني بدقة في المراحل الأولى من الإطلاق، بما يسمح لغوغل بتقييم استقرار النظام وتحسينه تدريجيًا قبل التوسيع الكامل.

Veo 3، الذي تم الكشف عنه لأول مرة خلال مؤتمر Google I/O في مايو الماضي، يُعد نقلة نوعية في أدوات الذكاء الاصطناعي التوليدي، إذ يمكّن المستخدمين من تحويل أفكارهم النصية إلى مشاهد مرئية غنية بالمؤثرات الصوتية والموسيقى التصويرية والحوار التلقائي. 

ويتميّز النموذج بقدرته على إنتاج فيديوهات بدقة عالية واستجابة دقيقة للأوامر، مع دعم فيزياء واقعية تضيف طابعًا سينمائيًا للمحتوى الناتج، وهو ما يجعله مناسبًا لمجالات متعددة كالإعلانات والتعليم والترفيه.

جوش وودوارد، المدير التنفيذي في غوغل، أوضح أن الشركة تعمل حاليًا على دمج إمكانيات إنشاء الصور داخل الفيديوهات، مما سيجعل Gemini منصة متعددة الوسائط بحق. 

وأشار إلى أن هذه الخطوة ستفتح المجال أمام تجارب إبداعية أكثر تكاملًا، تجمع بين النص والصورة والصوت في بيئة واحدة، وتمنح المستخدمين أدوات أكثر مرونة للتعبير البصري.

من جانبه، ألمح ديميس هاسابيس، الرئيس التنفيذي لشركة DeepMind التابعة لغوغل، إلى أن Veo 3 قد يُستخدم مستقبلًا في تطوير ألعاب فيديو تفاعلية، حيث يمكن للنموذج توليد مشاهد ديناميكية قابلة للتخصيص اللحظي، ما يفتح الباب أمام جيل جديد من الألعاب التي تُبنى لحظيًا بناءً على أوامر المستخدم، ويعزز من إمكانات الترفيه التوليدي.

وفي إطار التزامها بالشفافية، أعلنت غوغل أن جميع المقاطع التي يتم توليدها عبر Veo 3 ستتضمن علامة مائية رقمية باستخدام تقنية SynthID، لضمان التمييز بين المحتوى الأصلي والمحتوى المُنتج بالذكاء الاصطناعي.

كما أطلقت الشركة أداة SynthID Detector للمستخدمين الأوائل، مع خطط لتوسيع نطاق استخدامها لاحقًا، في خطوة تهدف إلى تعزيز الثقة في المحتوى الرقمي.

الإطلاق الجديد يعكس توجه غوغل نحو تحويل نموذجها الأساسي Gemini 2.5 Pro إلى نظام عالمي يُحاكي بعض وظائف الدماغ البشري، من خلال دمج النص، الصوت، الصورة، والفيديو في تجربة واحدة متكاملة. 

ويُعد هذا التوجه جزءًا من استراتيجية أوسع تهدف إلى بناء نماذج قادرة على فهم العالم الحقيقي والتفاعل معه بطرق أكثر طبيعية وواقعية، ما يعزز من قدرات الذكاء الاصطناعي في محاكاة الإدراك البشري.

من الناحية العملية، يُتوقع أن يُحدث Veo 3 نقلة نوعية في مجالات صناعة المحتوى، التعليم، التسويق، والترفيه، حيث يمكن للمستخدمين تحويل أفكارهم إلى مشاهد مرئية خلال ثوانٍ، دون الحاجة إلى خبرة تقنية أو أدوات إنتاج معقدة. 

كما يُنتظر أن يُسهم في تمكين صنّاع المحتوى المستقلين من إنتاج مواد مرئية احترافية بتكلفة منخفضة وسرعة فائقة، ما يعزز من فرص الابتكار الفردي والمؤسسي على حد سواء.

في السياق ذاته، يُنظر إلى Veo 3 كأداة استراتيجية في سباق الذكاء الاصطناعي التوليدي، حيث تسعى غوغل إلى ترسيخ مكانتها في مواجهة منافسين مثل OpenAI وMeta وRunway. 

ويبدو أن الشركة تراهن على الجمع بين القوة التقنية وسهولة الاستخدام لتقديم تجربة إبداعية متكاملة، تعيد تعريف العلاقة بين الإنسان والآلة في صناعة المحتوى، وتفتح آفاقًا جديدة للتفاعل البشري مع التكنولوجيا.

اظهر المزيد

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى
إغلاق
إغلاق