Sora2-Main-banner

Sora 2: مرز باریک خیال و واقعیت

فهرست مطالب

زمانی که GPT-1 منتشر شد و در دسترس عموم قرار گرفت را به خوبی یادم هست، مدلی انقلابی که دنیای هوش مصنوعی را دگرگون کرد و پس از آن مدل‌ها و چت بات‌های هوش مصنوعی یکی پس از دیگری منتشر شدند و راهی را که این مدل هموار کرده بود، در پیش گرفتند. حالا پس از مدت‌ها Sora 2؛ مدل تولید ویدیو با هوش مصنوعی آمده تا همان تاثیر انقلابی GPT-1 را بگذارد، جایی که دیگر نتوانیم تفاوت واقعیت و خیال را تشخیص دهیم.

Sora 2 چیست؟ از ساخت ویدیو تا ویرایش‌های جنجالی

نسخه جدید Sora، هوش مصنوعی ساخت ویدیوهای واقع گرایانه است که توسط شرکت OpenAI به مدیریت سم آلتمن، توسعه یافته است. نسخه اولیه Sora در اوایل سال 2024 با قابلیت‌های خیره کننده در ایجاد ویدیوهای واقع گرایانه، جهان را شگفت زده کرد اما در تولید صدای بومی و دقیق مشکل داشت. Sora 2 با رفع این کمبودها یک گام فراتر رفته و تجربه‌ای جامع و کامل از داستان سرایی دیداری و شنیداری را ارائه می‌دهد. می‌توانید پرامپتی کوتاه با عنوان “یک آشپزخانه دنج: کتری قرمزی که با بخار می‌جوشد” خروجی دقیقی دریافت کنید که در آن صدای سوت کتری را بشنوید و حتی چروک‌های روی نان را ببینید. گویا همه چیز به طرز معجزه آسایی هماهنگ شده. فیزیک‌ها به درستی کار می‌کنند، صداها کاملا با حالات چهره و اتمسفر هماهنگ هستند و تعادلی مثال زدنی دارند. حالا دیگر هوش مصنوعی آن ابزار تمسخر سالیان پیش نیست، بلکه به فیلم سازی قهار، سورئال و شدیدا دقیق تبدیل شده است.

Sora2-diving

ویژگی‌های کلیدی Sora 2

سورا 2 می‌تواند کارهای خارق العاده‌ای انجام دهد، کارهایی که برای مدل‌های دیگر شدیدا سخت یا حتی غیرممکن هستند. بسیاری از مدل‌های تولید ویدیو بیش از حد خوشبینانه عمل می‌کنند و سعی بر این دارند تا اشیاء یا واقعیت را به شکلی دربیاورند که به چالش بر نخورند. برای مثال یک پرامپت بسکتبالی را در نظر بگیرید، مدل‌های دیگر ممکن است پس از خطا رفتن توپ، اتفاق بعد آن که ریباند باشد را به خوبی نشان ندهند اما در سورا، تمام روند ریباند و فیزیک توپ و زمین به خوبی سوار می‌شود و جلوه‌ای واقعی به ویدیو می‌دهد.  سورای جدید، گامی بزرگ در کنترل پذیری برداشته است و می‌تواند دستورالعمل‌های پیچیده را در چندین نما دنبال کند و در عین حال وضعیت جهان را به طور دقیق حفظ کند. Sora 2 در سبک‌های واقع گرایانه، سینمایی و انیمه فوق العاده است.

هماهنگی بالای صدا و تصویر 

کلیپ‌های Sora حالا می‌توانند صدا و تصویر کاملا هماهنگ داشته باشند. برخلاف نسخه اول که ویدیوهای صامت تولید می‌کرد، Sora 2 قادر است: 

  • دیالوگ: صدای افراد و لیپ سینک را با دقت بسیار بالایی تولید کند.
  • جلوه‌های صوتی: صداهایی مانند برخورد اجسام، صدای موتور یا شکستن شیشه را دقیقا همزمان با عمل مربوطه در ویدیو ایجاد کند. 
  • فضاسازی صوتی: صداهای محیطی مانند باران و صدای شلوغی شهر را متناسب با جو صحنه تولید نماید.

بهبود چشمگیر در فیزیک و واقع گرایی

هوش مصنوعی Sora 2، درک عمیق‌تری از جهان فیزیکی و تعامل اشیاء دارد. این مدل توانایی تولید ویدیوهایی با فیزیک واقع گرایانه‌تر را افزایش داده و موارد زیر را به همراه دارد:

  • پایداری بیشتر: بهبود پایداری تصویر، کاهش لرزش‌ها و آرتیفکت‌های تصویر در طول کلیپ.
  • تعامل منطقی: حرکت و تعامل اشیاء در ویدیو از قوانین فیزیکی دنیای واقعی پیروی می‌کند. 

افزایش کنترل و سازگاری چند صفحه‌ای

تولیدکنندگان محتوا اکنون کنترل بی سابقه‌ای بر روی خروجی دارند، Sora 2 به کاربران اجازه می‌دهد تا:

  • استیل دهی بالا: کنترل بیشتری بر سبک ویدیو (سینما، انیمیشن، واقع گرایانه)، نوع لنز دوربین، نورپردازی و حرکت دوربین داشته باشند.
  • سازگاری طولانی مدت: در ویدیوهای طولانی‌تر (تا 20 ثانیه و حتی بیشتر)، ظاهر شخصیت‌ها و مکان‌ها، حتی با تغییر زوایای دوربین، ثابت باقی بماند. 
  • قابلیت Cameo: یک قابلیت هیجان انگیز که به کاربران اجازه می‌دهد تصویر خود، دوستان یا حیوانات خانگی‌شان را به مدل بدهند تا به عنوان بازیگر در سناریوهای هوش مصنوعی ظاهر شوند و به این ترتیب، محتوا را شخصی سازی کنند.

وضوح و مدت زمان بالاتر

ساخت ویدیو با سورا 2 اکنون می‌تواند وضوحی بالا و کلیپ‌هایی طولانی‌تر را در اختیار شما بگذارد. این کیفیت بالا، Sora 2 را برای استفاده در پلتفرم‌های اجتماعی و همچنین کاربردهای حرفه‌ای تبلیغاتی مناسب می‌سازد.

کد دعوت Sora 2

پس از دیدن این همه ویژگی احتمالا این سوال که چگونه می‌توانم کد دعوت Sora 2 را دریافت کنم؟ برای شما پیش بیاید. برای پیدا کردن کد دعوت Sora 2، می‌توانید راه‌‍‌‎های زیر را امتحان کنید:

  1. دیسکورد: می‌توانید در کانال‌های موجود در Discord جستجو کنید. در کانال sora-invite-codes# کاربران مختلف کدهای دعوت سورا 2 را به اشتراک می‌گذارند.
  2. وب سایت Reddit: ردیت نیز مانند دیسکورد یک جامعه کاربری بسیار فعال دارد. می‌توانید با جستجوی “New Sora 2 invite code megathread” به کدهای دعوتی که توسط کاربران به اشتراک گذاشته شده‌اند دست پیدا کنید.
  3. سرچ در وب سایت X (توییتر قدیم): در وب سایت توییتر، از بخش جستجوی آن استفاده کنید و کوئری‌های “Sora 2 invite code” و “Sora 2 access” را سرچ کنید.

مقایسه Sora 2 با Veo 3 و هوش مصنوعی‌های دیگر

Sora 2 تنها هوش مصنوعی آپدیت شده امسال نبوده و شرکت‌های دیگر نیز برای تولید یک هوش مصنوعی مولد تلاش کرده‌اند در ادامه تفاوت Sora 2 با باقی هوش مصنوعی‌های مولد را بررسی می‌کنیم

مدلSora 2 (مزیت‌ها)ویژگی‌ها / محدودیت‌های مدل رقیبSora 2 در چه مواردی برنده است
Sora 1جهش بزرگ (کاربردی‌تر)فیزیک نامنظم، بدون صدا، تغییر شکل کاراکترها در بین شات‌ها، در حد پیش‌نمایش تحقیقاتی.افزودن صدا، فیزیک بهتر، سازگاری چند-شات، قابلیت Cameo.
Google Veo 3رزولوشن و ثبات بالاترتولید ویدیو تا رزولوشن 720p. نورپردازی و جلوه‌های سینمایی بهتر (نقطه قوت Veo 3).رزولوشن 1080p (در مقابل 720p)، فیزیک/سازگاری بهتر آبجکت‌ها.
Runway Gen-4واقع‌گرایی و سرعت بهترکنترل دقیق: حرکت دوربین شش-محوره، Motion Brush برای انیمیشن انتخابی، In-painting.واقع‌گرایی، تطابق با پرامپت، سرعت تولید، صدای همگام‌سازی شده.

پرامپت‌های Sora 2

سورا 2 مانند یک موبایل بسیار پیشرفته‌ای است که اگر ندانید چگونه با آن کار کنید فقط توانایی استفاده از دوربین ساده‌اش را خواهید داشت. دستورات متنی یا به اصطلاح پرامپت‌‎ها همان اسپل‌های هری پاتری هستند که با گفتنشان جادویی شگفت انگیز اجرا می‌شود. برخی از مثال‌های پرامپت سورا 2:

پرامپت در اتمسفر سایپرپانک Sora 2:

				
					Hyper-speed first-person run through neon-lit cyberpunk city on a futuristic hoverbike. Rain-slick alleys, tunnels, and skyways flash by in electric cyan and magenta light. Camera: wide-angle POV with motion blur and HUD flickers. Intense drum & bass soundtrack, wind rush, engine roars. Fast, cinematic cuts—dodging crates, sliding through tunnels, bursting into open skyways. Climax: final high-speed boost into glowing horizon, fading to black.
				
			

پرامپت کارتونی Sora 2:

				
					In the style of a Japanese anime film, high-quality 2D limited animation with cel shading. A night forest filled with glowing particles, fluttering butterflies, swaying flowers, and shimmering reflections on the water. Amidst this dreamlike scenery, a white-haired girl walks, pauses, and gently interacts with her surroundings. The screen cuts frequently, with both objects and the camera in constant motion. Multi-shot composition: 1. Close-up of the girl's feet as she steps near the water, ripples spreading with light. 2. Side-tracking shot as she walks among glowing flowers, particles and butterflies drifting around her. 3. She stops, reaching out to touch a flower. Petals fall and scatter onto the water. 4. Close-up of her face, a blink, hair swaying gently in the breeze, background light pulsing. 5. Overhead view of the glowing forest and river as she continues walking. 6. She turns back, butterflies sweep across the frame, camera slowly circling. 7. Wide shot, the entire forest bathed in luminous glow.limax: The girl stops, and countless butterflies rise all at once, taking flight into the night sky. The camera follows their ascent, the sky filling with glowing wings, petals, and light particles. The scene is flooded with fantastical radiance before gently fading to black.
				
			

پرامپت مستند Sora 2:

				
					In a 90s documentary-style interview, an old Swedish man sits in a study and says, "I still remember when I was young."
				
			

چگونه در Sora 2 یک پرامپت خوب بنویسیم؟

  • توضیحات خود را لایه سازی کنید: دوربین، تنظیمات، نورپردازی، فیزیک و صدا
  • از اصطلاحات فیلمسازی استفاده کنید: “فیلم 35 میلی متری”، “عمق میدان کم” و “شات ردیابی (Tracking Shot)”
  • تجهیزات را مشخص نمایید: “گرفته شده با دوربین RED”، “استدی کم (Steadicam)”، “نمای هوایی”
  • برای دیالوگ‌ها خط زمانی مشخص کنید.

نمونه‌ای از یک پرامپت خوب که در آن زاویه دوربین، نورپردازی و زمینه مشخص شده است:

				
					Camera shot: wide shot, low angle
Depth of field: shallow (sharp on subject, blurred background)
Lighting + palette: warm backlight with soft rim
				
			

پرامپت با دیالوگ در Sora 2:

				
					A cramped, windowless room with walls the color of old ash. A single bare bulb dangles from the ceiling, its light pooling onto the scarred metal table at the center. Two chairs face each other across it. On one side sits the Detective, trench coat draped across the back of his chair, eyes sharp and unblinking. Across from him, the Suspect slouches, cigarette smoke curling lazily toward the ceiling. The silence presses in, broken only by the faint hum of the overhead light.
Dialogue:
- Detective: "You’re lying. I can hear it in your silence."
- Suspect: "Or maybe I’m just tired of talking."
- Detective: "Either way, you’ll talk before the night’s over."
				
			

ترس هالیوود و صنعت فیلمسازی از Sora 2

با انتشار مدل جدید OpenAI، موج جدیدی از ترس و اضطراب در پیکر نویسندگان، موسیقی سازان و فیلمسازان به راه افتاده است که نوید از یک دگرگونی بزرگ می‌دهد. با اینکه هوش مصنوعی هنوز راه زیادی برای رسیدن به اینچنین استقلال و خلاقیتی دارد اما به طرز سرسام آوری در حال پیشرفت است و این پیشرفت اعتراضات بسیاری را در پی داشته است. احتمالا آن موج اعتصابی نویسندگان هالیوود در واکنش به هوش مصنوعی را به یاد داشته باشید، موجی که باعث شد انتشار بسیاری از فیلم‌ها و سریال‌ها به تاخیر بیفتد و کار سینما‌ها مختل شود. با ظهور Sora 2 دور از انتظار نیست که اینچنین اعتصابی برای به توافق رسیدن بین نویسندگان و OpenAI باز هم اتفاق بیفتد.

جمع بندی

Sora 2 نه تنها نقطه عطفی در تاریخ هوش مصنوعی است، بلکه ابزاری است که فاصله بین ایده و ویدیو را به شکل بی سابقه‌ای کاهش می‌دهد. Sora 2 با افزودن قابلیت Cameo، شبیه سازی بهتر فیزیک و افزایش چشمگیر کنترل بر خروجی در حال تبدیل شدن به یک استودیوی فیلم سازی مجازی در جیب هر خالقی است. این مدل آینده‌ای را نوید می‌دهد که در آن هر کس با یک ایده می‌تواند داستانی زیبا خلق کند. 

سوالات متداول

Sora 2 فعلا محدود است و فقط در کشورهای آمریکا و کانادا قابلیت استفاده دارد. برای استفاده آن باید کد دعوت و یا اشتراک GPT Pro داشته باشید.

با توجه به قابلیت Cameo و واقع گرایی بالای آن، نگرانی‌هایی در مورد تولید ویدیوهای فریبنده، جعل هویت و انتشار اخبار نادرست وجود دارد. OpenAI با اعمال واترمارک‌های متحرک و ابرداده‌های C2PA بر روی خروجی‌ها، در تلاش است تا با این موضوع مقابله کند.

خیر، در حال حاضر این مدل با دسترسی محدود و مدل قیمت گذاری پرداخت به ازای هر ثانیه قابل استفاده است.

منابع

  • https://openai.com/index/sora-2/

به این مقاله امتیاز دهید!

میانگین امتیاز 4.2 / 5. تعداد رأی ها : 5

هنوز هیچ رأیی داده نشده. اولین نفر باشید!

اشتراک گذاری در تلگرام اشتراک گذاری در لینکدین اشتراک گذاری در ایکس کپی کردن لینک پست

و در ادامه بخوانید

دیدگاه (2)

  • آواتار کاربر
    آنیتا

    آقای نوروزی به واسطه قلم خوب و زیباتون دنبال کردن جدیدترین اخبار دنیای تکنولوژی که شاید درکشون زمان زیادی ببره آسون شده، علاوه بر اینکه همیشه از روندی که برای بیان موضوع دارید لذت می‌برم. ممنون از شماا**

    ۲۳ مهر ۱۴۰۴
    • آواتار کاربر
      آقای نوروزی

      سلام و درود، خیلی ممنونم ازتون

      ۲۶ مهر ۱۴۰۴

دیدگاه خود را اضافه کنید

برچسب ها

هوش مصنوعی