انقلاب هوش مصنوعی در تولید تصویر؛ GPT Image 1.5 رسماً معرفی شد
- مجموعه: اخبار تکنولوژی

به گزارش گجت نیوز، شرکت OpenAI در اقدامی غافلگیرکننده از جدیدترین پرچمدار خود در حوزه تولید محتوای بصری پرده برداشت. این مدل که با نام مدل GPT-Image 1.5 معرفی شده، قرار است استانداردهای ساخت تصویر را جابهجا کند. طبق گزارش ورج، این مدل نه تنها در درک پرامپتهای پیچیده بسیار دقیقتر از نسلهای قبلی (مانند DALL-E 3) عمل میکند، بلکه در زمینه واقعگرایی و کنترل جزئیات تصویر نیز جهشی بزرگ داشته است.
خداحافظی با متنهای درهمریخته
یکی از بزرگترین ضعفهای مدلهای قبلی، ناتوانی در نوشتن صحیح متن درون تصاویر بود. اما گفته میشود هوش مصنوعی OpenAI در نسخه GPT-Image 1.5 این مشکل را به کلی حل کرده و اکنون کاربران میتوانند پوسترهای تبلیغاتی و لوگوهایی با متنهای کاملاً خوانا و دقیق تولید کنند. البته مشکل با زبان فارسی همچنان دیده میشود!

علاوه بر این، سرعت پردازش در این نسخه به شدت افزایش یافته و تعامل آن با ChatGPT روانتر از همیشه شده است تا کاربران بتوانند با زبان محاورهای، تغییرات دلخواه خود را روی تصاویر اعمال کنند.
رقابت داغ با غولهای گرافیکی
عرضه این مدل جدید، پاسخی مستقیم به پیشرفتهای اخیر رقبایی همچون نانو بنانا (Nano Banana) گوگل، Midjourney و مدلهای متنباز Flux است. OpenAI ادعا میکند که ساخت عکس با هوش مصنوعی توسط این مدل، حالا چنان به واقعیت نزدیک شده که تشخیص آن از عکسهای واقعی برای چشم انسان دشوار خواهد بود. این ابزار به زودی برای کاربران سرویسهای پلاس و اینترپرایز در دسترس قرار خواهد گرفت.










