ویژگیهای صوتی جدید به API «اوپنایآی» وارد میشوند
- مجموعه: اخبار تکنولوژی

به گزارش ایسنا، شرکت «اوپنایآی»(OpenAI) روز پنجشنبه اعلام کرد که API آن شامل تعدادی ویژگی جدید هوش صوتی خواهد بود و این ویژگیهای جدید برای کمک به توسعهدهندگان در ایجاد اپلیکیشنهایی طراحی شدهاند که میتوانند با کاربران صحبت کنند، رونویسی کنند و گفتوگوها را ترجمه کنند.
به نقل از تککرانچ، مدل جدید «جیپیتی-ریلتایم-۲»(GPT‑Realtime‑2) این شرکت، مدل صوتی دیگری است که برای ایجاد یک شبیهسازی صوتی واقعگرایانه برای گفتوگو با کاربران ساخته شده است. این مدل برخلاف مدل پیشین خود (GPT-Realtime-1.5)، با استدلال سطح GPT‑5 ساخته شده که اوپنایآی میگوید برای رسیدگی به درخواستهای پیچیدهتر کاربران ایجاد شده است.
همچنین، اوپنایآی در حال راهاندازی ویژگی «جیپیتی-ریلتایم-ترنسلیت»(GPT‑Realtime‑Translate) است که برای ارائه خدمات ترجمه در لحظه طراحی شده و از نظر گفتوگو با کاربر همگام است. این ویژگی شامل بیش از ۷۰ زبان ورودی - زبانهایی که میتواند درک کند - و ۱۳ زبان خروجی - زبانهایی که به گوینده منتقل میکند - است.
اوپنایآی یک قابلیت رونویسی جدید به نام «جیپیتی-ریلتایم-ویسپر»(GPT-Realtime-Whisper) را نیز راهاندازی کرده است که امکان تبدیل گفتار به متن زنده را به کاربران میدهد.
این شرکت در توضیح ویژگیهای جدید نوشت: مدلهایی که ما در حال راهاندازی آنها هستیم، در کنار یکدیگر صدا را به صورت در لحظه از تماس و پاسخ ساده به سمت رابطهای صوتی سوق میدهند که واقعاً میتوانند کارآمد باشند، گوش دهند، استدلال کنند، ترجمه کنند، رونویسی کنند و همزمان با پیشروی گفتوگو اقدام کنند.
این بهروزرسانیها برای شرکتهایی سودمند خواهند بود که میخواهند قابلیتهای خدمات مشتریان را گسترش دهند. با وجود این، اوپنایآی خاطرنشان کرد که ویژگیهای جدید آن به طیف گستردهای از حوزهها از جمله آموزش، رسانه، رویدادها و پلتفرمهای خالقان محتوا و موارد دیگر نیز کمک خواهند کرد.
اگرچه این ویژگیها از دیدگاه سازمانی سودمند به نظر میرسند اما میتوانند مورد سوءاستفاده قرار بگیرند. اوپنایآی اعلام کرده است که برای جلوگیری از سوءاستفاده از ویژگیهای جدید خود برای ایجاد هرزنامه، کلاهبرداری یا سایر انواع سوءاستفاده آنلاین، محافظهایی ساخته است. این شرکت اعلام کرد که محرکهای خاصی در سیستم تعبیه شدهاند تا در صورت تشخیص نقض دستورالعملهای محتوای مضر بتوانند گفتوگو را متوقف کنند.










