🔴هوش مصنوعی مرموز Nano-Banana خبرساز شد؛ تولید و ویرایش عکس با دقتی خیرهکننده
🔸در دنیای پرسرعت #هوش_مصنوعی ، یک مدل جدید و مرموز برای تولید و ویرایش تصویر با نام Nano-Banana ظهور کرده که با عملکرد خیرهکننده خود، توجه جامعه فناوری را جلب کرده است. این مدل بدون هیچگونه معرفی رسمی و در پلتفرم LMArena مشاهده شده است و میتواند دستورات متنی پیچیده را درک و با دقت بالایی تصاویر را ویرایش کند.
🔸برخلاف مدلهای مشهور، Nano-Banana با کمپینهای تبلیغاتی معرفی نشد؛ بلکه بیسروصدا در بخش ویرایش تصویر پلتفرم LMArena ظاهر شد. البته طولی نکشید که کاربران با به اشتراکگذاشتن خروجیهای جالب، از توانایی بینظیر آن در دنبالکردن دستورات پیچیده تعجب کردند. برای مثال، این مدل قادر است دستورات چندمرحلهای مانند «شخصیت پایینی را به شخصیت 2B از بازی Nier: Automata و شخصیت بالایی را به Master Chief از بازی Halo تبدیل کن» را با دقتی خیرهکننده اجرا کند، و نورپردازی، پرسپکتیو و ترکیببندی کلی صحنه را دستنخورده باقی بگذارد.
🔸عملکرد فوقالعاده مدل Nano-Banana باعث شده تا گمانهزنیهای زیادی درمورد هویت سازنده آن شکل بگیرد. اگرچه هیچ شرکتی رسماً اعلام نکرده که این مدل را ساخته، اما قویترین نظریه این است که Nano-Banana یک پروژه مخفی متعلق به گوگل است، آن هم به دو دلیل: اول، کیفیت و بافت تصاویر تولیدشده شباهت زیادی به مدلهای Imagen و Gemini گوگل دارد؛ و دوم، گوگل سابقهای طولانی در استفاده از نام میوهها به عنوان اسم رمز برای پروژههای داخلی خود دارد.
#AI #Nano_Banana
🇮🇷https://eitaa.com/science_ai
💢 رقیبی برای فتوشاپ؛ هوش مصنوعی جدید علیبابا ویرایش دقیق تصاویر را ساده میکند
🔸تیم #هوش_مصنوعی Qwen علیبابا از یک مدل هوش مصنوعی متنباز جدید به نام Qwen-Image Edit رونمایی کرد. این ابزار قدرتمند قادر است تنها با دریافت دستورات متنی ساده، طیف وسیعی از ویرایشهای پیچیده را که پیشازاین در انحصار نرمافزارهای حرفهای مانند فتوشاپ بود، در چند ثانیه انجام دهد. این مدل به صورت متنباز منتشر شده است.
🔸قدرت Qwen-Image Edit ریشه در مدل مادر خود، Qwen-Image، دارد که به دلیل توانایی بینظیرش در رندرکردن متون پیچیده به زبانهای چینی و انگلیسی شهرت یافته بود. این مدل جدید از یک معماری هوشمندانه «رمزگذاری دوگانه» (Dual Encoding) بهره میبرد. این یعنی تصویر ورودی بهطور همزمان به دو بخش مختلف از هوش مصنوعی فرستاده میشود: یکی برای درک معنای کلی صحنه و دیگری برای حفظ جزئیات بصری و سبک تصویر اصلی. این رویکرد به مدل اجازه میدهد تا دو نوع ویرایش کاملاً متفاوت را با دقتی خیرهکننده انجام دهد.
#AI
🇮🇷https://eitaa.com/science_ai
منابع اصلی اطلاعاتی هوش مصنوعی
https://B2n.ir/hu6615
🇮🇷https://eitaa.com/science_ai
افزایش ۶۰ درصدی پاکسازی پلاستیکها از اقیانوسها با یافتن کارآمدترین مسیر برای کشتیهای جمعآوری پلاستیک در محیط پویای اقیانوس توسط هوش مصنوعی
🇮🇷https://eitaa.com/science_ai
سیستم هوش مصنوعی یوتیوب برای تخمین سن چه تاثیری روی کانال شما دارد؟
https://tubers.academy/ai-powered-age-estimation/
🇮🇷https://eitaa.com/science_ai
🤖مدل هوش مصنوعی دیپسیک V3.1 با پنجره محتوایی بزرگتر منتشر شد
🔸شرکت چینی #دیپ_سیک نسخه 3.1 مدل بزرگ زبانی خود را معرفی کرد که با افزایش طول پنجره متنی تا ١٢٨ هزارتوکن و افزایش تعداد پارامترها به ۶٨۵ میلیارد، توانایی پردازش و عملکرد مدل را بهشکل قابل توجهی بهبود داده است.
🔸ویژگی متمایز دیپسیک V3.1، توانایی مدیریت متنهای طولانی است؛ این مدل اکنون قادر است اطلاعات معادل یک کتاب ٣٠٠ تا ۴٠٠ صفحهای را پردازش کند. این قابلیت باعث بهبود عملکرد در تولید محتوای طولانی، تحلیل اسناد و انجام مکالمات چندمرحلهای میشود. شرکت اعلام کرده که این امکان پیشتر در نسخه داخلی V3 وجود داشت، اما اکنون در تمامی رابطها بهطور رسمی فعال شده است.
🔸مدل DeepSeek 3.1 همچنان بر پایه معماری Mixture-of-Experts (MoE) ساخته شده است و فقط ٣٧ میلیارد پارامتر در هر توکن فعال میشود. این مدل از فرمتهای مختلف دقت شامل BF16 ،FP8 و F32 پشتیبانی میکند تا در محیطهای متنوع انعطافپذیری بیشتری داشته باشد. توسعهدهندگان میتوانند از طریق API یا از طریق Hugging Face به این مدل دسترسی پیدا کنند.
#AI #DeepSeek
🇮🇷https://eitaa.com/science_ai