ایتا - هوش مصنوعی

🔴هوش مصنوعی مرموز Nano-Banana خبرساز شد؛ تولید و ویرایش عکس با دقتی خیره‌کننده

🔸در دنیای پرسرعت #هوش_مصنوعی ، یک مدل جدید و مرموز برای تولید و ویرایش تصویر با نام Nano-Banana ظهور کرده که با عملکرد خیره‌کننده خود، توجه جامعه فناوری را جلب کرده است. این مدل بدون هیچ‌گونه معرفی رسمی و در پلتفرم LMArena مشاهده شده است و می‌تواند دستورات متنی پیچیده را درک و با دقت بالایی تصاویر را ویرایش کند.

🔸برخلاف مدل‌های مشهور، Nano-Banana با کمپین‌های تبلیغاتی معرفی نشد؛ بلکه بی‌سروصدا در بخش ویرایش تصویر پلتفرم LMArena ظاهر شد. البته طولی نکشید که کاربران با به‌ اشتراک‌گذاشتن خروجی‌های جالب، از توانایی بی‌نظیر آن در دنبال‌کردن دستورات پیچیده تعجب کردند. برای مثال، این مدل قادر است دستورات چندمرحله‌ای مانند «شخصیت پایینی را به شخصیت 2B از بازی Nier: Automata و شخصیت بالایی را به Master Chief از بازی Halo تبدیل کن» را با دقتی خیره‌کننده اجرا کند، و نورپردازی، پرسپکتیو و ترکیب‌بندی کلی صحنه را دست‌نخورده باقی بگذارد.

🔸عملکرد فوق‌العاده مدل Nano-Banana باعث شده تا گمانه‌زنی‌های زیادی درمورد هویت سازنده آن شکل بگیرد. اگرچه هیچ شرکتی رسماً اعلام نکرده که این مدل را ساخته، اما قوی‌ترین نظریه این است که Nano-Banana یک پروژه مخفی متعلق به گوگل است، آن هم به دو دلیل: اول، کیفیت و بافت تصاویر تولیدشده شباهت زیادی به مدل‌های Imagen و Gemini گوگل دارد؛ و دوم، گوگل سابقه‌ای طولانی در استفاده از نام میوه‌ها به عنوان اسم رمز برای پروژه‌های داخلی خود دارد.
#AI #Nano_Banana

🇮🇷https://eitaa.com/science_ai

543 مشاهده14:29

هوش مصنوعی

💢 رقیبی برای فتوشاپ؛ هوش مصنوعی جدید علی‌بابا ویرایش دقیق تصاویر را ساده می‌کند

🔸تیم #هوش_مصنوعی Qwen علی‌بابا از یک مدل هوش مصنوعی متن‌باز جدید به نام Qwen-Image Edit رونمایی کرد. این ابزار قدرتمند قادر است تنها با دریافت دستورات متنی ساده، طیف وسیعی از ویرایش‌های پیچیده را که پیش‌ازاین در انحصار نرم‌افزارهای حرفه‌ای مانند فتوشاپ بود، در چند ثانیه انجام دهد. این مدل به صورت متن‌باز منتشر شده است.

🔸قدرت Qwen-Image Edit ریشه در مدل مادر خود، Qwen-Image، دارد که به دلیل توانایی بی‌نظیرش در رندرکردن متون پیچیده به زبان‌های چینی و انگلیسی شهرت یافته بود. این مدل جدید از یک معماری هوشمندانه «رمزگذاری دوگانه» (Dual Encoding) بهره می‌برد. این یعنی تصویر ورودی به‌طور همزمان به دو بخش مختلف از هوش مصنوعی فرستاده می‌شود: یکی برای درک معنای کلی صحنه و دیگری برای حفظ جزئیات بصری و سبک تصویر اصلی. این رویکرد به مدل اجازه می‌دهد تا دو نوع ویرایش کاملاً متفاوت را با دقتی خیره‌کننده انجام دهد.
#AI

🇮🇷https://eitaa.com/science_ai

1.2هزار مشاهده13:52

هوش مصنوعی

منابع اصلی اطلاعاتی هوش مصنوعی
https://B2n.ir/hu6615

🇮🇷https://eitaa.com/science_ai

521 مشاهده21:51

هوش مصنوعی

افزایش ۶۰ درصدی پاک‌سازی پلاستیک‌‌ها از اقیانوس‌ها با یافتن کارآمدترین مسیر برای کشتی‌های جمع‌آوری پلاستیک در محیط پویای اقیانوس توسط هوش مصنوعی
🇮🇷https://eitaa.com/science_ai

509 مشاهده22:17

هوش مصنوعی

سیستم هوش مصنوعی یوتیوب برای تخمین سن چه تاثیری روی کانال شما دارد؟
https://tubers.academy/ai-powered-age-estimation/

🇮🇷https://eitaa.com/science_ai

1 مشاهده22:17

هوش مصنوعی

🤖مدل هوش مصنوعی دیپ‌سیک V3.1 با پنجره محتوایی بزرگ‌تر منتشر شد

🔸شرکت چینی #دیپ_سیک نسخه 3.1 مدل بزرگ زبانی خود را معرفی کرد که با افزایش طول پنجره متنی تا ١٢٨ هزارتوکن و افزایش تعداد پارامترها به ۶٨۵ میلیارد، توانایی پردازش و عملکرد مدل را به‌شکل قابل توجهی بهبود داده است.

🔸ویژگی متمایز دیپ‌سیک V3.1، توانایی مدیریت متن‌های طولانی است؛ این مدل اکنون قادر است اطلاعات معادل یک کتاب ٣٠٠ تا ۴٠٠ صفحه‌ای را پردازش کند. این قابلیت باعث بهبود عملکرد در تولید محتوای طولانی، تحلیل اسناد و انجام مکالمات چندمرحله‌ای می‌شود. شرکت اعلام کرده که این امکان پیش‌تر در نسخه داخلی V3 وجود داشت، اما اکنون در تمامی رابط‌ها به‌طور رسمی فعال شده است.

🔸مدل DeepSeek 3.1 همچنان بر پایه معماری Mixture-of-Experts (MoE) ساخته شده است و فقط ٣٧ میلیارد پارامتر در هر توکن فعال می‌شود. این مدل از فرمت‌های مختلف دقت شامل BF16 ،FP8 و F32 پشتیبانی می‌کند تا در محیط‌های متنوع انعطاف‌پذیری بیشتری داشته باشد. توسعه‌دهندگان می‌توانند از طریق API یا از طریق Hugging Face به این مدل دسترسی پیدا کنند.

#AI #DeepSeek

🇮🇷https://eitaa.com/science_ai

1 مشاهده04:04

مطالب بعدی

پرسش‌ها

قوانین

داغ‌ترین‌ها

چندسکویی