گوگل از نسل سوم مدلهای زبانی متن بازش موسوم به Gemma رونمایی کرده که علاوه بر ورودیهای متنی، دارای پشتیبانی از ورودیهای تصویری و ویدیویی تنها با یک مدل هستن، از 140 زبان از جمله فارسی پشتیبانی میکنن، Context window اونها 128 هزار توکن هست و در تستهایی مثل LMArena از مدلهای بسیار بزرگتر نظیر Llama-405B و DeepSeek-V3 عملکرد بهتر با مصرف منابع کمتر دارن.
مدلهای Gemma 3 در 4 سایز 1، 4، 12 و 27 میلیارد پارامتری عرضه میشن و با Ollama میشه به صورت افلاین روی کامپیوتر از اونها استفاده کرد. به صورت انلاین هم میتونین اونهارو در Google AI Studio ازمایش کنید.
➖➖➖➖➖
🗳@hoomas
فعلا قابلیت پخش رسانه در مرورگر فراهم نیست
مشاهده در پیام رسان ایتا
شرکت Sesame که چند وقت پیش به خاطر لحن بسیار طبیعی مدل صوتی خودش تعجب همگان رو برانگیخته بود، بالاخره مدلش رو متن باز کرده و حالا کاربران به صورت رایگان و افلاین میتونن از اون برای کاربردهای مختلف تبدیل متن به صوت استفاده کنن.
مدلی که متن باز شده 1 میلیارد پارامتر داره که در مقایسه با مدلی که در سایت این شرکت استفاده میشه و 8 میلیارد پارامتر داره طبیعتا ضعیفتره ولی از هیچی بهتره و برای اجرای اون نیاز به کارت گرافیک انویدیا با حداقل 5 گیگ VRAM هست. علاوه بر این مثل نسخه سایت شخصیت خاصی نداره و برای اینکه صدای بخصوصی داشته باشه باید جداگانه Fine Tune بشه.
این مدل رو میتونید از اینجا دانلود کنید و از اینجا به صورت انلاین میشه نسخه متن باز اون رو ازمایش کرد. نسخه اصلی اون هم در سایت این شرکت قابل ازمایشه.
➖➖➖➖➖
🗳@hoomas
گوگل قابلیت Deep Research برای انجام تحقیقات عمیق در مورد موضوعات مختلف توسط هوش مصنوعی جمنای رو رایگان کرده و از این به بعد کاربران بدون نیاز به داشتن اشتراک Gemini Advanced هم میتونن چند بار در ماه از این قابلیت بهره مند بشن.
گوگل مدلی که برای این قابلیت استفاده میکنه رو هم بهبود داده و حالا از مدل Gemini 2.0 Flash Thinking برای اون استفاده میکنه که باعث افزایش دقت و کیفیت تحقیقات انجام شده توسط این مدل میشه.
این شرکت همچنین قابلیت Gems رو که مثل GPTها در ChatGPT، امکان ساخت نسخه سفارشی از هوش مصنوعی جمنای رو فراهم میکنن رو هم رایگان کرده.
بدین صورت وقتی کاربران از این مدل برای انجام کارهای تکراری، مثلا به عنوان مترجم زبان خاصی، استفاده میکنن، به جای اینکه هر بار در شروع مکالمه پرامپتی برای ترجمه بنویسن، میتونن یک Gem با پرامپت مدنظرشون بسازن و در بارهای بعد هر وقت از این Gem استفاده میکنن، اون پرامپت به طور خودکار در حافظه جمنای قرار میگیره و فقط کافیه متن موردنظرشون برای ترجمه رو بفرستن.
علاوه بر این جمنای قابلیت شخصی سازی جوابهارو هم اضافه کرده و با دادن اجازه به اون، این هوش مصنوعی میتونه با دسترسی به جستجوهای اخیر شما در گوگل، جوابهایی شخصی سازی شده و مطابق نیاز شما به درخواستها و سوالات بده.
این قابلیتها از حالا به صورت رایگان از gemini.google.com قابل استفاده هستن.
➖➖➖➖➖
🗳@hoomas
گوگل همچنین بالاخره قابلیت ساخت عکس با هوش مصنوعی Gemini 2.0 Flash رو هم فعال کرده که قابلیتهای متمایزی نسبت به دیگر مدلهای ساخت عکس داره.
برخلاف دیگر هوش مصنوعیها از جمله میدجرنی و فلاکس که مدل diffusion هست، گوگل یکی از اولین شرکتهایی که مدل ساخت عکس رو برای یک مدل زبانی بزرگ (LLM) فعال کرده به طوری که وقتی ازش خواسته بشه که عکس بسازه، این هوش مصنوعی به مدل دیگه ای که برای ساخت عکس طراحی شده، وصل نمیشه بلکه خودش ذاتا امکان تولید عکس رو داره.
چنین قابلیتی به این مدل امکانات متمایزی میده که از جمله اونها این هست چون یک مدل LLM هست، اطلاعاتی زیادی در مورد جهان داره و دستورات متنی کاربر رو خیلی بهتر از دیگر مدلها میتونه متوجه بشه و دقت بالایی در ساخت عکسها براساس پرامپت کاربر داره.
علاوه بر این در ایجاد تغییرات روی یک عکس ورودی هم بهتر از بقیه عمل میکنه به طوری که وقتی ازش خواسته میشه یک دستور پخت غذا رو بنویسه، این مدل میتونه برای هر مرحله اون عکس قبلی رو تغییر بده و فقط موادی که به اون غذا در هر مرحله اضافه میشه رو به عکس اضافه کنه.
همچنین در ساخت تصاویر با نوشته های طولانی هم خوب عمل میکنه و این نوشته ها عمدتا غلطهای املایی کمتری نسبت به بقیه مدلها دارن.
این هوش مصنوعی از حالا به صورت رایگان از طریق پلتفرم Google AI Studio با انتخاب مدل Gemini 2.0 Flash Experimental و قرار دادن output format روی images and text قابل استفاده هست.
➖➖➖➖➖
🗳@hoomas
🔻مدیرعامل انتروپیک: هوش مصنوعی تا یک سال دیگر کاملاً جایگزین برنامهنویسان میشود
🔸«دارو آمودی»، مدیرعامل شرکت انتروپیک (Anthropic) و خالق چتبات Claude، پیشبینی جسورانهای درباره آینده دنیای مهندسی ارائه کرده است. او معتقد است که #هوش_مصنوعی تا ۶ ماه آینده قادر خواهد بود ۹۰ درصد از تمام کدهای برنامهنویسی را بنویسد و تا یک سال آینده ۱۰۰ درصد کدها توسط این فناوری نوشته خواهد شد.
🔸آمودی با اشاره به پیشرفت سریع ابزارهایی مانند GitHub Copilot و Claude Code (محصول خود شرکت Anthropic)، ادعا کرده که این فناوریها به سرعت در حال پیشرفت هستند و به زودی قادر خواهند بود تا ۱۰۰ درصد کدنویسی را انجام دهند.
➖➖➖➖➖
🗳@hoomas
هدف بلندپروازانه ایلان ماسک؛ تلهپاتی و کنترل اشیا با ذهن به کمک تراشه نورالینک
🔸شرکت نورالینک متعلق به ایلان ماسک، با ثبت علائم تجاری «تلپاتی» و «تِلِکینِسیس» در آمریکا، قدمی جسورانه به سوی آیندهای برداشته که تا دیروز فقط در فیلمهای علمیتخیلی میدیدیم!
🔸تلپاتی قرار است به افراد معلول کمک کند تا تنها با فکر کردن، دستگاهها را کنترل کنند، بدون نیاز به دست یا صدا. اما این همه ماجرا نیست؛ نورالینک به دنبال ایجاد ارتباط ذهن به ذهن بین انسانهاست. تصور کنید بتوانید بدون حرف زدن، فقط با ذهنتان با دیگران ارتباط برقرار کنید!
🔸تِلِکینِسیس هم قرار است ما را به رویای کنترل اشیاء با ذهن نزدیکتر کند. هدف اولیه، کمک به افرادی است که محدودیتهای حرکتی دارند؛ اما آیندهای را تصور کنید که در آن فقط با فکر کردن، بتوانید چراغها را روشن کنید یا حتی یک فنجان قهوه را جابهجا کنید.
➖➖➖➖➖
🗳@hoomas