ایتا - 🌿••[هومص]••|°هوش مصنوعی°|

🌿••[هومص]••|°هوش مصنوعی°|

گوگل از نسل سوم مدلهای زبانی متن بازش موسوم به Gemma رونمایی کرده که علاوه بر ورودیهای متنی، دارای پشتیبانی از ورودیهای تصویری و ویدیویی تنها با یک مدل هستن، از 140 زبان از جمله فارسی پشتیبانی میکنن، Context window اونها 128 هزار توکن هست و در تستهایی مثل LMArena از مدلهای بسیار بزرگتر نظیر Llama-405B و DeepSeek-V3 عملکرد بهتر با مصرف منابع کمتر دارن. 

مدلهای Gemma 3 در 4 سایز 1، 4، 12 و 27 میلیارد پارامتری عرضه میشن و با Ollama میشه به صورت افلاین روی کامپیوتر از اونها استفاده کرد. به صورت انلاین هم میتونین اونهارو در Google AI Studio ازمایش کنید. 

➖➖➖➖➖
🗳@hoomas

118 مشاهده02:59

🌿••[هومص]••|°هوش مصنوعی°|

0:17

فعلا قابلیت پخش رسانه در مرورگر فراهم نیست

مشاهده در پیام رسان ایتا

شرکت Sesame که چند وقت پیش به خاطر لحن بسیار طبیعی مدل صوتی خودش تعجب همگان رو برانگیخته بود، بالاخره مدلش رو متن باز کرده و حالا کاربران به صورت رایگان و افلاین میتونن از اون برای کاربردهای مختلف تبدیل متن به صوت استفاده کنن. 

مدلی که متن باز شده 1 میلیارد پارامتر داره که در مقایسه با مدلی که در سایت این شرکت استفاده میشه و 8 میلیارد پارامتر داره طبیعتا ضعیفتره ولی از هیچی بهتره و برای اجرای اون نیاز به کارت گرافیک انویدیا با حداقل 5 گیگ VRAM هست. علاوه بر این مثل نسخه سایت شخصیت خاصی نداره و برای اینکه صدای بخصوصی داشته باشه باید جداگانه Fine Tune بشه.

این مدل رو میتونید از اینجا دانلود کنید و از اینجا به صورت انلاین میشه نسخه متن باز اون رو ازمایش کرد. نسخه اصلی اون هم در سایت این شرکت قابل ازمایشه.

➖➖➖➖➖
🗳@hoomas

97 مشاهده03:03

🌿••[هومص]••|°هوش مصنوعی°|

0:35

فعلا قابلیت پخش رسانه در مرورگر فراهم نیست

مشاهده در پیام رسان ایتا

0:41

فعلا قابلیت پخش رسانه در مرورگر فراهم نیست

مشاهده در پیام رسان ایتا

گوگل قابلیت Deep Research برای انجام تحقیقات عمیق در مورد موضوعات مختلف توسط هوش مصنوعی جمنای رو رایگان کرده و از این به بعد کاربران بدون نیاز به داشتن اشتراک Gemini Advanced هم میتونن چند بار در ماه از این قابلیت بهره مند بشن. 

گوگل مدلی که برای این قابلیت استفاده میکنه رو هم بهبود داده و حالا از مدل Gemini 2.0 Flash Thinking برای اون استفاده میکنه که باعث افزایش دقت و کیفیت تحقیقات انجام شده توسط این مدل میشه. 

این شرکت همچنین قابلیت Gems رو که مثل GPTها در ChatGPT، امکان ساخت نسخه سفارشی از هوش مصنوعی جمنای رو فراهم میکنن رو هم رایگان کرده.

بدین صورت وقتی کاربران از این مدل برای انجام کارهای تکراری، مثلا به عنوان مترجم زبان خاصی، استفاده میکنن، به جای اینکه هر بار در شروع مکالمه پرامپتی برای ترجمه بنویسن، میتونن یک Gem با پرامپت مدنظرشون بسازن و در بارهای بعد هر وقت از این Gem استفاده میکنن، اون پرامپت به طور خودکار در حافظه جمنای قرار میگیره و فقط کافیه متن موردنظرشون برای ترجمه رو بفرستن.

علاوه بر این جمنای قابلیت شخصی سازی جوابهارو هم اضافه کرده و با دادن اجازه به اون، این هوش مصنوعی میتونه با دسترسی به جستجوهای اخیر شما در گوگل، جوابهایی شخصی سازی شده و مطابق نیاز شما به درخواستها و سوالات بده.

این قابلیتها از حالا به صورت رایگان از gemini.google.com قابل استفاده هستن.

➖➖➖➖➖
🗳@hoomas

103 مشاهده03:07

🌿••[هومص]••|°هوش مصنوعی°|

0:41

فعلا قابلیت پخش رسانه در مرورگر فراهم نیست

مشاهده در پیام رسان ایتا

گوگل همچنین بالاخره قابلیت ساخت عکس با هوش مصنوعی Gemini 2.0 Flash رو هم فعال کرده که قابلیتهای متمایزی نسبت به دیگر مدلهای ساخت عکس داره. 

برخلاف دیگر هوش مصنوعیها از جمله میدجرنی و فلاکس که مدل diffusion هست، گوگل یکی از اولین شرکتهایی که مدل ساخت عکس رو برای یک مدل زبانی بزرگ (LLM) فعال کرده به طوری که وقتی ازش خواسته بشه که عکس بسازه، این هوش مصنوعی به مدل دیگه ای که برای ساخت عکس طراحی شده، وصل نمیشه بلکه خودش ذاتا امکان تولید عکس رو داره. 

چنین قابلیتی به این مدل امکانات متمایزی میده که از جمله اونها این هست چون یک مدل LLM هست، اطلاعاتی زیادی در مورد جهان داره و دستورات متنی کاربر رو خیلی بهتر از دیگر مدلها میتونه متوجه بشه و دقت بالایی در ساخت عکسها براساس پرامپت کاربر داره. 

علاوه بر این در ایجاد تغییرات روی یک عکس ورودی هم بهتر از بقیه عمل میکنه به طوری که وقتی ازش خواسته میشه یک دستور پخت غذا رو بنویسه، این مدل میتونه برای هر مرحله اون عکس قبلی رو تغییر بده و فقط موادی که به اون غذا در هر مرحله اضافه میشه رو به عکس اضافه کنه.

همچنین در ساخت تصاویر با نوشته های طولانی هم خوب عمل میکنه و این نوشته ها عمدتا غلطهای املایی کمتری نسبت به بقیه مدلها دارن. 

این هوش مصنوعی از حالا به صورت رایگان از طریق پلتفرم Google AI Studio با انتخاب مدل Gemini 2.0 Flash Experimental و قرار دادن output format روی images and text قابل استفاده هست.

➖➖➖➖➖
🗳@hoomas

97 مشاهده03:10

🌿••[هومص]••|°هوش مصنوعی°|

🔻مدیرعامل انتروپیک: هوش مصنوعی تا یک سال دیگر کاملاً جایگزین برنامه‌نویسان می‌شود

🔸«دارو آمودی»، مدیرعامل شرکت انتروپیک (Anthropic) و خالق چت‌بات Claude، پیش‌بینی جسورانه‌ای درباره آینده دنیای مهندسی ارائه کرده است. او معتقد است که #هوش_مصنوعی تا ۶ ماه آینده قادر خواهد بود ۹۰ درصد از تمام کدهای برنامه‌نویسی را بنویسد و تا یک سال آینده ۱۰۰ درصد کدها توسط این فناوری نوشته خواهد شد.

🔸آمودی با اشاره به پیشرفت سریع ابزارهایی مانند GitHub Copilot و Claude Code (محصول خود شرکت Anthropic)، ادعا کرده که این فناوری‌ها به سرعت در حال پیشرفت هستند و به زودی قادر خواهند بود تا ۱۰۰ درصد کدنویسی را انجام دهند.

➖➖➖➖➖
🗳@hoomas

1 مشاهده03:19

🌿••[هومص]••|°هوش مصنوعی°|

هدف بلندپروازانه ایلان ماسک؛ تله‌پاتی و کنترل اشیا با ذهن به کمک تراشه نورالینک

🔸شرکت نورالینک متعلق به ایلان ماسک، با ثبت علائم تجاری «تلپاتی» و «تِلِکینِسیس» در آمریکا، قدمی جسورانه به سوی آینده‌ای برداشته که تا دیروز فقط در فیلم‌های علمی‌تخیلی می‌دیدیم!

🔸تلپاتی قرار است به افراد معلول کمک کند تا تنها با فکر کردن، دستگاه‌ها را کنترل کنند، بدون نیاز به دست یا صدا. اما این همه ماجرا نیست؛ نورالینک به دنبال ایجاد ارتباط ذهن به ذهن بین انسان‌هاست. تصور کنید بتوانید بدون حرف زدن، فقط با ذهن‌تان با دیگران ارتباط برقرار کنید!

🔸تِلِکینِسیس هم قرار است ما را به رویای کنترل اشیاء با ذهن نزدیک‌تر کند. هدف اولیه، کمک به افرادی است که محدودیت‌های حرکتی دارند؛ اما آینده‌ای را تصور کنید که در آن فقط با فکر کردن، بتوانید چراغ‌ها را روشن کنید یا حتی یک فنجان قهوه را جا‌به‌جا کنید.

➖➖➖➖➖
🗳@hoomas

1 مشاهده03:23

مطالب بعدی

پرسش‌ها

قوانین

داغ‌ترین‌ها

چندسکویی