♨️راهنمای MIT برای آموزش کارآمد مدلهای زبانی بزرگ
🔸پژوهشگران MIT و آزمایشگاه MIT-IBM Watson روشی تازه برای پیشبینی کارایی مدلهای زبانی بزرگ (LLM) ارائه کردهاند که میتواند آموزش این مدلها را کمهزینهتر و کارآمدتر سازد. ایده اصلی آن است که بهجای صرف منابع هنگفت برای آموزش مستقیم مدلهای غولپیکر، ابتدا مدلهای کوچکتر با تعداد پارامتر و حجم داده متفاوت آموزش داده شوند و سپس از نتایج آنها برای تخمین رفتار مدلهای بزرگتر استفاده شود.
🔹 میانچکپوینتها اهمیت دارند: به جای اتکا به نتایج نهایی آموزش، تحلیل دادههای ذخیرهشده در طول فرآیند (checkpointها) دقت پیشبینی را افزایش میدهد.
🔸 حذف دادههای پرنویز اولیه: دادههای بسیار ابتدایی آموزش (پیش از پردازش حدود ۱۰ میلیارد توکن) معمولاً خطاهای زیادی دارند و باید کنار گذاشته شوند.
🔹 پنج مدل برای برآورد دقیقتر: پیشنهاد پژوهشگران استفاده از پنج مدل با اندازههای مختلف است تا الگوهای مقیاسیابی قابلاعتمادتر به دست آید.
🔸 راهحل برای محدودیت بودجه: اگر منابع محاسباتی اندک باشد، میتوان تنها یکی از مدلهای کوچکتر را از خانواده هدف ساخت و پارامترهای قوانین مقیاس را از خانوادهای مشابه قرض گرفت. این روش همیشه موفق نیست اما در بسیاری از موارد کارایی دارد.
🔹این چارچوب میتواند به پژوهشگران و صنعت کمک کند منابع پردازشی را بهینه مصرف کنند، مسیر آموزش را پیشاپیش ارزیابی نمایند و پیش از سرمایهگذاریهای کلان، درک دقیقی از توانایی نهایی مدلهای زبانی بزرگ به دست آورند.
🔻منبع
🆔 najm_ac
♨️هزینه پنهان پرسش از هوش مصنوعی
🔸هر بار استفاده از یک چتبات یا مدل هوش مصنوعی در پشت صحنه هزاران پردازش رایانهای را به همراه دارد. نتیجه این پردازشها مصرف برق و در نتیجه تولید انتشار CO₂ است. شاید در نگاه اول تأثیر هر پرسش ناچیز به نظر برسد، اما وقتی میلیونها کاربر به طور روزانه از این ابزارها استفاده کنند، مجموع این مصرف انرژی و انتشار کربن بسیار چشمگیر خواهد شد.
🔹گزارشها نشان میدهد که مدلهای پیشرفتهتر هوش مصنوعی انرژی بیشتری مصرف میکنند. برای مثال، شرکت «Mistral AI» اعلام کرده است تولید یک متن نسبتاً طولانی توسط مدل این شرکت حدود یک گرم CO₂ ایجاد میکند. شاید این مقدار کوچک به نظر برسد، اما در مقیاس جهانی و استفاده گسترده میتواند میلیونها تُن کربن به جو اضافه کند.
🔸گوگل نیز در گزارش خود درباره مدل «جمینای» برآورد کرده است که هر پرسش متنی ساده در این سیستم حدود ۰٫۲۴ واتساعت انرژی مصرف میکند و معادل ۰٫۰۳ گرم CO₂ انتشار دارد؛ رقمی که شاید با چند ثانیه روشن بودن تلویزیون برابری کند، اما باز هم در مقیاس انبوه اثرگذار است.
🔹کارشناسان معتقدند برای کاهش این اثرات زیستمحیطی، کاربران باید سؤالات خود را کوتاه و دقیق مطرح کنند و از مدلهای سنگین تنها در مواقع ضروری استفاده شود. همچنین انتظار میرود شرکتهای فناوری شفافیت بیشتری در زمینه مصرف انرژی و انتشار کربن محصولاتشان ارائه دهند تا کاربران بتوانند انتخابهای آگاهانهتری داشته باشند. این موضوع یادآور میشود که فناوریهای هوشمند بیهزینه نیستند و ردپای محیطزیستی آنها باید مورد توجه قرار گیرد.
🔻منبع
🆔 najm_ac
♨️درخواست جهانی برای تعیین خطوط قرمز در هوش مصنوعی
🔸بیش از ۲۰۰ تن از رهبران پیشین کشورها، برندگان جایزه نوبل، کارشناسان هوش مصنوعی و حقوق بشر و همچنین بیش از ۷۰ سازمان بینالمللی در بیانیهای مشترک با عنوان Global Call for AI Red Lines خواستار تعیین خطوط قرمز الزامآور برای کاربردهای هوش مصنوعی شدند.
🔹امضاکنندگان هشدار دادهاند که توسعه سریع این فناوری بدون چارچوبهای نظارتی میتواند به خطرات غیرقابل بازگشت، فقدان کنترل انسانی و سوءاستفادههای گسترده منجر شود. به باور آنها، نبود توافق جهانی باعث شکلگیری شکافهای حقوقی، ایمنی و اخلاقی خواهد شد.
🔸در این بیانیه تأکید شده است که کشورها باید تا پایان سال ۲۰۲۶ به توافقی بینالمللی برای تعیین خطوط قرمز هوش مصنوعی دست یابند. این خطوط شامل ممنوعیت کاربردهایی مانند تظاهر به انسان بودن، تکثیر یا توسعه مستقل سیستمها و استفاده از هوش مصنوعی در سلاحهای خودکار یا کنترل توان هستهای بدون نظارت انسانی است.
🔹امضاکنندگان همچنین ایجاد یک نهاد مستقل بینالمللی با قدرت کافی برای نظارت و اجرای این خطوط قرمز را ضروری دانستهاند. به گفته آنها، هوش مصنوعی میتواند فرصت بزرگی برای پیشرفت بشر باشد اما در صورت فقدان مقررات، به خطری جدی تبدیل خواهد شد.
🔻منبع
🔻سایت رسمی فراخوان
🆔 najm_ac
♨️چتجیپیتی در نگارش اخبار علمی از استانداردهای حرفهای عقب ماند.
🔸نتایج یک پژوهش تازه نشان میدهد که چتجیپیتی در مقایسه با خبرنگاران انسانی در تولید اخبار علمی عملکرد ضعیفتری دارد. در این تحقیق، محققان خلاصههای خبری منتشرشده در مجله معتبر «ساینس» را با متونی که توسط چتجیپیتی درباره همان مقالات علمی نوشته شده بود، مقایسه کردند.
🔹به گفته پژوهشگران، اگرچه متون تولیدی چتجیپیتی از نظر ساختار و روانی زبان تا حدی شبیه به نوشتههای حرفهای به نظر میرسند، اما در معیارهای کلیدی مانند دقت علمی، عمق تحلیل، برجستهسازی نکات مهم و رعایت استانداردهای حرفهای روزنامهنگاری، در سطحی پایینتر قرار دارند.
🔸این بررسی نشان داد که چتجیپیتی گرایش دارد متونی سادهتر و سطحیتر تولید کند و از توضیح دقیق جزئیات علمی یا نقد محتوایی غافل بماند. در نتیجه، خروجی آن بیشتر شبیه بازنویسی عمومی است تا گزارش خبری تخصصی.
🔹با وجود این، پژوهشگران تأکید کردهاند که هوش مصنوعی در حال پیشرفت است و نسخههای جدیدتر، مانند GPT-5 که اخیراً عرضه شده، میتوانند تواناییهای بیشتری در تولید محتوای علمی پیدا کنند. آنها پیشنهاد کردهاند مطالعات مشابهی با نسلهای تازه مدلهای زبانی انجام شود تا امکان ارزیابی دقیقتر از میزان پیشرفت این فناوری فراهم گردد.
🔸به طور کلی، نتیجه این پژوهش نشان میدهد که دستکم در حال حاضر، خبرنگاران انسانی همچنان در تولید اخبار علمی دقیق و قابل اعتماد برتری محسوسی نسبت به هوش مصنوعی دارند.
🔻منبع
🆔 najm_ac
♨️انجمن منطق ایران با همکاری انجمن علمی دانشجویی دانشکدهی ریاضی و علوم کامپیوتر دانشگاه امیرکبیر برگزار میکند:
🧠 کارگاه دو روزهی منطق در هوش مصنوعی
👨💻مدرس دوره:
سید احمد میرصانعی
داوطلب دکتری تخصصی منطق فلسفی دانشگاه تربیت مدرس| پژوهشگر منطق و هوش مصنوعی
📚 سرفصلهای اصلی کارگاه:
☑️ جایگاه منطق در هوش مصنوعی
✅ منطق، گراف دانش و وب معنایی
☑️ منطقهای توصیفی (DLs)
✅ روشهای محاسباتی الگوریتمیک منطقی
☑️ استنتاجگرهای منطقی
☑️ زبان هستیشناسی وب (ΟWL) و استاندارهای پایه (RDF و RDFS)
✅ تعریف و ساختار گرافهای دانش
☑️ مدلسازی دانش با منطق توصیفی و گرافهای دانش
✅ هوش مصنوعی نمادین (Symbolic AI)
☑️ تلفیق Symbolic AI و یادگیری ماشین
✅ کار با نرمافزار Protégé
☑️ چالشها: پیچیدگی محاسبات، مقیاسپذیری، عدم قطعیت و ...
✅ مسیرهای پژوهشی جدید
⏳ مدت زمان کارگاه: ۲ جلسه سه ساعته
📆 تاریخ برگزاری کارگاه: چهارشنبه ۱۶ مهرماه و ۲۳ مهرماه ۱۴۰۴/ ساعت ۹ الی ۱۲
📍 نحوه برگزاری: #حضوری_مجازی
💳 هزینهی ثبتنام: ۲۵۰ هزار تومان (با تخفیف ویژه برای دانشجویان امیرکبیر)
🔗 لینک ثبتنام
🆔 najm_ac
♨️تصویری واقعی از نحوه استفاده ۷۰۰ میلیون نفر از ChatGPT
🔸گزارشی مشترک از OpenAI و یک اقتصاددان دانشگاه هاروارد نشان میدهد که ChatGPT اکنون بیش از ۷۰۰ میلیون کاربر فعال در سراسر جهان دارد؛ رقمی معادل نزدیک به ۱۰ درصد جمعیت بزرگسال دنیا. این مطالعه بر اساس بررسی ۲.۶ میلیارد پیام روزانه تهیه شده و تصویری واقعی از الگوی استفاده کاربران ارائه میدهد.
🔹بر اساس یافتهها، رشد چشمگیر ChatGPT عمدتاً از طریق ورود کاربران جدید حاصل شده است و سطح استفاده کاربران قدیمی تقریباً ثابت مانده است. همچنین مشخص شده که بخش بزرگی از کاربران جوان هستند؛ حدود ۴۶ درصد بین ۱۸ تا ۲۵ سال سن دارند. از سوی دیگر، زنان اکنون بیش از ۵۲ درصد از کاربران روزانه را تشکیل میدهند که نشانه تغییر قابل توجه در ترکیب جمعیتی استفادهکنندگان است.
🔸در بررسی نوع استفادهها، مشخص شد که ۷۲ درصد مکالمات جنبه غیرکاری دارند و بیشتر به سرگرمی، کمک در کارهای شخصی یا پرسشهای روزمره اختصاص یافتهاند. در میان کاربردهای اصلی، نوشتن و ویرایش متن (۲۸ درصد) و جستجوی اطلاعات (۲۴.۴ درصد) بیشترین سهم را دارند. استفادههای تخصصیتر مانند تصمیمگیری در محیط کاری (۱۴.۹ درصد) یا برنامهنویسی و تولید ایدههای خلاقانه سهم کمتری را به خود اختصاص دادهاند.
🔸این نتایج نشان میدهد که ChatGPT علاوه بر جایگاه حرفهای و آموزشی، بیش از هر چیز به ابزاری فراگیر برای تعاملات روزمره، یادگیری شخصی و سرگرمی تبدیل شده است.
🔻منبع
🆔 najm_ac
♨️مدل جدید Qwen3-Max علیبابا معرفی شد.
🔸علیبابا مدل هوش مصنوعی Qwen3-Max را با حدود یک تریلیون پارامتر معرفی و از حالت آزمایشی خارج کرد. این مدل بر پایه معماری «ترکیب متخصصان» ساخته شده و با بیش از ۳۶ تریلیون توکن آموزش دیده است.
🔹مدل Qwen3-Max علاوه بر توانایی چشمگیر در درک و تولید کد، از قابلیت «عامل مستقل» برخوردار است و میتواند اهداف تعیینشده کاربر را بهصورت خودکار پیگیری کند. در آزمونهای بینالمللی نیز جایگاه سوم را بهدست آورده و حتی در برخی حوزهها از GPT-5 پیشی گرفته است.
🔸علیبابا همچنین در حال توسعه نسخه پیشرفتهتری با نام Qwen3-Max-Thinking برای تقویت توان استدلال است و اعلام کرده طی سه سال آینده بیش از ۵۳ میلیارد دلار در زیرساختهای هوش مصنوعی سرمایهگذاری خواهد کرد.
🔻منبع
🆔 najm_ac
♨️ بحران مقالات جعلی؛ هوش مصنوعی چالش تازه مجلات علمی
🔸یک بررسی تازه نشان میدهد ابزارهایی مانند ChatGPT و Gemini قادرند مقالات پژوهشی تقریباً کپیشده را تولید کنند و آنها را طوری بازنویسی کنند که از مراحل بررسی سرقت ادبی در ناشران عبور کنند.
🔹در این مطالعه، محققان بیش از ۴۰۰ مقاله تکراری در ۱۱۲ مجله طی ۴٫۵ سال گذشته را شناسایی کردند که در حوزه زیستپزشکی منتشر شدهاند. جالب اینکه وقتی از مدلهای زبانی خواسته شد همان مقالات را بازنویسی کنند، نسخهی جدید در عرض چند ساعت آماده شد و پس از ویرایش مختصری میتوانست از زیر سیستمهای تشخیص سرقت علمی عبور کند.
🔸محققان هشدار دادهاند که شرکتها یا افراد تولیدکننده مقالات جعلی ممکن است با سوءاستفاده از دادههای سلامت عمومی و مدلهای زبانی، حجم زیاد مقالات بیارزش منتشر کنند که به اعتبار پژوهش علمی آسیب میزند.
🔹ناشران معتبر از جمله Frontiers و PLOS نیز بهعنوان واکنش به این مشکل، سختگیری بیشتری در بررسی مقالات مبتنی بر دادههای سلامت عمومی اعمال کردهاند.
🔻منبع
🆔 najm_ac
♨️گسترش انتخاب مدلهای هوش مصنوعی در Microsoft 365 Copilot
🔸مایکروسافت اعلام کرد که کاربران Microsoft 365 Copilot از این پس میتوانند علاوه بر مدلهای OpenAI، از مدلهای Anthropic نیز استفاده کنند. این تغییر امکان انتخاب میان مدلهای مختلف مانند Claude Sonnet 4 و Claude Opus 4.1 را فراهم کرده و به کاربران اجازه میدهد بسته به نیازشان مدل مناسب را برگزینند.
🔹در بخش Researcher agent، انتخاب مدلها برای انجام وظایف تحقیقاتی پیشرفته بر اساس دادههای ایمیلها، جلسات، فایلها و وب ممکن شده است. همچنین در Copilot Studio قابلیت ساخت و سفارشیسازی عاملها (Agents) با بهرهگیری از مدلهای متفاوت فراهم آمده است. به این ترتیب، مایکروسافت گامی دیگر برای افزایش تنوع و انعطاف در استفاده از هوش مصنوعی در محیط کاری برداشته است.
🔻منبع
🆔 najm_ac
♨️چتجیپیتی پالس: قدمی به سوی دستیار فعال و هوشمند
🔸شرکت OpenAI نسخه پیشنمایشی از ویژگی جدیدی به نام ChatGPT Pulse را برای کاربران Pro در اپلیکیشن موبایل منتشر کرده است. این قابلیت طراحی شده تا بهطور خودکار و هر روز صبح، بر اساس گفتگوها، بازخوردها و اپهایی که به ChatGPT متصل کردهاید (مثل تقویم یا ایمیل)، تحقیق کند و «کارتهای تصویری موضوعی» مرتبط و شخصیسازیشدهای ارائه دهد — از پیشنهادهای روزانه و ایدههای غذایی گرفته تا برنامههای سفر و پیگیری اهداف بلندمدت.
🔹شما کنترل دارید که چه موضوعاتی نمایش داده شود: میتوانید با ابزار «تنظیم» (Curate) اولویتهایتان را اعلام کنید یا با واکنش مثبت/منفی به کارتها، محتواهای آینده را شکل دهید.
🔸این ویژگی هنوز در مرحله پیشنمایش است و ممکن است خطا کند یا پیشنهاداتی ارائه دهد که دقیقاً مطابق انتظارات شما نیستند. هدف نهایی OpenAI این است که ChatGPT از یک پاسخدهنده صرف به دستیار فعّال تبدیل شود؛ دستاوردی که با ترکیب گفتگو، حافظه و اتصال به اپها، بهصورت خودکار کارهای مفید برای کاربر انجام دهد. این قابلیت ابتدا برای کاربران Pro عرضه میشود و سپس در دسترس کاربران Plus و در نهایت همه کاربران قرار خواهد گرفت.
🔻منبع
🆔 najm_ac
♨️مدل جدید گوگل؛ رباتهایی با توانایی جستجو در وب و تصمیمگیری هوشمند
🔸گوگل دیپمایند از مدل هوش مصنوعی تازهای به نام Gemini Robotics-ER 1.5 رونمایی کرده است که به رباتها توانایی جستجو در وب و انجام وظایف پیچیدهتر را میدهد.
🔹قبلاً رباتها تنها قادر به انجام کارهای ساده و تکمرحلهای بودند؛ اما این مدل جدید امکان برنامهریزی چندمرحلهای و تصمیمگیری بر اساس دادههای واقعی در وب را فراهم میکند. مثلاً ربات میتواند قوانین محلی را بررسی کند و بر اساس آن، زبالهها را تفکیک کند، لباسها را بر اساس رنگ مرتب کند یا چمدان سفر را بسته به وضعیت آبوهوا آماده کند.
🔸یکی دیگر از قابلیتهای مهم این است که مدل جدید امکان انتقال مهارتها میان رباتهای مختلف را دارد؛ به عبارت دیگر، وظایفی که به یک ربات سپرده شدهاند، بدون تغییر زیاد در ربات دیگر نیز قابل اجرا خواهند بود.
🔹در حال حاضر، Gemini Robotics-ER 1.5 از طریق API در Google AI Studio برای توسعهدهندگان قابل دسترس است. مدل پایهتر Gemini Robotics-1.5 هم به صورت محدود برای شرکای منتخب عرضه شده است.
🔻منبع
🆔 najm_ac
♨️سنجش ارزش واقعی هوش مصنوعی با بنچمارک GDPval
🔸شرکت OpenAI از یک بنچمارک جدید به نام GDPval رونمایی کرده است که هدفش سنجش عملکرد مدلهای هوش مصنوعی بر روی وظایف واقعی و ارزشمند اقتصادی در دنیای واقعی است.
🔹این بنچمارک شامل ۴۴ شغل منتخب از ۹ صنعت کلیدی است، و در مجموع ۱٬۳۲۰ وظیفه تخصصی طراحی شده که نمادهایی از کارهای روزمره دانشمحور هستند مانند تهیه قرارداد حقوقی، طراحی مهندسی، پشتیبانی مشتری و غیره.
🔸برای امتیازدهی به مدلها، آثار تولیدشده توسط هوش مصنوعی با آثار واقعی متخصصان در همان حوزه مقایسه میشوند؛ ارزیابان حرفهای بهطور ناشناس بین خروجیهای مدل و کار انسان انتخاب میکنند که کدام بهتر یا مشابه است. نتایج اولیه نشان میدهد که مدلهای پیشرفته امروزی، در بعضی وظایف تقریباً با کیفیت انسان رقابت میکنند یا حتی بهتر عمل میکنند. علاوه بر این، مدلها توانستهاند این وظایف را با هزینه و زمان بسیار کمتر نسبت به نیروی انسانی انجام دهند.
🔹با این حال، OpenAI تأکید میکند که GDPval هنوز در مراحل اولیه است؛ این بنچمارک در حال حاضر فقط وظایف یکمرحلهای را در بر میگیرد و تعاملات پیوسته، تصحیح خطا یا تکرار کارها در نسخه فعلی در نظر گرفته نشدهاند. نسخههای آینده میتوانند زمینه پوشش وظایف پیچیدهتر، شغلهای بیشتر و تعاملهای پویا را فراهم بیاورند.
🔸در نهایت، هدف OpenAI این است که با چنین بنچمارکهایی شفافیت پیشرفت هوش مصنوعی در کاربردهای واقعی افزایش یابد و نشانهای از مسیر تأثیرگذاری این فناوری بر کار و اقتصاد باشد.
🔻منبع
🆔 najm_ac