ایتا - بنیاد | جواد محمدنیا

بنیاد | جواد محمدنیا

آینده هوش مصنوعی مولد (۲)

هوش مصنوعی مولد الان داره خودش رو با محتوای روی اینترنت تغذیه میکنه. بخشی از این خوراک، رایگان و در دسترسه. بخشی هم به شکل غیرقانونی داره استفاده میشه (کتابهایی که نسخه‌ی دزدی‌شون هست و ...).

این خوراک فعلی محتوایی، هر چه هست، روش تهیه‌اش چه اخلاقی باشه و چه غیراخلاقی، یه ویژگی مهم داره: بخش زیادی از اون، انسانیه.

یعنی محتوای اصیل (authentic) هست نه محتوای ساخته‌شده (synthetic).

اگر تعداد کاربران هوش مصنوعی مولد زیاد بشه، طی چند سال، بخش بزرگی از محتوای آنلاین، سینتتیک و ساختگی میشه و سهم محتوای تولیدی انسان در برابر محتوای تولیدی هوش مصنوعی تقریباً به صفر می‌رسه. و این گاوهایی که ما به "چراگاه محتوا" می‌فرستیم، عملاً به جای خوراک خوب، چیزی رو میخورن که قبلاً خودشون دفع کرده‌ان.

همهٔ ضعف‌ها، ایرادها، توهم‌های زبانی (که اجتناب‌ناپذیر و لازمهٔ خلاقیت مدل‌های زبانیه) نهایتاً اون‌قدر زیاد تکثیر میشن که خود مدل زبانی هم تحت تاثیر همون‌ها قرار می‌گیره.

اگر بخواهیم اسم عام برای این پدیده بذاریم، میشه بگیم saturation effect.

اگر اسم خاص‌تر رو می‌پسندید، میشه بگیم model collapse.

اصطلاحی که - اگر اشتباه نکنم - اولین بار ایلیا شومایلوف به کار برد.

اگر با دنیای الگوریتم آشنا باشید، احتمالاً اصطلاح The curse of recursion رو بیشتر دوست خواهید داشت (نفرین ناشی از حلقه‌های تو در توی ریکرسیو).

آیا این مشکل رو می‌شه حل کرد؟ در کوتاه‌مدت، عملاً این مشکل حس نخواهد شد.
در بلندمدت هم احتمالاً راه‌حل‌هایی پیدا میشه. اما در میان‌مدت، قطعاً یه چالش جدیه.

به هر حال، چیزی که مهمه اینه که حل این مشکل، سخت‌تر از چیزیه که در نگاه نخست به‌نظر میاد.
چون آدم‌ها خروجی مدل‌های زبانی رو ادیت میکنن و تمیز میشه. و ممکنه مدلها به سادگی متوجه نشن که با خروجی خودشون مواجه هستن.

اما قطعا ایده‌هایی هم هست که دیگه نوشتن از اونا، در حوصلهٔ نویسندهٔ خسته و وارفتهٔ این کانال تلگرامی نیست. 😉

اگر دوست داشتید، مقالهٔ شومایلوف و رفقاش رو هم ببینید:

AI models collapse when trained on recursively generated data.

#هوش_مصنوعی

1 مشاهده06:14

بنیاد | جواد محمدنیا

هدایت شده از ساندویچ فلسفه

1:13

6.6M حجم رسانه بالاست

مشاهده در ایتا

🌐 #خردنما | حتی یک آتئیست هم ...

➖ از زبان یک اندیشمند غربی

📚 #فلسفه_دین | #عمومی

📮 ایتا | تلگرام | اینستاگرام | آپارات

1 مشاهده16:43

بنیاد | جواد محمدنیا

⁉️ تا حالا فکر کردید کدام هوش مصنوعی درک بهتری از زبان فارسی داره؟

✅ برای پاسخ به این سوال، یک کاربر ایرانی اومده یک آزمون طراحی کرده. در این آزمون از 500 تست کنکور قرابت معنایی استفاده شده و 30 مدل به این سوال‌ها پاسخ دادن. نتیجه‌ی این آزمون رو در نمودار زیر می‌تونید ببینید. 

رتبه‌های 1 تا 5 هم به ترتیب عبارتند از:
1️⃣ gemini 2.5 - pro
2️⃣ Kimi -K2 thinking
3️⃣ gemini 2.5 flash
4️⃣Qwen 3 -max
5️⃣ GPT 5 mini

(برتری هوش مصنوعی جمینی گوگل به‌ شکل واضحی مشخصه.)

❇️ اطلاعات کامل‌تر آزمایش رو اینجا می‌تونید ببینید.

1 مشاهده10:30

بنیاد | جواد محمدنیا

⁉️ تا حالا فکر کردید کدام هوش مصنوعی درک بهتری از زبان فارسی داره؟ ✅ برای پاسخ به این سوال، یک کارب

هوش مصنوعی در برابر شعر فارسی: آیا ماشین‌ها می‌فهمن حافظ چی می‌گه؟

یه پروژه تازه روی گیت‌هاب منتشر شده که قراره یه سؤال پرتکرار رو جواب بده:
آیا مدل‌های هوش مصنوعی می‌تونن شعر فارسی رو بفهمن؟

این پروژه که اسمش Persian Poetry Semantic Similarity Benchmarkـه، توسط «آرمان جعفرنژاد» ساخته شده و تمرکزش روی سنجش درک معنایی مدل‌های زبانی از اشعار فارسیه، چیزی که تا حالا کمتر کسی سراغش رفته بود.

💡هدف پروژه
در این بنچمارک، مدل‌های زبانی (مثل GPT، Gemini، Claude و DeepSeek) و مدل‌های embedding (مثل SBERT یا LaBSE) باید بین چند بیت، اون بیتی رو پیدا کنن که از نظر معنا با بقیه فرق داره.
به‌عبارتی یه آزمون هوش ادبی برای هوش مصنوعی طراحی شده؛ جایی که بیت‌ها گاهی پر از استعاره و لایه‌های معنایی پیچیده‌ان.

📊 نتایج: از درک تا حدس
نتایج اولیه ترکیبی از شگفتی و ضعف رو نشون می‌دن:
در میان مدل‌های زبانی بزرگ (LLM)، مدل Gemini 2.5 Pro با دقت ۷۰٪ در صدر قرار گرفته.
بعد از اون Kimi K2-Thinking با ۶۲٪ و Gemini 2.5 Flash با ۶۱٪ رتبه‌های بعدی رو گرفتن.
مدل‌های GPT-5 Mini و Claude Haiku 4.5 هم با حدود ۵۵–۵۷٪ عملکرد، در میانه جدول ایستادن.

🔘خط قرمز روی نمودارها (۲۵٪) نشون‌دهنده‌ی حدس تصادفیه، پس بیشتر مدل‌های برتر واقعاً یه درک نسبی از معنا داشتن.

اما وقتی نوبت به مدل‌های embedding رسید، اوضاع خیلی امیدوارکننده نبود.
بهترین مدل در این دسته یعنی RoBERTa-SBERT فقط ۴۱٪ دقت داشت و اکثر مدل‌ها بین ۳۰ تا ۳۹٪ موندن یعنی تقریباً نزدیک به حدس شانسی.
این نشون می‌ده که مدل‌هایی که صرفاً معنا رو به بردار عددی تبدیل می‌کنن، هنوز از درک شعر فاصله زیادی دارن.

💬 توضیح دادن شعرها؛ نقطه‌ی عطف نتایج
یکی از بخش‌های هوشمندانه پروژه، مقایسه‌ی عملکرد مدل‌ها روی شعر خام و شعر به‌همراه توضیح کوتاه از معنی بود.
نتیجه؟ بعضی مدل‌ها به طرز چشمگیری بهتر شدن:
 مدل Qwen3-Embedding-4B با ۲۰٪ افزایش دقت جهش کرد.
 مدل Mistral-Embed-2312 حدود ۱۷٪ پیشرفت داشت.
مدل‌های دیگه هم بین ۵ تا ۱۰ درصد رشد نشون دادن.
یعنی ظاهراً وقتی مدل‌ها بدونن شعر «درباره‌ی چی» حرف می‌زنه، خیلی بهتر می‌تونن معناش رو تحلیل کنن.

🛍 آزمون‌های استدلالی و یادگیری نمونه‌ای (Few-Shot)
در بخش reasoning، مدل Gemini 2.5 Pro دوباره با امتیاز ۸۱٪ در صدر قرار گرفت.
در حالت few-shot (وقتی قبل از پاسخ چند مثال یاد می‌گیره)، عملکردش حتی به ۸۹.۷٪ رسید، بالاترین نمره‌ی کل پروژه.

مدل Claude 3.5 Sonnet با حدود ۷۲٪ در جایگاه دوم بود، و DeepSeek-R1 هم با ۶۱٪ عملکرد قابل قبولی نشون داد.

🧭 جمع‌بندی
نتایج این پروژه یه پیام روشن دارن:
مدل‌های بزرگ زبانی حالا کم‌کم می‌تونن از شعر فارسی سر دربیارن، حداقل در حد تشخیص معناهای متفاوت.

ولی مدل‌های embedding و روش‌های عددی هنوز راه زیادی تا درک زیبایی و پیچیدگی شعر فارسی در پیش دارن.

به بیان ساده‌تر، ماشین‌ها تازه یاد گرفتن شعر بخونن؛ اما هنوز نمی‌دونن چرا قشنگه.

گیتهاب پروژه

#هوش_مصنوعی #زبان_فارسی

✈️@mohammad_zammani

1 مشاهده08:55

بنیاد | جواد محمدنیا

🔥 یک سال Microsoft 365 Copilot Pro رایگان برای دانشجوها!

بدون نیاز به کارت بانکی یا هیچ پرداختی.
فقط از لینک زیر وارد بشید و ثبت‌نام کنید:

🔗 https://www.microsoft.com/en-us/microsoft-copilot/for-individuals/ai-for-students?form=MA140R

فقط با اکانت مایکروسافت (outlook , Hotmail) ثبتنام کنید

1 مشاهده08:41

بنیاد | جواد محمدنیا

🎙 یکی از شاهکارهای جدید دنیای هوش مصنوعی!
این ابزار هوش مصنوعی صدا به متن، به‌صورت لایو و با دقت نزدیک به ۱۰۰٪ صدای شما رو به متن فارسی تبدیل 
می‌کنه! 😳

این ابزار از سرویس جدید ElevenLabs هست و واقعاً فوق‌العاده عمل می‌کنه.
کافیه وارد سایت بشید 👇🏻
روی گزینه Speech to Text بزنید،
از بخش Try Demo زبان مورد نظرتون رو انتخاب کنید (بیش از ۹۰ زبان دنیا!)
و بعد گزینه Transcribe رو بزنید تا صداتون به‌صورت زنده تبدیل به متن بشه 🔥

می‌تونید برای جلسات، کلاس‌ها یا حتی تولید محتوا ازش استفاده کنید.
دقتش خیلی بالاست و خروجی تقریباً بدون خطاست!

https://elevenlabs.io/app/speech-to-text

1 مشاهده10:38

بنیاد | جواد محمدنیا

هدایت شده از تاوان | پژوهش‌های حدیثی

4_5807541523658579015.mp3

زمان: 3:17 حجم: 394.1K

🔻آیت‌الله‌ سید موسی شبیری زنجانی در دهه‌ی ۶۰:
◾ایمان در قرآن [الزاما] به معنای ایمان به امامان دوازده‌گانه نیست.
◾در هنگام نزول بسیاری از آیات ایمان، بحث ولایت امامان مطرح نبوده است.
◾اگر هم بحث ولایت در اواخر نزول قرآن مطرح شده بوده، فقط ولایت حضرت علی بوده و نه امامان دیگر.
◾شرط ایمان برای اصحاب امامان این نبوده که به ولایت امامان بعدی باور داشته باشند؛ آنچه شرط بوده این بوده که امامِ زمانۀ خود را باور داشته باشند.
◾ایمان، همان اعتقاد اصولی است که مصداقش به اختلاف ازمنه فرق می‌کند. در زمان پیامبر و پیش از نصب ولایت امیر المومنین، شرط لازم ایمان باور به نبوت پیامبر بود؛ همینطور در زمان هر امامی چنین بوده است (شرط لازم ایمان، اعتقاد به آن امام و امامان قبلی است).
◾در زمان ما، مومن کسی است که به امامت امامان اثناعشر معتقد باشد.
@tavanerejal

1 مشاهده07:08

بنیاد | جواد محمدنیا

خدمتتون عرض کنم که در استفاده از سه هوش مصنوعی‌ای چینی که من می‌شناسم، به‌این‌ترتیب اولویت می‌دم: ج

🔵 مدل جدید شرکت چینی Moonshot AI یعنی Kimi K2 Thinking حسابی سر و صدا کرده. این مدل متن‌بازه (Open-Source) و تونسته از مدل‌های معروف مثل GPT-5 از OpenAI و Claude Sonnet 4.5 از Anthropic بهتر عمل کنه.

مدل Kimi K2 با معماری مخصوصی به اسم «ترکیب متخصص‌ها» (Mixture-of-Experts) ساخته شده و حدود یک تریلیون پارامتر داره. توی چند تا آزمون مهم، نتایجش خیلی خوب بوده: توی آزمون Humanity’s Last Exam نمره ۴۴.۹٪ گرفته، توی BrowseComp نمره ۶۰.۲٪ و توی SWE-Bench Verified هم ۷۱.۳٪. این یعنی قدرت استدلال (Reasoning) و توانایی تصمیم‌گیریش (Agentic Capabilities) خیلی بالاست.

این استارتاپ که توی پکنه و شرکت Alibaba ازش حمایت می‌کنه، مدل Kimi K2 رو رایگان توی GitHub و پلتفرم خودش منتشر کرده. همین باعث شده کلی بحث توی X (توئیتر سابق) راه بیفته. خیلی‌ها می‌گن این مدل می‌تونه قدرت مدل‌های بسته (Proprietary AI) مثل GPT رو به چالش بکشه.

کاربرا از قیمت پایین آموزش مدل هم تعجب کردن، چون کل هزینه آموزش فقط ۴.۶ میلیون دلار بوده. البته بعضیا هنوز شک دارن که توی کدنویسی به اندازه بقیه بخش‌ها قوی باشه.

منتشر شدن این مدل باعث شده بعضیا بگن آمریکا باید قوانین سختگیرانه هوش مصنوعی رو کمی راحت‌تر کنه، چون حالا مدل‌های متن‌باز دارن با مدل‌های بسته رقابت می‌کنن. از اون طرف، بعضی کارشناسا نگران بحث «هم‌ترازی» (Alignment) هستن، چون قدرت مدل‌های باز هم حالا به سطح مدل‌های تجاری رسیده.

https://www.kimi.com/

#هوش_مصنوعی 

✈️@mohammad_zammani

پ‌ن: به‌نظر بنده دیگه می‌تونیم از آمریکایی‌های پولی عبور کنیم. بازده رایگان‌های چینی در حد پولی‌های گران‌قیمت آمریکایی شده.

1 مشاهده08:14

بنیاد | جواد محمدنیا

🔵 مدل جدید شرکت چینی Moonshot AI یعنی Kimi K2 Thinking حسابی سر و صدا کرده. این مدل متن‌بازه (Open-S

باز هم خلاقیت و نوآوری و باز هم DeepSeek

انتشار جدید DeepSeek واقعاً اتفاق مهمی برای دنیای LLM‌های متن‌بازه. مدل DeepSeek-V3.2-Speciale از نظر توانایی در IMO 2025 و IOI 2025 تقریباً هم‌سطح Gemini-3-Pro ظاهر شده و حتی تو چندتا benchmark هم ازش جلو زده. DeepSeek سه گلوگاه جدی رو شناسایی کرده: vanilla attention که تو توالی‌های خیلی بلند کم میاره، کمبود post-training compute، و ضعف generalization تو سناریوهای agentic. برای همین هم DeepSeek-V3.2 رو معرفی کردن که هر سه مشکل رو هم‌زمان هدف می‌گیره.

یکی از نوآوری‌های مهم این مدل، DeepSeek Sparse Attention (DSA) هست که پیچیدگی attention رو از ‌O(L²)‌ به ‌O(Lk)‌ کاهش می‌ده؛ جایی که ‌k‌ خیلی کوچیک‌تر از طول sequence هست. یه «lightning indexer» سبک تعیین می‌کنه کدوم tokenها مهم‌ترن و فقط همون top-kها attention کامل می‌گیرن، و نتیجه اینه که تو contextهای طولانی سرعت به‌طور قابل‌توجهی بالا می‌ره بدون اینکه کیفیت افت کنه. البته معماری به‌تنهایی کافی نبوده؛ DeepSeek میزان post-training compute‌یی اختصاص داده که بیش از ۱۰٪ کل هزینه pre-trainingه و این سرمایه‌گذاری بزرگ روی RL باعث شده مدل تو reasoning خیلی قوی‌تر بشه.

برای کارهای agentic هم یه سیستم خودکار ساختن که ۱٬۸۲۷ محیط مختلف و بیش از ۸۵ هزار prompt پیچیده تولید می‌کنه؛ شامل code agent، search agent و انواع تسک‌های برنامه‌ریزی، که همگی در مقیاس بزرگ برای آموزش RL ساخته شدن. از نظر نتایج هم DeepSeek-V3.2 تو AIME 2025 به ۹۳٫۱٪ رسیده (تقریباً نزدیک GPT-5-High که ۹۴٫۶٪ گرفته). تو SWE-Verified درصد حل‌شده‌ها ۷۳٫۱٪ بوده و تو HLE text-only هم ۲۵٫۱٪ عملکرد داشته که خیلی نزدیک GPT-5 با ۲۶٫۳٪ هست.

نسخه پرکامپیوتر این مدل یعنی DeepSeek-V3.2-Speciale حتی فراتر هم می‌ره و تو IMO 2025 مدال طلا گرفته (با ۳۵ از ۴۲ امتیاز)، تو IOI 2025 به امتیاز ۴۹۲ از ۶۰۰ رسیده و تو ICPC World Finals 2025 تونسته ۱۰ تا از ۱۲ مسئله رو حل کنه. در نهایت این مدل اولین مدل متن‌بازیه که واقعاً می‌تونه با سیستم‌های کلوزسورس پیشرو تو حوزه‌های reasoning، coding و تسک‌های agentic رقابت جدی داشته باشه.

🔗لینک صفحه hf مدل

@reza_jafari_ai

1 مشاهده06:53

بنیاد | جواد محمدنیا

10:46

49.5M حجم رسانه بالاست

مشاهده در ایتا

مرحلۀ دوم بدایة الحکمة؛ مبحث معرفت‌شناسی

1 مشاهده13:12

بنیاد | جواد محمدنیا

جزء معدود زمان‌هایی است که از هوش مصنوعی اینقدر خوشحالم؛ چون هم به یک پرامپت عالی دست پیدا کردم و هم اینکه هوش مصنوعی‌ها ارتقای خیلی خوبی پیدا کردن. درنتیجه این پرامپت برام فوق العاده بود؛ یعنی ۹۰درصد نتیجۀ دلخواهمو داد. شما هم می‌تونید واژۀ فلسفه رو تغییر بدید. یا با نمونه پرامپت‌هایی که در آینده می‌دم، متوجه می‌شید چه چیزایی رو می‌تونید عوض کنید. به هرحال، هر منبعیو خواستید آپلود کنید و اینطوری ی خلاصۀ عالی ازش به دست بیارید.

نکتۀ بعدی اینه که هر بخشیو که خلاصه می‌کنه، قبل از اینکه وارد بخش بعدی بشید، خودتون مطالعه کنید؛ ممکن از یک پاراگرافش راضی نباشد؛ بگید اون پاراگرافو باتوجه به متن منبع بیشتر توضیح بده. 

نقش: تو یک دستیار پژوهشی دقیق هستی که وظیفه دارد متون پیچیده فلسفی را برای رساله دکتری «بازنویسی فشرده» (Condense) کند.
هدف: من به یک «جزوه درسی کامل» از این فصل نیاز دارم. نباید مطلب را آنقدر خلاصه کنی که منطق آسیب ببیند، و نباید آنقدر طولانی باشد که وقت‌گیر شود. هدف نهایی رسیدن به متنی با حجم حدود ۲۰ تا ۲۵ درصد متن اصلی است.
دستورالعمل اجرایی برای «زیربخش اول از فصل [۱]»:
ابتدا چکیدۀ کل فصل را در چهارصد کلمه به من بده؛ سپس طبق مراحل زیر پیش برو

۱. اولویت محتوا: تمام استدلال‌های نویسنده را باز کن. اگر نویسنده می‌گوید «الف باعث ب می‌شود»، دقیقاً توضیح بده «چرا» و «چگونه». اگر برای رعایت محدودیت ۲۵ درصد مجبور به حذف چیزی شدی، فقط «مثال‌های تکراری» یا «توضیحات بدیهی» را حذف کن، اما هرگز حلقه‌های استدلال منطقی را حذف نکن.
۲. ساختار منطقی: دقیقاً با همان ترتیب و نظمی که نویسنده بحث را پیش برده، جلو برو. از هیچ زیربخشی (Subsection) نپر.
۳. دیالکتیک: جدال‌های نویسنده با منتقدانش را با دقت شرح بده (چه ایرادی گرفتند و نویسنده چه پاسخی داد).
۴. مدیریت حجم: سعی کن از سقف ۲۵ درصد کلمات عبور نکنی، اما از این فضا حداکثر استفاده ران ببر تا مطلب عمیق باشد. اگر مطلب کوتاه بود، بیهوده طولانی‌اش نکن.
لطفاً با رعایت این موارد، تحلیل را شروع کن.
هنگامی که هر زیر بخش را تمام کردی، از من بپرس که آیا کار را با زیر بخش بعدی شروع کنم یا نه؛ اگر موافقت کردم شروع کن تا فصل تمام شود؛ اگر فصل تمام شد تذکر بده و بگو آیا زیر بخش فصل بعدی را شروع کنم یا نه .

1 مشاهده16:29

بنیاد | جواد محمدنیا

این پرامپت هم برای ترجمه فوق‌العاده‌است؛ البته اگر می‌خواید کل متن رو بدونید. دقت کنید، در ترجمه و خلاصه، هیچ هوش مصنوعی‌ای مثل جمنای پولی کار نمی‌کنه:

"شما نقش یک مترجم حرفه‌ای کتاب‌های علمی و دانشگاهی را دارید. وظیفه شما ترجمه دقیق، سلیس و روان فصل‌به‌فصل یک کتاب انگلیسی است برای این کار موارد زیر رو در نظر بگیر که حائز اهمیت است:



1.  ترجمه باید کاملاً روان، بومی و قابل فهم برای خواننده فارسی‌زبان باشد.
2.  از ترجمه کلمه‌به‌کلمه و تحت‌اللفظی پرهیز کرده و مفهوم هر جمله را به‌درستی منتقل کنید.
3.  اصطلاحات علمی را با معادل دقیق فارسی یا همراه با توضیح کوتاه ترجمه کنید.
4.  تنها فصل مشخص‌شده از فایل پیوست‌شده را بخوانید و ترجمه کنید.
5.  ترجمه هر فصل باید منسجم، دقیق و در سطح قابل چاپ در یک کتاب فارسی باشد. همچنین کلیه بخش ها اعم از متن، جداول و اشکال نیز ترجمه شود و تمامی فرمول های ریاضی نیز شماره گذاری شود. توضیحات مربوط به جداول هم ترجمه شود و جداول قال انتقال به گوگل شیت باشد.
6.  کلیه رفرنس های درون متنی بصورت کامل منتقل شود. این ارجاعات درونی متنی باید فارسی باشد و بصورت یک () باشد. هر فرمت دیگری برای ارجاعات درون متنی غیر از پارانتز باز و بسته ممنوع و غیرمجاز است.
7.  متن بصورت خط به خط تحلیل و آنالیز شود و ترجمه کاملا علمی و دقیق آن صورت پذیرد و دقت کن که هیچ متنی جا نماند و ترجمه نشده باقی نماند. در ترجمه بسیار دقت کن که با حوصله همه مطالب را دقیقا ترجمه نمایی
8.  در پایان ترجمه هر فصل فقط این جمله را از من بپرسید:  
(( مایلی فصل بعدی رو ترجمه کنم؟))
خب حالا فصل اول ( فصل 1) را ترجمه کن و بعد اتمام ازم بپرس که مایل هستی فصل بعد را ترجمه کنم؟

1 مشاهده05:11

مطالب بعدی

پرسش‌ها

قوانین

داغ‌ترین‌ها

چندسکویی