آینده هوش مصنوعی مولد (۲)
هوش مصنوعی مولد الان داره خودش رو با محتوای روی اینترنت تغذیه میکنه. بخشی از این خوراک، رایگان و در دسترسه. بخشی هم به شکل غیرقانونی داره استفاده میشه (کتابهایی که نسخهی دزدیشون هست و ...).
این خوراک فعلی محتوایی، هر چه هست، روش تهیهاش چه اخلاقی باشه و چه غیراخلاقی، یه ویژگی مهم داره: بخش زیادی از اون، انسانیه.
یعنی محتوای اصیل (authentic) هست نه محتوای ساختهشده (synthetic).
اگر تعداد کاربران هوش مصنوعی مولد زیاد بشه، طی چند سال، بخش بزرگی از محتوای آنلاین، سینتتیک و ساختگی میشه و سهم محتوای تولیدی انسان در برابر محتوای تولیدی هوش مصنوعی تقریباً به صفر میرسه. و این گاوهایی که ما به "چراگاه محتوا" میفرستیم، عملاً به جای خوراک خوب، چیزی رو میخورن که قبلاً خودشون دفع کردهان.
همهٔ ضعفها، ایرادها، توهمهای زبانی (که اجتنابناپذیر و لازمهٔ خلاقیت مدلهای زبانیه) نهایتاً اونقدر زیاد تکثیر میشن که خود مدل زبانی هم تحت تاثیر همونها قرار میگیره.
اگر بخواهیم اسم عام برای این پدیده بذاریم، میشه بگیم saturation effect.
اگر اسم خاصتر رو میپسندید، میشه بگیم model collapse.
اصطلاحی که - اگر اشتباه نکنم - اولین بار ایلیا شومایلوف به کار برد.
اگر با دنیای الگوریتم آشنا باشید، احتمالاً اصطلاح The curse of recursion رو بیشتر دوست خواهید داشت (نفرین ناشی از حلقههای تو در توی ریکرسیو).
آیا این مشکل رو میشه حل کرد؟ در کوتاهمدت، عملاً این مشکل حس نخواهد شد.
در بلندمدت هم احتمالاً راهحلهایی پیدا میشه. اما در میانمدت، قطعاً یه چالش جدیه.
به هر حال، چیزی که مهمه اینه که حل این مشکل، سختتر از چیزیه که در نگاه نخست بهنظر میاد.
چون آدمها خروجی مدلهای زبانی رو ادیت میکنن و تمیز میشه. و ممکنه مدلها به سادگی متوجه نشن که با خروجی خودشون مواجه هستن.
اما قطعا ایدههایی هم هست که دیگه نوشتن از اونا، در حوصلهٔ نویسندهٔ خسته و وارفتهٔ این کانال تلگرامی نیست. 😉
اگر دوست داشتید، مقالهٔ شومایلوف و رفقاش رو هم ببینید:
AI models collapse when trained on recursively generated data.
#هوش_مصنوعی
هدایت شده از ساندویچ فلسفه
6.6M حجم رسانه بالاست
مشاهده در ایتا
🌐 #خردنما | حتی یک آتئیست هم ...
➖ از زبان یک اندیشمند غربی
📚 #فلسفه_دین | #عمومی
📮 ایتا | تلگرام | اینستاگرام | آپارات
⁉️ تا حالا فکر کردید کدام هوش مصنوعی درک بهتری از زبان فارسی داره؟
✅ برای پاسخ به این سوال، یک کاربر ایرانی اومده یک آزمون طراحی کرده. در این آزمون از 500 تست کنکور قرابت معنایی استفاده شده و 30 مدل به این سوالها پاسخ دادن. نتیجهی این آزمون رو در نمودار زیر میتونید ببینید.
رتبههای 1 تا 5 هم به ترتیب عبارتند از:
1️⃣ gemini 2.5 - pro
2️⃣ Kimi -K2 thinking
3️⃣ gemini 2.5 flash
4️⃣Qwen 3 -max
5️⃣ GPT 5 mini
(برتری هوش مصنوعی جمینی گوگل به شکل واضحی مشخصه.)
❇️ اطلاعات کاملتر آزمایش رو اینجا میتونید ببینید.
بنیاد | جواد محمدنیا
⁉️ تا حالا فکر کردید کدام هوش مصنوعی درک بهتری از زبان فارسی داره؟ ✅ برای پاسخ به این سوال، یک کارب
هوش مصنوعی در برابر شعر فارسی: آیا ماشینها میفهمن حافظ چی میگه؟
یه پروژه تازه روی گیتهاب منتشر شده که قراره یه سؤال پرتکرار رو جواب بده:
آیا مدلهای هوش مصنوعی میتونن شعر فارسی رو بفهمن؟
این پروژه که اسمش Persian Poetry Semantic Similarity Benchmarkـه، توسط «آرمان جعفرنژاد» ساخته شده و تمرکزش روی سنجش درک معنایی مدلهای زبانی از اشعار فارسیه، چیزی که تا حالا کمتر کسی سراغش رفته بود.
💡هدف پروژه
در این بنچمارک، مدلهای زبانی (مثل GPT، Gemini، Claude و DeepSeek) و مدلهای embedding (مثل SBERT یا LaBSE) باید بین چند بیت، اون بیتی رو پیدا کنن که از نظر معنا با بقیه فرق داره.
بهعبارتی یه آزمون هوش ادبی برای هوش مصنوعی طراحی شده؛ جایی که بیتها گاهی پر از استعاره و لایههای معنایی پیچیدهان.
📊 نتایج: از درک تا حدس
نتایج اولیه ترکیبی از شگفتی و ضعف رو نشون میدن:
در میان مدلهای زبانی بزرگ (LLM)، مدل Gemini 2.5 Pro با دقت ۷۰٪ در صدر قرار گرفته.
بعد از اون Kimi K2-Thinking با ۶۲٪ و Gemini 2.5 Flash با ۶۱٪ رتبههای بعدی رو گرفتن.
مدلهای GPT-5 Mini و Claude Haiku 4.5 هم با حدود ۵۵–۵۷٪ عملکرد، در میانه جدول ایستادن.
🔘خط قرمز روی نمودارها (۲۵٪) نشوندهندهی حدس تصادفیه، پس بیشتر مدلهای برتر واقعاً یه درک نسبی از معنا داشتن.
اما وقتی نوبت به مدلهای embedding رسید، اوضاع خیلی امیدوارکننده نبود.
بهترین مدل در این دسته یعنی RoBERTa-SBERT فقط ۴۱٪ دقت داشت و اکثر مدلها بین ۳۰ تا ۳۹٪ موندن یعنی تقریباً نزدیک به حدس شانسی.
این نشون میده که مدلهایی که صرفاً معنا رو به بردار عددی تبدیل میکنن، هنوز از درک شعر فاصله زیادی دارن.
💬 توضیح دادن شعرها؛ نقطهی عطف نتایج
یکی از بخشهای هوشمندانه پروژه، مقایسهی عملکرد مدلها روی شعر خام و شعر بههمراه توضیح کوتاه از معنی بود.
نتیجه؟ بعضی مدلها به طرز چشمگیری بهتر شدن:
مدل Qwen3-Embedding-4B با ۲۰٪ افزایش دقت جهش کرد.
مدل Mistral-Embed-2312 حدود ۱۷٪ پیشرفت داشت.
مدلهای دیگه هم بین ۵ تا ۱۰ درصد رشد نشون دادن.
یعنی ظاهراً وقتی مدلها بدونن شعر «دربارهی چی» حرف میزنه، خیلی بهتر میتونن معناش رو تحلیل کنن.
🛍 آزمونهای استدلالی و یادگیری نمونهای (Few-Shot)
در بخش reasoning، مدل Gemini 2.5 Pro دوباره با امتیاز ۸۱٪ در صدر قرار گرفت.
در حالت few-shot (وقتی قبل از پاسخ چند مثال یاد میگیره)، عملکردش حتی به ۸۹.۷٪ رسید، بالاترین نمرهی کل پروژه.
مدل Claude 3.5 Sonnet با حدود ۷۲٪ در جایگاه دوم بود، و DeepSeek-R1 هم با ۶۱٪ عملکرد قابل قبولی نشون داد.
🧭 جمعبندی
نتایج این پروژه یه پیام روشن دارن:
مدلهای بزرگ زبانی حالا کمکم میتونن از شعر فارسی سر دربیارن، حداقل در حد تشخیص معناهای متفاوت.
ولی مدلهای embedding و روشهای عددی هنوز راه زیادی تا درک زیبایی و پیچیدگی شعر فارسی در پیش دارن.
به بیان سادهتر، ماشینها تازه یاد گرفتن شعر بخونن؛ اما هنوز نمیدونن چرا قشنگه.
گیتهاب پروژه
#هوش_مصنوعی #زبان_فارسی
✈️@mohammad_zammani
🔥 یک سال Microsoft 365 Copilot Pro رایگان برای دانشجوها!
بدون نیاز به کارت بانکی یا هیچ پرداختی.
فقط از لینک زیر وارد بشید و ثبتنام کنید:
🔗 https://www.microsoft.com/en-us/microsoft-copilot/for-individuals/ai-for-students?form=MA140R
فقط با اکانت مایکروسافت (outlook , Hotmail) ثبتنام کنید
🎙 یکی از شاهکارهای جدید دنیای هوش مصنوعی!
این ابزار هوش مصنوعی صدا به متن، بهصورت لایو و با دقت نزدیک به ۱۰۰٪ صدای شما رو به متن فارسی تبدیل
میکنه! 😳
این ابزار از سرویس جدید ElevenLabs هست و واقعاً فوقالعاده عمل میکنه.
کافیه وارد سایت بشید 👇🏻
روی گزینه Speech to Text بزنید،
از بخش Try Demo زبان مورد نظرتون رو انتخاب کنید (بیش از ۹۰ زبان دنیا!)
و بعد گزینه Transcribe رو بزنید تا صداتون بهصورت زنده تبدیل به متن بشه 🔥
میتونید برای جلسات، کلاسها یا حتی تولید محتوا ازش استفاده کنید.
دقتش خیلی بالاست و خروجی تقریباً بدون خطاست!
https://elevenlabs.io/app/speech-to-text
هدایت شده از تاوان | پژوهشهای حدیثی
4_5807541523658579015.mp3
زمان:
حجم:
394.1K
🔻آیتالله سید موسی شبیری زنجانی در دههی ۶۰:
◾ایمان در قرآن [الزاما] به معنای ایمان به امامان دوازدهگانه نیست.
◾در هنگام نزول بسیاری از آیات ایمان، بحث ولایت امامان مطرح نبوده است.
◾اگر هم بحث ولایت در اواخر نزول قرآن مطرح شده بوده، فقط ولایت حضرت علی بوده و نه امامان دیگر.
◾شرط ایمان برای اصحاب امامان این نبوده که به ولایت امامان بعدی باور داشته باشند؛ آنچه شرط بوده این بوده که امامِ زمانۀ خود را باور داشته باشند.
◾ایمان، همان اعتقاد اصولی است که مصداقش به اختلاف ازمنه فرق میکند. در زمان پیامبر و پیش از نصب ولایت امیر المومنین، شرط لازم ایمان باور به نبوت پیامبر بود؛ همینطور در زمان هر امامی چنین بوده است (شرط لازم ایمان، اعتقاد به آن امام و امامان قبلی است).
◾در زمان ما، مومن کسی است که به امامت امامان اثناعشر معتقد باشد.
@tavanerejal
بنیاد | جواد محمدنیا
خدمتتون عرض کنم که در استفاده از سه هوش مصنوعیای چینی که من میشناسم، بهاینترتیب اولویت میدم: ج
🔵 مدل جدید شرکت چینی Moonshot AI یعنی Kimi K2 Thinking حسابی سر و صدا کرده. این مدل متنبازه (Open-Source) و تونسته از مدلهای معروف مثل GPT-5 از OpenAI و Claude Sonnet 4.5 از Anthropic بهتر عمل کنه.
مدل Kimi K2 با معماری مخصوصی به اسم «ترکیب متخصصها» (Mixture-of-Experts) ساخته شده و حدود یک تریلیون پارامتر داره. توی چند تا آزمون مهم، نتایجش خیلی خوب بوده: توی آزمون Humanity’s Last Exam نمره ۴۴.۹٪ گرفته، توی BrowseComp نمره ۶۰.۲٪ و توی SWE-Bench Verified هم ۷۱.۳٪. این یعنی قدرت استدلال (Reasoning) و توانایی تصمیمگیریش (Agentic Capabilities) خیلی بالاست.
این استارتاپ که توی پکنه و شرکت Alibaba ازش حمایت میکنه، مدل Kimi K2 رو رایگان توی GitHub و پلتفرم خودش منتشر کرده. همین باعث شده کلی بحث توی X (توئیتر سابق) راه بیفته. خیلیها میگن این مدل میتونه قدرت مدلهای بسته (Proprietary AI) مثل GPT رو به چالش بکشه.
کاربرا از قیمت پایین آموزش مدل هم تعجب کردن، چون کل هزینه آموزش فقط ۴.۶ میلیون دلار بوده. البته بعضیا هنوز شک دارن که توی کدنویسی به اندازه بقیه بخشها قوی باشه.
منتشر شدن این مدل باعث شده بعضیا بگن آمریکا باید قوانین سختگیرانه هوش مصنوعی رو کمی راحتتر کنه، چون حالا مدلهای متنباز دارن با مدلهای بسته رقابت میکنن. از اون طرف، بعضی کارشناسا نگران بحث «همترازی» (Alignment) هستن، چون قدرت مدلهای باز هم حالا به سطح مدلهای تجاری رسیده.
https://www.kimi.com/
#هوش_مصنوعی
✈️@mohammad_zammani
پن: بهنظر بنده دیگه میتونیم از آمریکاییهای پولی عبور کنیم. بازده رایگانهای چینی در حد پولیهای گرانقیمت آمریکایی شده.
بنیاد | جواد محمدنیا
🔵 مدل جدید شرکت چینی Moonshot AI یعنی Kimi K2 Thinking حسابی سر و صدا کرده. این مدل متنبازه (Open-S
باز هم خلاقیت و نوآوری و باز هم DeepSeek
انتشار جدید DeepSeek واقعاً اتفاق مهمی برای دنیای LLMهای متنبازه. مدل DeepSeek-V3.2-Speciale از نظر توانایی در IMO 2025 و IOI 2025 تقریباً همسطح Gemini-3-Pro ظاهر شده و حتی تو چندتا benchmark هم ازش جلو زده. DeepSeek سه گلوگاه جدی رو شناسایی کرده: vanilla attention که تو توالیهای خیلی بلند کم میاره، کمبود post-training compute، و ضعف generalization تو سناریوهای agentic. برای همین هم DeepSeek-V3.2 رو معرفی کردن که هر سه مشکل رو همزمان هدف میگیره.
یکی از نوآوریهای مهم این مدل، DeepSeek Sparse Attention (DSA) هست که پیچیدگی attention رو از O(L²) به O(Lk) کاهش میده؛ جایی که k خیلی کوچیکتر از طول sequence هست. یه «lightning indexer» سبک تعیین میکنه کدوم tokenها مهمترن و فقط همون top-kها attention کامل میگیرن، و نتیجه اینه که تو contextهای طولانی سرعت بهطور قابلتوجهی بالا میره بدون اینکه کیفیت افت کنه. البته معماری بهتنهایی کافی نبوده؛ DeepSeek میزان post-training computeیی اختصاص داده که بیش از ۱۰٪ کل هزینه pre-trainingه و این سرمایهگذاری بزرگ روی RL باعث شده مدل تو reasoning خیلی قویتر بشه.
برای کارهای agentic هم یه سیستم خودکار ساختن که ۱٬۸۲۷ محیط مختلف و بیش از ۸۵ هزار prompt پیچیده تولید میکنه؛ شامل code agent، search agent و انواع تسکهای برنامهریزی، که همگی در مقیاس بزرگ برای آموزش RL ساخته شدن. از نظر نتایج هم DeepSeek-V3.2 تو AIME 2025 به ۹۳٫۱٪ رسیده (تقریباً نزدیک GPT-5-High که ۹۴٫۶٪ گرفته). تو SWE-Verified درصد حلشدهها ۷۳٫۱٪ بوده و تو HLE text-only هم ۲۵٫۱٪ عملکرد داشته که خیلی نزدیک GPT-5 با ۲۶٫۳٪ هست.
نسخه پرکامپیوتر این مدل یعنی DeepSeek-V3.2-Speciale حتی فراتر هم میره و تو IMO 2025 مدال طلا گرفته (با ۳۵ از ۴۲ امتیاز)، تو IOI 2025 به امتیاز ۴۹۲ از ۶۰۰ رسیده و تو ICPC World Finals 2025 تونسته ۱۰ تا از ۱۲ مسئله رو حل کنه. در نهایت این مدل اولین مدل متنبازیه که واقعاً میتونه با سیستمهای کلوزسورس پیشرو تو حوزههای reasoning، coding و تسکهای agentic رقابت جدی داشته باشه.
🔗لینک صفحه hf مدل
@reza_jafari_ai
49.5M حجم رسانه بالاست
مشاهده در ایتا
مرحلۀ دوم بدایة الحکمة؛ مبحث معرفتشناسی
جزء معدود زمانهایی است که از هوش مصنوعی اینقدر خوشحالم؛ چون هم به یک پرامپت عالی دست پیدا کردم و هم اینکه هوش مصنوعیها ارتقای خیلی خوبی پیدا کردن. درنتیجه این پرامپت برام فوق العاده بود؛ یعنی ۹۰درصد نتیجۀ دلخواهمو داد. شما هم میتونید واژۀ فلسفه رو تغییر بدید. یا با نمونه پرامپتهایی که در آینده میدم، متوجه میشید چه چیزایی رو میتونید عوض کنید. به هرحال، هر منبعیو خواستید آپلود کنید و اینطوری ی خلاصۀ عالی ازش به دست بیارید.
نکتۀ بعدی اینه که هر بخشیو که خلاصه میکنه، قبل از اینکه وارد بخش بعدی بشید، خودتون مطالعه کنید؛ ممکن از یک پاراگرافش راضی نباشد؛ بگید اون پاراگرافو باتوجه به متن منبع بیشتر توضیح بده.
نقش: تو یک دستیار پژوهشی دقیق هستی که وظیفه دارد متون پیچیده فلسفی را برای رساله دکتری «بازنویسی فشرده» (Condense) کند.
هدف: من به یک «جزوه درسی کامل» از این فصل نیاز دارم. نباید مطلب را آنقدر خلاصه کنی که منطق آسیب ببیند، و نباید آنقدر طولانی باشد که وقتگیر شود. هدف نهایی رسیدن به متنی با حجم حدود ۲۰ تا ۲۵ درصد متن اصلی است.
دستورالعمل اجرایی برای «زیربخش اول از فصل [۱]»:
ابتدا چکیدۀ کل فصل را در چهارصد کلمه به من بده؛ سپس طبق مراحل زیر پیش برو
۱. اولویت محتوا: تمام استدلالهای نویسنده را باز کن. اگر نویسنده میگوید «الف باعث ب میشود»، دقیقاً توضیح بده «چرا» و «چگونه». اگر برای رعایت محدودیت ۲۵ درصد مجبور به حذف چیزی شدی، فقط «مثالهای تکراری» یا «توضیحات بدیهی» را حذف کن، اما هرگز حلقههای استدلال منطقی را حذف نکن.
۲. ساختار منطقی: دقیقاً با همان ترتیب و نظمی که نویسنده بحث را پیش برده، جلو برو. از هیچ زیربخشی (Subsection) نپر.
۳. دیالکتیک: جدالهای نویسنده با منتقدانش را با دقت شرح بده (چه ایرادی گرفتند و نویسنده چه پاسخی داد).
۴. مدیریت حجم: سعی کن از سقف ۲۵ درصد کلمات عبور نکنی، اما از این فضا حداکثر استفاده ران ببر تا مطلب عمیق باشد. اگر مطلب کوتاه بود، بیهوده طولانیاش نکن.
لطفاً با رعایت این موارد، تحلیل را شروع کن.
هنگامی که هر زیر بخش را تمام کردی، از من بپرس که آیا کار را با زیر بخش بعدی شروع کنم یا نه؛ اگر موافقت کردم شروع کن تا فصل تمام شود؛ اگر فصل تمام شد تذکر بده و بگو آیا زیر بخش فصل بعدی را شروع کنم یا نه .
این پرامپت هم برای ترجمه فوقالعادهاست؛ البته اگر میخواید کل متن رو بدونید. دقت کنید، در ترجمه و خلاصه، هیچ هوش مصنوعیای مثل جمنای پولی کار نمیکنه:
"شما نقش یک مترجم حرفهای کتابهای علمی و دانشگاهی را دارید. وظیفه شما ترجمه دقیق، سلیس و روان فصلبهفصل یک کتاب انگلیسی است برای این کار موارد زیر رو در نظر بگیر که حائز اهمیت است:
1. ترجمه باید کاملاً روان، بومی و قابل فهم برای خواننده فارسیزبان باشد.
2. از ترجمه کلمهبهکلمه و تحتاللفظی پرهیز کرده و مفهوم هر جمله را بهدرستی منتقل کنید.
3. اصطلاحات علمی را با معادل دقیق فارسی یا همراه با توضیح کوتاه ترجمه کنید.
4. تنها فصل مشخصشده از فایل پیوستشده را بخوانید و ترجمه کنید.
5. ترجمه هر فصل باید منسجم، دقیق و در سطح قابل چاپ در یک کتاب فارسی باشد. همچنین کلیه بخش ها اعم از متن، جداول و اشکال نیز ترجمه شود و تمامی فرمول های ریاضی نیز شماره گذاری شود. توضیحات مربوط به جداول هم ترجمه شود و جداول قال انتقال به گوگل شیت باشد.
6. کلیه رفرنس های درون متنی بصورت کامل منتقل شود. این ارجاعات درونی متنی باید فارسی باشد و بصورت یک () باشد. هر فرمت دیگری برای ارجاعات درون متنی غیر از پارانتز باز و بسته ممنوع و غیرمجاز است.
7. متن بصورت خط به خط تحلیل و آنالیز شود و ترجمه کاملا علمی و دقیق آن صورت پذیرد و دقت کن که هیچ متنی جا نماند و ترجمه نشده باقی نماند. در ترجمه بسیار دقت کن که با حوصله همه مطالب را دقیقا ترجمه نمایی
8. در پایان ترجمه هر فصل فقط این جمله را از من بپرسید:
(( مایلی فصل بعدی رو ترجمه کنم؟))
خب حالا فصل اول ( فصل 1) را ترجمه کن و بعد اتمام ازم بپرس که مایل هستی فصل بعد را ترجمه کنم؟