📄 مدل PaddleOCR-VL (0.9B) — مدل چندوجهی سبک و قدرتمند از Baidu AI
تیم Baidu AI از مدل جدید خود با نام PaddleOCR-VL (نسخه 0.9B) رونمایی کرده است — مدلی بسیار فشرده در دستهی Vision-Language Models (VLM) که بهرغم اندازهی کوچک، در چندین وظیفهی بینایی-زبانی به دقت در سطح SOTA (state-of-the-art) دست یافته است:
🔹 شناسایی و درک متون
🔹 استخراج داده از جداول
🔹 تشخیص فرمولهای ریاضی
🔹 تحلیل و تفسیر نمودارها و گرافها
💡 زیرساخت فنی:
🧠 بخش NaViT — انکودر دیداری پویا برای پردازش تصاویر با ابعاد متغیر
💬 بخش ERNIE-Lite — نسخهی سبکشده از مدل زبانی Baidu با توانایی درک متنی پیشرفته
⚡️ پشتیبانی از ۱۰۹ زبان زنده دنیا — از جمله انگلیسی، چینی، عربی، فارسی و دیگر زبانها
🔗 منابع رسمی:
🟠 GitHub:
🟠 HuggingFace:
🟠 مستندات:
#BaiduAI #PaddlePaddle #Ernie #PaddleOCR #VisionLanguage #AI #OCR
🔹
#هوش_مصنوعی #chatgpt #تکنولوژی
______@ChatGpt_io 〽️