مكتبة HuggingFace للرؤية الحاسوبية

SAM · التضمينات · نماذج لغة الرؤية

الأجندة

✂️
SAM3
تجزئة أي كائن باستخدام النص، الصناديق، أو صور مرجعية
🔍
تضمينات الرؤية (Embeddings)
البحث وتصنيف الصور حسب المعنى باستخدام CLIP و DINOv3
🧠
نماذج لغة الرؤية (Vision LLMs)
اطرح أي سؤال حول الصورة — Qwen3.5 و Gemma4
📄
OCR والمستندات
قراءة النصوص واستخراج الحقول — كل ذلك بنموذج VLM واحد
⚙️
الضبط الدقيق وواجهة Trainer API
الطريقة القياسية لتدريب وتكييف أي نموذج HuggingFace مع بياناتك

متطلبات سابقة: إكمال الأجزاء 1-4. أنت تعرف كيفية اكتشاف/تجزئة/تدريب/تصدير نماذج YOLO.

من YOLO إلى HuggingFace

ما تقدمه لك YOLO

  • اكتشاف، تجزئة، تصنيف، وتتبع — بسرعة فائقة.
  • مدربة مسبقاً على COCO (80 فئة).
  • إمكانية الضبط الدقيق على بياناتك الخاصة.
  • التصدير إلى ONNX / TensorRT للإنتاج.

ما تضيفه HuggingFace

  • أكثر من 500 ألف نموذج لمختلف مهام الذكاء الاصطناعي.
  • قراءة النصوص وفهم المستندات.
  • تجزئة أي شيء بدون بيانات تدريب.
  • الإجابة على الأسئلة باللغة الطبيعية حول الصور.

مكتبة HuggingFace ليست منافساً لـ YOLO — بل هي بقية حقيبة الأدوات التي تحتاجها.

1. منظومة HuggingFace

One hub. One API. Every model.

ما هي HuggingFace؟

🗂️
المستودع (Hub)
أكثر من 500 ألف نموذج، و100 ألف مجموعة بيانات — حمل أي نموذج بسطر واحد من Python
transformers
مكتبة Python موحدة للاستدلال، الضبط الدقيق، ونشر أي نموذج
🚀
المساحات (Spaces)
انشر تطبيقات Gradio تفاعلية في دقائق — شارك نموذجك مع العالم

خاتمة

حقيبة أدوات الرؤية الحاسوبية الموسعة الخاصة بك.

حقيبتك الكاملة

🎯
YOLO (Ultralytics)
اكتشاف · تجزئة · وضعيات · تتبع — سريع، جاهز للإنتاج، وقابل للتصدير
✂️
SAM3
تجزئة فورية (Zero-shot) — أي كائن، في أي مجال، عبر التوجيه بنقطة أو صندوق
🔍
CLIP + DINOv3
بحث دلالي في الصور — عبر الوصف النصي أو التشابه البصري
🧠
Qwen3.5 + Gemma4
تفكير بصري، OCR، وفهم المستندات — اسأل أي شيء وبأي لغة

تحدي: وصل القوة! 🎮

اختبر معلوماتك: قم بتوصيل النموذج بالمهمة الصحيحة

✂️
SAM 3.1
🔍
CLIP / DINO
🧠
Qwen VLM
البحث في الصور عبر النصوص
فهم محتوى المستندات والإجابة عليها
تحديد وعزل أي كائن بدقة

شكراً لاهتمامكم ووقتكم

يُسعدني الإجابة على استفساراتكم ومناقشاتكم