مكتبة HuggingFace للرؤية الحاسوبية

SAM · التضمينات · نماذج لغة الرؤية

الأجندة

✂️

SAM3

تجزئة أي كائن باستخدام النص، الصناديق، أو صور مرجعية

🔍

تضمينات الرؤية (Embeddings)

البحث وتصنيف الصور حسب المعنى باستخدام CLIP و DINOv3

🧠

نماذج لغة الرؤية (Vision LLMs)

اطرح أي سؤال حول الصورة — Qwen3.5 و Gemma4

📄

OCR والمستندات

قراءة النصوص واستخراج الحقول — كل ذلك بنموذج VLM واحد

⚙️

الضبط الدقيق وواجهة Trainer API

الطريقة القياسية لتدريب وتكييف أي نموذج HuggingFace مع بياناتك

متطلبات سابقة: إكمال الأجزاء 1-4. أنت تعرف كيفية اكتشاف/تجزئة/تدريب/تصدير نماذج YOLO.

من YOLO إلى HuggingFace

ما تقدمه لك YOLO

اكتشاف، تجزئة، تصنيف، وتتبع — بسرعة فائقة.

مدربة مسبقاً على COCO (80 فئة).

إمكانية الضبط الدقيق على بياناتك الخاصة.

التصدير إلى ONNX / TensorRT للإنتاج.

ما تضيفه HuggingFace

أكثر من 500 ألف نموذج لمختلف مهام الذكاء الاصطناعي.

قراءة النصوص وفهم المستندات.

تجزئة أي شيء بدون بيانات تدريب.

الإجابة على الأسئلة باللغة الطبيعية حول الصور.

مكتبة HuggingFace ليست منافساً لـ YOLO — بل هي بقية حقيبة الأدوات التي تحتاجها.

1. منظومة HuggingFace

One hub. One API. Every model.

ما هي HuggingFace؟

🗂️

المستودع (Hub)
أكثر من 500 ألف نموذج، و100 ألف مجموعة بيانات — حمل أي نموذج بسطر واحد من Python

⚡

transformers
مكتبة Python موحدة للاستدلال، الضبط الدقيق، ونشر أي نموذج

🚀

المساحات (Spaces)
انشر تطبيقات Gradio تفاعلية في دقائق — شارك نموذجك مع العالم

خاتمة

حقيبة أدوات الرؤية الحاسوبية الموسعة الخاصة بك.

حقيبتك الكاملة

🎯

YOLO (Ultralytics)
اكتشاف · تجزئة · وضعيات · تتبع — سريع، جاهز للإنتاج، وقابل للتصدير

✂️

SAM3
تجزئة فورية (Zero-shot) — أي كائن، في أي مجال، عبر التوجيه بنقطة أو صندوق

🔍

CLIP + DINOv3
بحث دلالي في الصور — عبر الوصف النصي أو التشابه البصري

🧠

Qwen3.5 + Gemma4
تفكير بصري، OCR، وفهم المستندات — اسأل أي شيء وبأي لغة

تحدي: وصل القوة! 🎮

اختبر معلوماتك: قم بتوصيل النموذج بالمهمة الصحيحة

✂️

SAM 3.1

🔍

CLIP / DINO

🧠

Qwen VLM

البحث في الصور عبر النصوص

فهم محتوى المستندات والإجابة عليها

تحديد وعزل أي كائن بدقة

شكراً لاهتمامكم ووقتكم

يُسعدني الإجابة على استفساراتكم ومناقشاتكم