الوصف
في هذا المشروع ، نستكشف التقييم الجمالي الآلي للصور الفوتوغرافية باستخدام تقنيات التعلم الآلي ومعالجة الصور.
نحن نفترض أن التوزيع المكاني لعناصر بصرية معينة داخل صورة معينة يرتبط بجودتها الجمالية. تحقيقًا لهذه الغاية ، نقدم أسلوبًا جديدًا حيث نقوم بنمذجة كل صورة كمجموعة من المربعات ، واستخراج الميزات المرئية من كل بلاطة ، وتدريب المصنف على الميزات الناتجة جنبًا إلى جنب مع تقييمات جماليات الصور.
يحقق نموذجنا معدل نجاح في تصنيف المصادقة المتقاطعة يبلغ 10 أضعاف بنسبة 83: 60٪ ، مما يؤكد فعالية منهجيتنا وبالتالي يبدي وعدًا بالتطوير المستقبلي.
الجدول 1. دقة تصنيف 10 أضعاف
يوضح الجدول 1 دقة التحقق من الصحة التي تبلغ 10 أضعاف لكل من خوارزميات التعلم. لكلا مجموعتي البيانات ، حصلنا على أعلى أداء مع GBRTs بدقة 80: 88٪ و 83: 60٪. إن ما نشهده من جودة مماثلة للنتائج لكلتا مجموعتي البيانات يدل على أن منهجيتنا سليمة.
يوضح الشكل 3 مصفوفة الارتباك للتحقق من صحة 10 أضعاف باستخدام GBRTs في مجموعة بيانات photo.net. تكون المعدلات الإيجابية والخاطئة الحقيقية متماثلة تقريبًا مع المعدلات الإيجابية السلبية والخاطئة ، على التوالي ، مما يدل على أن المصنف الخاص بنا ليس منحازًا للتنبؤ بفئة معينة. ينطبق هذا أيضًا على مجموعة بيانات DPChallenge.
كود Python لدمج صورتين منفصلتين لإنشاء صورة واحدة متعددة الأشخاص
تأخذ شفرة Python صورة ثنائية يتم تغذيتها إلى Tesseract OCR
المراجعات
لا توجد مراجعات بعد.