الوصف
قامت الخوارزمية الجينية بحساب الأوزان لكل مصطلح. في البداية قمت بتعيين أوزان عشوائية حقيقية القيمة (بين 0 و 1).
قام GA بحساب أفضل الأوزان باستخدام مجموعة بيانات التدريب. ثم صنفت كل صفحة اختبار عن طريق حساب تشابه جيب التمام للمتجه (الأوزان) التي تعلمتها GA مع متجه tf الطبيعي لصفحات الاختبار.
إذا كان التشابه أعلى من الحد الأدنى ، فقد صنفت الصفحة على أنها إيجابية. وإلا يتم تصنيفها على أنها سلبية.
يتم حساب ملاءمة الكروموسوم عن طريق حساب الدقة التنبؤية للكروموسوم.
لفهم الكود الخاص بي ، أنصحك بقراءة بعض الكتب أو الأوراق التمهيدية حول نموذج الفضاء المتجه لمجال استرجاع المعلومات ، والتصنيف من مجال استخراج البيانات.
لأن كل الأشياء الضرورية للحسابات مشروحة بالتفصيل في الورقة.
أوزيل ، سلمى عائشة. “نظام تصنيف صفحات الويب يعتمد على الخوارزمية الجينية باستخدام المصطلحات ذات العلامات كميزات.” الأنظمة الخبيرة مع التطبيقات 38.4 (2011): 3407-3415.
المراجعات
لا توجد مراجعات بعد.