نظام مراقبة الفيديو المحمول

تحسين يولوف 3 الخوارزمية لاكتشاف حالة سلامة البانتوجراف

2022-08-02 09:13

خلاصة:&نبسب ;يعد المنساخ مكونًا مهمًا يربط المعدات الدارجة بشبكة إمداد الطاقة ، لذا فإن حالة أمان المنساخ أمر حيوي للتشغيل السلس والمستقر للمخزون.


في هذا البحث ، من خلال تحليل إطار تلو الآخر ، صور فيديو البانتوجراف التي يتم مراقبتها بواسطة نظام مراقبة الفيديو على اللوحة ، تتم مراقبة حالة أمان المنساخ في الوقت الفعلي عن طريق تعديل خوارزمية التعرف على الهدف يولوف 3 المستخدمة على نطاق واسع في الصناعة لتحديد الهيكلية تشوهات ، وشرر ، واقتحام جسم غريب للمنساخ في نفس الوقت. أثبتت التجارب أن قناة واحدة يمكن أن تصل إلى 40 إطارًا في الثانية على خادم تحليل ذكي على متن تينو . يمكن أن تحصل دقة الكشف الشاملة خريطة @0.5 على 98٪ ، مما يحقق نتائج اكتشاف دقيقة نسبيًا في الوقت الفعلي.


1. المراقبة الذكية للمنساخ


تعد خوارزميات التعرف على الهدف النموذجية الحالية القائمة على التعلم العميق خوارزميات من مرحلتين مثل خوارزمية أسرع R-سي إن إن وخوارزميات أحادية المرحلة مثل خوارزمية يولوف 3 . لا تحتاج خوارزمية يولو إلى حساب الإطار المرشح مقدمًا مقارنة بـ R- شبكة سي إن إن ، مما يقلل من الجهد الحسابي ويمكن أن يحقق سرعة حسابية أسرع. تعمل خوارزمية يولوف 3 على تحسين النقص في الكشف متعدد المقاييس للجيل السابق من خوارزمية يولو من خلال وجود ثلاثة فروع في جزء شبكة التعرف ، والتي يمكنها التعامل مع مشكلة التعرف على الهدف على ثلاثة مستويات: صغيرة ومتوسطة وكبيرة. بالإضافة إلى ذلك ، تتمتع خوارزمية يولوف 3 بدعم هندسي أفضل ويتم استخدامها في الشرف الصناعي في عدد كبير من التطبيقات. لذلك ، في هذه الورقة ،


2. بناء خوارزمية الكشف عن حالة سلامة البانتوجراف


2.1 التجريد المستهدف


يمكن تقسيم الكشف عن حالة أمان البانتوجراف إلى كشف شذوذ هيكل البانتوجراف ، واكتشاف حريق البانتوجراف ، وكشف التسلل للأجسام الغريبة ، وما إلى ذلك ، من بينها ، يمكن تقسيم شذوذ هيكل البانتوجراف إلى تشوه لوحة الشريحة الكربونية ، والإمالة ، وكسر زاوية القوس اليمنى واليسرى ، واليسار واليمين. زاوية القوس اليمنى مفقودة ، إلخ. تظهر الحالات القياسية غير الطبيعية في الشكل 1B-F.

pantograph

الشكل 1 حالة سلامة المنساخ ومعايير وضع العلامات الخوارزمية


لاستخدام خوارزمية تحديد الهدف ، من الضروري أولاً استخلاص هدف التعريف للكشف عن حالة أمان المنساخ ، ويظهر هدف التعريف الملخص في الشكل 1. يتم تمييز البانتوجراف في الحالة العادية والحالة غير الطبيعية بشكل موحد. يتم تمييز الأهداف مثل قرص القوس وزاوية القوس في الحالة الطبيعية وقرص القوس وزاوية القوس في حالة غير طبيعية والشرر والأجسام الغريبة. ثم يتم وضع البيانات المصنفة في نموذج موحد للتدريب لتحديد جميع حالات الأمان للبانتوجراف في وقت واحد.


2.2 تحسين بيانات مجموعة البيانات القائمة على الشبكة العصبية لـ جان


بعد تحديد هدف الاكتشاف ، نحتاج إلى بناء مجموعة بيانات حالة أمان البانتوجراف الخاصة بنا لمعرفة الميزات الضرورية من مجموعة البيانات للحالات المختلفة للبانتوجراف باستخدام أساليب التعلم العميق. تم اعتراض مجموعة البيانات المطلوبة لبناء الخوارزمية في هذه الورقة من عدة نماذج للمراقبة بالفيديو في جميع الأحوال الجوية. لتقليل تأثير البيئة على خصائص البيانات ، يتم مراعاة ظروف العمل مثل الإضاءة ، والانسداد ، والأيام الملبدة بالغيوم ، والمطر والثلج ، والدخول والخروج ، وما إلى ذلك ، بشكل كامل في عملية إعداد مواد البيانات. حالات خطأ البانتوجراف في البيانات التي تم تعيينها كلها تأتي أيضًا من صور المراقبة بالفيديو عندما يحدث خطأ البانتوجراف في شكل التشغيل الأساسي لقطار المحرك.


مع الأخذ في الاعتبار أن بعض أنواع الأخطاء تحدث بشكل أقل تكرارًا في ظروف التشغيل الفعلية ، مما قد يؤدي إلى عدم كفاية إعداد البيانات. سيؤثر عدم التوازن بين بيانات الفئة بشكل كبير على تأثير التعرف على الهدف ، لذلك تتبنى هذه الورقة طريقة تحسين البيانات القائمة على الشبكة العصبية جان لفئات مختلفة من البيانات.


شبكة الخصومة التوليدية جان تحتوي على نموذجين ، نموذج توليدي ، ونموذج تمييزي. تتمثل مهمة النموذج التوليدي في إنشاء مثيلات تبدو واقعية بشكل طبيعي ومماثلة للبيانات الأصلية. تتمثل مهمة النموذج المميز في تحديد ما إذا كان مثال معين يبدو حقيقيًا بطبيعته أو مزيفًا بشكل مصطنع.&نبسب ;


يمكن اعتبارها لعبة محصلتها صفر. يحاول المولد خداع أداة التمييز ، ويحاول أداة التمييز ألا تنخدع بالمولد. يتم تدريب النماذج عن طريق التحسين البديل ، ويمكن تحسين كلا النموذجين. بناءً على هاتين الشبكتين ، تُستخدم شبكة المولد لتوليد الصورة ، والتي تتلقى ضوضاء عشوائية z وتسبب الصورة بواسطة هذا الضجيج ، المشار إليه باسم G (z). المُميِّز عبارة عن شبكة تمييزية تحدد ما إذا كانت الصورة موجودة أم لا"حقيقي"أم لا. الإدخال الخاص به هو x ، يمثل x صورة ، ويمثل الإخراج D (x) احتمال أن تكون x صورة فعلية. إذا كانت 1 ، فهذا يعني صورة دقيقة بنسبة 100٪ ، وإذا كان الناتج 0 ، فمن المستحيل أن تكون صورة دقيقة. ثم يتم عرض شبكة جان بشكل تخطيطي في الشكل 2. x هي البيانات الفعلية ، وتتوافق البيانات الدقيقة مع توزيع بداتا (x). Z هي البيانات الصاخبة ، وتتوافق البيانات الصاخبة مع توزيع Pz (z) ، مثل توزيع غاوسي أو توزيع منتظم. ثم يتم أخذ العينات من z الصاخبة ، ويتم إنشاء البيانات x = G (z) بعد تمرير G. ثم يتم إدخال البيانات الفعلية في المصنف D ، وتتبع الوظيفة السينية المعلومات التي تم إنشاؤها ، ويحدد الإخراج الفئة.

video surveillance

&نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; الشكل 2 رسم تخطيطي لمبدأ شبكة جان


تحويل الصورة إلى صورة هو فئة من مشاكل الرؤية والرسومات التي تهدف إلى تعلم التعيينات بين الصور المدخلة والمخرجة باستخدام مجموعة تدريب من أزواج الصور المتوافقة. هدفنا هو معرفة G: X رسم الخرائط → بحيث لا يمكن تمييز توزيع الصور من G (X) عن التوزيع Y باستخدام الخسارة العدائية. نظرًا لأن هذا التعيين مقيد للغاية ، فنحن نربطه برسم خرائط عكسي F: Y → ونقدم خسارة تناسق دوري لدفع F (G (X)) ≈ X (والعكس صحيح). يتم تقديم النتائج النوعية في العديد من المهام حيث لا توجد بيانات تدريب مقترنة ، بما في ذلك تحويل طريقة التجميع ، وتحويل الكائن ، والتحول الموسمي ، وتحسين الصورة. قدر الإمكان ، يتم تحديد المشاهد المتشابهة أو المتشابهة مع احتوائها على صور مميزة مختلفة. على سبيل المثال ، في نفس المشهد ، الكاميرا متسخة وليست متسخة ؛ الكاميرا بها صور مطر ولا مطر. من نتائج التدريب ، يمكننا أن نرى أنه إذا كانت الصورتان المحددتان مختلفتين للغاية في الموقع ، فإن الميزات الأخرى المضمنة ستؤثر كثيرًا على تأثير التدريب وجودة إنشاء الصورة. وإذا كانت الصور التي تم إنشاؤها من المشاهد المماثلة المختارة ذات جودة مقبولة ، فسيتم عرض تأثير تحسين البيانات في الشكل 3.

pantograph cctv

&نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; الشكل 3 الشكل 3 تأثير تعزيز مجموعة البيانات


بالإضافة إلى ذلك ، تتبنى هذه الورقة أيضًا طريقة أخذ العينات الزائدة لتوسيع مجموعة البيانات ، جنبًا إلى جنب مع شبكة يولوف 3 ، وتأتي مع وسائل تحسين البيانات ، واقتصاص الحزم العشوائي ، والتقليب العشوائي ، وتحويل الصفاء ، وغيرها من العمليات ؛&نبسب ;


يتم توسيع البيانات بشكل فعال لتعزيز قدرة الخوارزمية على التكيف وتوفير قوة أعلى لاكتشاف الكائنات في مرحلة النشر للاستخدام العملي. ومع ذلك ، للتمييز بين زاويتى القوس اليمنى واليسرى ، يتم إيقاف تشغيل مفاتيح التقليب والدوران العشوائية فى خوارزمية هذه الورقة.


2.3 تحسين خوارزمية التعرف على أساس شبكة يولوف 3


يستخدم الجزء الأساسي من يولوف 3 بنية Darknet53 للمؤلف ، والتي يمكنها حل مشاكل اختفاء التدرج والانفجار المتدرج من خلال الجمع بين الشبكة العصبية التلافيفية (سي إن إن ) وشبكة البنية المتبقية (ResNet ) ، مما يجعل تدريب الشبكات العميقة ممكنًا. بالإضافة إلى ذلك ، لا تحتاج الخوارزمية إلى حساب المربعات المرشحة مسبقًا. ومع ذلك ، فإنه يحصل على BondingBox مسبقًا عن طريق التجميع واختيار 9 مجموعات وثلاثة مقاييس وتوزيع هذه المجموعات التسعة بالتساوي على هذه المقاييس الثلاثة. ومع ذلك ، نظرًا لمشكلة المقياس ، فإن دقة خوارزمية يولو ليست الأفضل بين خوارزميات التعرف على الهدف ، خاصة في اكتشاف الأهداف الصغيرة. لتحسين دقة الكشف عن خوارزمية يولوف 3 مع الحفاظ على سرعة عالية ، تم تعديل العمود الفقري لـ يولوف 3 . تتمثل الطريقة المحددة في إضافة وحدة SE الانتباه للقناة إلى الوحدة المتبقية من darknet53 . يظهر هيكل وحدة الشبكة المتبقية قبل التحويل وبعده في الشكل 4.

pantograph

&نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ; &نبسب ;الشكل 4 الهيكل المتبقي لوحدة SE قبل التعديل وبعده


تأتي وحدة SE من SENet ، والتي تعني يعصر -و -الإثارة الشبكات ، وحصلت على بطولة مسابقة تصنيف ImageNet 2017 ، وهي معروفة بفعاليتها وسهولة تنفيذها ، ويمكن تحميلها بسهولة في أطر عمل نماذج الشبكة الحالية. الارتباط بين القنوات وتصفية الانتباه للقنوات ، مما يزيد قليلاً من الحساب ، لكن التأثير أفضل. يحتوي الجزء الأساسي من Darknet على إجمالي 23 وحدة وحدة متبقية. في هذا البحث ، يتم تحويل وحدات الدقة الأصلية إلى وحدات SE -الدقة لبعض الوحدات المتبقية. لتحسين قدرة الكشف لشبكة يولوف 3 للأهداف الصغيرة والمتوسطة ، فإن الوحدات المتبقية التي قمنا بتغييرها موجودة أيضًا في هذين الفرعين. يوضح الشكل 5 بنية الشبكة الشاملة لـ يولوف 3 التي تم تحويلها بواسطة وحدة SE .

video surveillance

الشكل 5 مخطط هيكل شبكة يولوف 3


في جزء شبكة التعرف ، أصبح يولوف 3 أكثر فاعلية من خلال أخذ العينات والتتالي عبر الطبقات لإخراج ثلاثة مقاييس مختلفة لنتائج الكشف. في جزء تصميم دالة الخسارة ، يتم التعرف على الثقة المستهدفة والفئة والموضع في الحال من خلال دالة خسارة الانتروبيا المتقاطعة ، وتظهر وظيفة الخسارة في المعادلة 1.

pantograph cctv

3. تحليل النتائج التجريبية


3.1 مقدمة لخادم التحليل الذكي لـ تينو


تحتوي معظم أنظمة المراقبة بالفيديو الموجودة داخل السيارة على وظائف مراقبة وتخزين الفيديو فقط ولكنها لا تمتلك القدرة على التحليل الذكي عبر الإنترنت. يتم تنفيذ أجهزة هذه الورقة بمساعدة خادم التحليل الذكي الموجود على متن الطائرة والذي طورته شركة شاندونغ تينو ذكي شارك . ، كما هو موضح في الشكل 6. وقد تم تجهيز المضيف بشريحة ذكية مطورة ذاتيًا لمعمارية دا فينشي منظمة العفو الدولية من هواوي ، والتي يمكنها التعامل مع تطبيقات التحليل المبتكرة في معظم السيناريوهات وتحقيق مهام فك التشفير والتحليل الذكي لما يصل إلى 16 قناة فيديو بدقة 720 بكسل. ويمكن نقل نتائج الاختبار إلى كابينة السائق أو الميكانيكي في الوقت الفعلي بحيث يمكن مراجعة نتائج الاختبار يدويًا واتخاذ تدابير السلامة المقابلة. تستخدم هذه الورقة هذا الجهاز لتحقيق سرعة حسابية تبلغ 60 إطارًا في الثانية عند تشغيل قناة فيديو واحدة بكاميرا. يمكن أن يضمن التحليل المتزامن لـ 4 قنوات لمقاطع فيديو متعددة سرعة الحساب البالغة 25 إطارًا في الثانية ، والتي يمكن أن تحقق الطلب على التحليل الذكي في الوقت الفعلي للفيديو متعدد القنوات.

pantograph

الشكل 6 خادم التحليل الذكي ومخطط الواجهة


3.2 نتائج تحديد حالة البانتوجراف


للكشف عن حالة سلامة البانتوجراف ، تُنشئ هذه الورقة مجموعة بيانات حالة أمان البانتوجراف الخاصة بها ، والتي تحتوي على 2388 صورة لأشكال مختلفة من البانتوجراف ، بما في ذلك البانتوجراف في الحالة العادية وصور مراقبة البانتوجراف في الحالة غير الطبيعية تحت ظروف العمل المختلفة. يتم تدريب مجموعة البيانات المصنفة باستخدام إطار darknet ، وتظهر عملية التدريب في الشكل 7. ويمكن أن نرى من الشكل أن خسارة التدريب تظل مستقرة بعد 12000 تكرار ، وقد يقع النموذج في المستوى الأمثل المحلي. يتم تعديل معدل التعلم مرة واحدة عند 20000 تكرار ، وتنخفض الخسارة إلى أقل من 0.1. التحسن في الدقة الحسابية من 20000 تكرار فصاعدًا ليس مهمًا ، ويظهر مخطط خريطة المقابل خسارة طفيفة في قدرة التعميم للنموذج. للنظر في فقدان التدريب وخريطة ،

video surveillance

الشكل 4 عملية التدريب على تحديد حالة سلامة البانتوجراف


لنشر النموذج المدرَّب على مضيف التحليل الذكي ، يجب تحويل النموذج المدرَّب إلى تنسيق أوم المدعوم من بنية هواوي دا فينشي ، مع فقد طفيف للدقة في عملية التحويل ، ولكن كل ذلك ضمن نطاق مقبول.

pantograph cctv


4. ملخص وتوقع


تستخدم هذه الورقة خوارزمية يولوف 3 لاكتشاف حالة سلامة البانتوجراف ، بما في ذلك التشوهات الهيكلية والشرر وتطفل الأجسام الغريبة ، من خلال مراقبة الفيديو في الوقت الفعلي ، مع مراعاة سرعة الكشف مع ضمان دقة الكشف التي تلبي متطلبات تحليل الوقت. يوفر أفكارًا جديدة لاستخدام نظام تحليل ذكي على متن الطائرة في فحص سلامة البانتوجراف.

الحصول على آخر سعر؟ سنرد في أسرع وقت ممكن (خلال 12 ساعة)
This field is required
This field is required
Required and valid email address
This field is required
This field is required
For a better browsing experience, we recommend that you use Chrome, Firefox, Safari and Edge browsers.