تشخیص پلاک خودرو یک مسئلهٔ دومرحلهای است: نخست یافتن مکان پلاک در تصویر و سپس خواندن کاراکترهای آن. ما برای مرحلهٔ آشکارسازی از یک مدل YOLO سبک استفاده میکنیم و برای خواندن متن از یک شبکهٔ CRNN با لایهٔ CTC که به ترتیب کاراکترها بدون نیاز به جداسازی دقیق رقمها حساس است.
کیفیت دیتاست تعیینکنندهٔ موفقیت پروژه است. پلاک ایرانی حروف فارسی، ارقام و رنگهای زمینهٔ متفاوت دارد، بنابراین دیتاست باید همهٔ این تنوع را بهعلاوهٔ شرایط نوری گوناگون، زاویههای مایل و تصاویر شب پوشش دهد. ما با افزونسازی داده شامل تغییر روشنایی، اعوجاج پرسپکتیو و افزودن نویز، تعمیمپذیری مدل را تقویت میکنیم.
برای استقرار روی لبه، مدل آموزشدیده را به ONNX تبدیل و سپس با TensorRT کوانتیزه میکنیم تا روی پردازندهای مثل Jetson به نرخ بالای ۲۵ فریم در ثانیه برسیم. کوانتیزهسازی به INT۸ حجم مدل را حدود ۴ برابر کم میکند و افت دقت معمولاً زیر ۱ درصد میماند که برای این کاربرد قابلقبول است.
سامانه در محیط واقعی به یک حلقهٔ بازخورد نیاز دارد؛ تصاویری که مدل با اطمینان پایین پردازش میکند برای بازبینی انسانی ذخیره میشوند و به دیتاست دور بعد افزوده میگردند. این چرخهٔ بهبود مداوم، دقت میدانی را در طول ماهها بالا میبرد و سامانه را در برابر شرایط جدیدی که در آموزش اولیه دیده نشده مقاوم میکند.