مقایسه دو فایل اکسل خیلی بد و نا منظم و نا منطبق و استخراج رکورد ها و خطوط متفاوت از آن ها

مقایسه دو فایل اکسل خیلی بد و نا منظم و نا منطبق و استخراج رکورد ها و خطوط متفاوت از آن ها

پایتون پانداز - مقایسه فایل های اکسل

ممم..

خیلی اتفاقی یکی از دوستانم درخواست مقایسه دو فایل اکسل که هر کدوم بالغ بر ۱۳۰۰۰ خط رکورد رو داشتن رو از من کرد، نهایتا من با پایتون پاندا و پایتون numpy این کار رو براش انجام دادم. فایل های اصلی رو در اختیار ندارم و کد رو دوستم روی فایل های اصلی اجرا کرده،  ولی فایل های سمپل و کد پایتون رو اینجا باهاتون به اشتراک میذارم.

اینها دو فایل اکسل هستن که مشخصات ماشین های قرار داده شده در پارکینگ در اون ها درج شده و بر اساس ستون motor و ستون badane مقایسه انجام شده.

اینجوری بود که شماره موتور ها کامل درج نشده بودن مثلا توی یک فایل شماره موتور یک ماشین رو داشتیم که aaabbbccc123 بود و توی اون یکی bbbccc123، و می خواستیم این ماشین توی فایل سوم که به عنوان نتیجه ایجاد میشه دیده نشه.

مقایسه چند بار به ترتیب توسط فایل compare2.py - compare-badane.py و نهایتا compare3-nahaie.py انجام شده است.

حواستون باشه که فایل های پایتون، پسوند txt آخر رو از انتها بردارین تا بتونین اجراش کنین.

توجه داشته باشین که باید فایل های بزرگی داشته باشین.

برچسب‌ها