Excel-এ ডুপ্লিকেট ডেটা মুছে ফেলার তিনটি সহজ উপায়!

জেনেনিন, কিভাবে Excel-এ ডুপ্লিকেট ডেটা মুছে ফেলবেন এই তিনটি সহজ উপায়!

Excel ব্যবহারকারীদের একটি সাধারণ সমস্যা হলো ডেটা সেটে ডুপ্লিকেট (Duplicate) ডেটা থাকা। এই ডুপ্লিকেট ডেটা আপনার অ্যানালাইসিসকে ভুল পথে চালিত করতে পারে এবং ডেটাবেসকে অযথা বড় করে তোলে। তাই, Excel-এ ডুপ্লিকেট ডেটা রিমুভ করা অত্যন্ত গুরুত্বপূর্ণ।

তাই আজকে আমরা দেখব Excel-এ ডুপ্লিকেট ডেটা মুছে ফেলার কিছু কার্যকর এবং সহজ পদ্ধতি ।

ডুপ্লিকেট ডেটা কেন বাদ দেবেন?

ডুপ্লিকেট ডেটা কেন বাদ দেবেন?
ডুপ্লিকেট ডেটা বাদ না দিলে কি সমস্যা হতে পারে? | Photo by Rubaitul Azad on Unsplash

এক্সেলে ডুপ্লিকেট ডেটা রাখা একাধিক সমস্যার কারণ হতে পারে, তাই সঠিক বিশ্লেষণ এবং কার্যকর রিপোর্টিংয়ের জন্য ডেটাসেট থেকে এসব ডেটা মুছে ফেলা অত্যন্ত জরুরি। 

প্রথমত, ডুপ্লিকেট ডেটা থাকলে আপনার গণনা ও বিশ্লেষণ ভুল হতে পারে। উদাহরণস্বরূপ, যদি একই গ্রাহকের নাম একাধিকবার তালিকাভুক্ত থাকে, তবে মোট গ্রাহক সংখ্যার হিসাব দ্বিগুণ বা ভুলভাবে প্রদর্শিত হবে। এতে সিদ্ধান্ত গ্রহণ প্রক্রিয়ায় বিভ্রান্তি সৃষ্টি হতে পারে। 

দ্বিতীয়ত, ডেটার নির্ভুলতা বজায় রাখতে ডুপ্লিকেট ডেটা বাদ দেওয়া প্রয়োজন, কারণ বিশুদ্ধ এবং নির্ভরযোগ্য ডেটাই ভালো বিশ্লেষণের ভিত্তি। তৃতীয়ত, অপ্রয়োজনীয় ডুপ্লিকেট ডেটা ফাইলের আকার বৃদ্ধি করে, যার ফলে ফাইলটি খুলতে, সম্পাদনা করতে এবং সংরক্ষণ করতে বেশি সময় লাগে। অতিরিক্ত ডেটা কেবল জায়গা নেয় না, বরং সিস্টেম পারফরম্যান্সও কমিয়ে দেয়।

আরও দেখুনঃ ল্যাপটপের ব্যাটারি ভালো রাখুন এই ৫টি সহজ উপায়ে!

Excel-এ ডুপ্লিকেট ডেটা মুছে ফেলার পদ্ধতি

Excel-এ ডুপ্লিকেট ডেটা সরানোর জন্য বেশ কয়েকটি সহজ পদ্ধতি রয়েছে। নিচে আমরা প্রধান তিনটি পদ্ধতি নিয়ে আলোচনা করব –

  • Remove Duplicates অপশন ব্যবহার করা
  • Conditional Formatting ব্যবহার করে ডুপ্লিকেট হাইলাইট করা
  • Advanced Filter ব্যবহার করে Unique ডেটা বের করা
চলুন তাহলে এই তিনটি পদ্ধতি সম্পর্কে বিস্তারিত দেখে নেওয়া যাক।

Remove Duplicates অপশন ব্যবহার করা

Remove Duplicates অপশন
Remove Duplicates অপশনটি ব্যবহার করে ডুপ্লিকেট ডেটা মুছে স্থায়ীভাবে মুছে ফেলা যায়।

Excel-এ ডুপ্লিকেট ডেটা সরানোর সবচেয়ে সহজ এবং সরাসরি পদ্ধতি হলো Remove Duplicates ফিচারটি ব্যবহার করা।

কিভাবে করবেন 

  • প্রথমে সেই ডেটা রেঞ্জটি নির্বাচন করুন যেখান থেকে আপনি ডুপ্লিকেট মুছতে চান। 
  • যদি আপনি পুরো ওয়ার্কশীট থেকেই ডুপ্লিকেট সরাতে চান, তাহলে যেকোনো একটি সেলে ক্লিক করে Ctrl + A চাপুন। 
  • এরপর এক্সেলের মেনু থেকে Data ট্যাবে যান এবং সেখানে Data Tools গ্রুপের মধ্যে থাকা Remove Duplicates অপশনটিতে ক্লিক করুন।
  • ক্লিক করার পর একটি ডায়ালগ বক্স খুলবে, যেখানে আপনার ডেটাসেটের কলাম হেডারগুলো দেখানো হবে। আপনি যদি চান নির্দিষ্ট একটি বা একাধিক কলামের ভিত্তিতে ডুপ্লিকেট খোঁজা হোক, তাহলে শুধুমাত্র সেই কলাম বা কলামগুলো টিক চিহ্ন দিয়ে নির্বাচন করুন। যেমন, যদি শুধু নামের কলামে ডুপ্লিকেট খুঁজতে চান, তাহলে শুধু নামের কলামটি নির্বাচন করুন। আবার, যদি চান যে তখনই কোনো রো ডুপ্লিকেট হিসেবে ধরা হবে যখন নির্বাচিত সব কলামের তথ্য একেবারে মিলে যাবে, তাহলে সবগুলো কলাম নির্বাচন করুন।
  • সবকিছু ঠিকভাবে নির্বাচন হয়ে গেলে OK বাটনে ক্লিক করুন। 
  • এরপরে, এক্সেল ডুপ্লিকেট ডেটা মুছে ফেলবে এবং একটি মেসেজ দেখাবে, যেখানে কতগুলো ডুপ্লিকেট ভ্যালু খুঁজে পাওয়া গেছে এবং সেগুলো সরানো হয়েছে তা উল্লেখ থাকবে। 

সুবিধাঃ এই পদ্ধতিটি খুব দ্রুত এবং স্বয়ংক্রিয়ভাবে ডুপ্লিকেট ডেটা সরিয়ে ফেলে।

অসুবিধাঃ এই পদ্ধতি ডুপ্লিকেট ডেটা স্থায়ীভাবে মুছে ফেলে। যদি আপনি মূল ডেটাসেটে কোনো পরিবর্তন না করে শুধু ডুপ্লিকেট ডেটা শনাক্ত করতে চান, তবে এটি উপযুক্ত নয়।

Conditional Formatting ব্যবহার করে ডুপ্লিকেট হাইলাইট করা

Conditional Formatting অপশন
ডুপ্লিকেট রেকর্ডগুলো শনাক্ত করে ম্যানুয়ালি রিভিউ করতে চাইলে Conditional Formatting অপশনটি ব্যবহার করুন।

আপনি যদি ডুপ্লিকেট ডেটা স্থায়ীভাবে না মুছে শুধু হাইলাইট করতে চান যাতে সেগুলো সহজেই শনাক্ত করা যায়, সেক্ষেত্রে Conditional Formatting ব্যবহার করতে পারেন।

কিভাবে করবেন 

  • এ কাজটি করতে প্রথমে যে ডেটা রেঞ্জ থেকে ডুপ্লিকেট হাইলাইট করতে চান, সেটি সিলেক্ট করুন। 
  • এরপর Excel রিবনের Home ট্যাবে যান এবং Styles গ্রুপের মধ্যে থাকা Conditional Formatting অপশনে ক্লিক করুন। 
  • ড্রপডাউন মেনু থেকে Highlight Cells Rules এ মাউস রাখলে আরও কিছু অপশন দেখা যাবে – সেখান থেকে Duplicate Values… অপশনটি বেছে নিন।
  • এরপর একটি ডায়ালগ বক্স ওপেন হবে, যেখানে আপনি ডুপ্লিকেট ভ্যালুগুলোর জন্য পছন্দসই ফরম্যাটিং স্টাইল (যেমন, লাল রঙে হাইলাইট করা বা হালকা লাল ব্যাকগ্রাউন্ড) নির্ধারণ করতে পারবেন। 
  • সবশেষে OK বাটনে ক্লিক করলে, আপনার নির্বাচিত ডেটা রেঞ্জে থাকা সব ডুপ্লিকেট ভ্যালু স্বয়ংক্রিয়ভাবে আপনার নির্ধারিত ফরম্যাটে হাইলাইট হয়ে যাবে।

সুবিধাঃ এই পদ্ধতি ডুপ্লিকেট ডেটা মুছে ফেলে না, শুধু দৃশ্যমান করে তোলে, যা আপনাকে ম্যানুয়ালি যাচাই করার সুযোগ দেয়।

অসুবিধাঃ এটি সরাসরি ডুপ্লিকেট ডেটা রিমুভ করে না।

Advanced Filter ব্যবহার করে Unique ডেটা বের করা

Advanced Filter অপশন
মূল ডেটাসেট অপরিবর্তিত রেখে শুধু ইউনিক ডেটা নিয়ে কাজ করতে চাইলে Advanced Filter অপশনটি ব্যাবহার করুন।

আপনি যদি আপনার ডেটাসেট থেকে শুধু Unique ভ্যালুগুলো অন্য কোথাও কপি করতে চান, তাহলে Advanced Filter অপশনটি আপনার জন্য খুব কার্যকর হতে পারে।

কিভাবে করবেন 

প্রথমে আপনার ডেটাসেটটি সিলেক্ট করুন। এরপর উপরের মেনুবার থেকে Data ট্যাবে যান এবং সেখানে থাকা Sort & Filter গ্রুপের মধ্যে Advanced অপশনটি ক্লিক করুন। এতে একটি ডায়ালগ বক্স খুলে যাবে।

এখানে কিছু সেটিং করতে হবেঃ

  • Action অংশে গিয়ে “Filter the list, in-place” এর পরিবর্তে “Copy to another location” নির্বাচন করুন।
  • List range-এ আপনার নির্বাচিত ডেটা রেঞ্জ স্বয়ংক্রিয়ভাবে চলে আসবে।
  • Criteria range অপশনটি খালি রাখুন।
  • এরপরে, Copy to অপশনে গিয়ে আপনি যেই সেল বা রেঞ্জে ইউনিক ডেটাগুলো কপি করতে চান, সেই সেল বা রেঞ্জের রেফারেন্স দিন।
  • তারপর নিচে থাকা Unique records only অপশনটিতে টিক দিন।

সবশেষে OK বাটনে ক্লিক করলে নির্ধারিত স্থানে শুধু ইউনিক মানগুলো কপি হয়ে যাবে।

সুবিধাঃ এই পদ্ধতিটি আপনার মূল ডেটাসেট অক্ষত রেখে শুধু Unique ডেটা আলাদা করে দেখায়।

অসুবিধাঃ এটি সরাসরি ডুপ্লিকেট ডেটা মুছে ফেলে না, বরং একটি নতুন স্থানে Unique ডেটা কপি করে।

কোন পদ্ধতিটি ব্যবহার করবেন?

Excel ফাইল
এই তিনটি পদ্ধতর মধ্যে কোন পদ্ধতিটি ব্যবহার করবেন? | Image by tomfield from Pixabay

যদি আপনি আপনার মূল ডেটাসেটে কোনো সমস্যা না দেখে স্থায়ীভাবে ডুপ্লিকেট ডেটা মুছে ফেলতে চান, তাহলে Remove Duplicates অপশনটি ব্যবহার করাই সবচেয়ে উপযুক্ত। এটি নির্দিষ্ট কলাম অনুযায়ী এক বা একাধিক অনুরূপ রেকর্ড একবার রেখে বাকিগুলো মুছে দেয়।

তবে, যদি আপনি ডেটা মুছে না ফেলে কেবলমাত্র ডুপ্লিকেট রেকর্ডগুলো শনাক্ত করে ম্যানুয়ালি রিভিউ করতে চান, সেক্ষেত্রে Conditional Formatting ব্যবহার করা ভালো। এটি ডুপ্লিকেট মানগুলোকে হাইলাইট করে, ফলে আপনি সহজেই সেগুলো চিহ্নিত করতে পারেন।

আবার, যদি আপনি মূল ডেটাসেট অপরিবর্তিত রেখে শুধু ইউনিক (ডুপ্লিকেটবিহীন) ডেটা নিয়ে কাজ করতে চান কিংবা সেগুলো অন্য কোথাও কপি করতে চান, তবে Advanced Filter একটি কার্যকরী সমাধান হতে পারে। এই পদ্ধতিতে আপনি ইউনিক রেকর্ডগুলো আলাদা করে একটি নতুন অবস্থানে স্থানান্তর করতে পারবেন, মূল ডেটা অক্ষত রেখেই।

কিছু গুরুত্বপূর্ণ টিপস

  • ডুপ্লিকেট ডেটা মুছে ফেলার আগে সবসময় আপনার মূল ডেটা সেটের একটি কপি তৈরি করে রাখা ভালো। এতে কোনো ভুল হলে আপনি মূল ডেটা ফিরে পাবেন।
  •  “Remove Duplicates” ব্যবহার করার সময় কোন কলামের ভিত্তিতে ডুপ্লিকেট ডেটা সরাবেন, তা খুব সতর্কতার সাথে নির্বাচন করুন। ভুল কলাম নির্বাচন করলে আপনার গুরুত্বপূর্ণ ডেটা মুছে যেতে পারে।
  • অনেক সময় ডুপ্লিকেট ডেটা সহজে খুঁজে পাওয়ার জন্য ডেটা সর্ট করে নেওয়া সহায়ক হতে পারে।
আশা করি উপরের নির্দেশনাগুলো আপনাকে Excel-এ ডুপ্লিকেট ডেটা মুছে ফেলার এবং হাইলাইট করার প্রক্রিয়াটি ভালোভাবে বুঝতে সাহায্য করেছে। এই পদ্ধতিগুলো ব্যবহার করে আপনি আপনার Excel ডেটাবেসকে আরও পরিষ্কার এবং কার্যকরী করে তুলতে পারবেন। 

আপনার যদি আরও কোনো প্রশ্ন থাকে, নিচে মন্তব্য করতে ভুলবেন না!

Subscribe
Notify of
guest

0 Comments
Most Voted
Newest Oldest
Inline Feedbacks
View all comments