এক্সেলে আউটলিয়ার্স ফাংশনটি কীভাবে (এবং কেন) ব্যবহার করবেন

আউটলেটর এমন একটি মান যা আপনার ডেটাতে থাকা বেশিরভাগ মানের থেকে উল্লেখযোগ্যভাবে উচ্চ বা কম। ডেটা বিশ্লেষণ করতে এক্সেল ব্যবহার করার সময়, বহিরাগতরা ফলাফলগুলি স্কিউ করতে পারে। উদাহরণস্বরূপ, একটি ডেটা সেট গড় গড় সত্যই আপনার মান প্রতিফলিত করতে পারে। এক্সেল আপনার আউটলিয়ারদের পরিচালনা করতে কয়েকটি দরকারী কার্যকারিতা সরবরাহ করে, তাই আসুন একবার দেখে নেওয়া যাক।

একটি দ্রুত উদাহরণ

নীচের চিত্রটিতে, বহিরাগতরা স্পষ্টভাবে যুক্তিসঙ্গতভাবে সহজ — এরিককে অর্পিত দু'জনের মান এবং রায়ানকে নির্ধারিত 173 এর মান। এই জাতীয় ডেটা সেট করাতে, সেই আউটলিয়ারদের ম্যানুয়ালি স্পট করা এবং ডিল করা যথেষ্ট সহজ easy

একটি বৃহত ডেটা সেটগুলিতে, এটি হবে না the বহিরাগতদের সনাক্ত করতে এবং তাদের পরিসংখ্যান সংক্রান্ত গণনা থেকে অপসারণ করতে সক্ষম হওয়া গুরুত্বপূর্ণ — এবং আমরা এই নিবন্ধে কীভাবে করব তার দিকে নজর রাখব।

কীভাবে আপনার ডেটাতে আউটলিয়ারগুলি খুঁজে পাবেন

ডেটা সেটে আউটলিয়ারগুলি খুঁজতে, আমরা নিম্নলিখিত পদক্ষেপগুলি ব্যবহার করি:

  1. 1 ম এবং 3 য় ভাগের অংশ গণনা করুন (আমরা সেগুলির মধ্যে কিছুটা কী হবে তা নিয়ে আলোচনা করব)।
  2. আন্তঃদেশীয় পরিসরটি মূল্যায়ন করুন (আমরা আরও আরও নীচে এগুলি ব্যাখ্যা করব)।
  3. আমাদের ডেটা ব্যাপ্তির উপরের এবং নিম্ন সীমাটি ফিরিয়ে দিন।
  4. বাহ্যিক ডেটা পয়েন্টগুলি সনাক্ত করতে এই সীমাগুলি ব্যবহার করুন।

নীচের চিত্রটিতে প্রদর্শিত ডেটা সেটের ডানদিকে কক্ষ পরিসর এই মানগুলি সঞ্চয় করতে ব্যবহৃত হবে।

চল শুরু করি.

প্রথম ধাপ: কোয়ার্টাইল গণনা করুন

আপনি যদি আপনার ডেটা কোয়ার্টারে বিভক্ত করেন তবে সেই সেটগুলির প্রত্যেককেই কোয়ার্টাইল বলা হয়। সীমাতে সর্বনিম্ন 25% সংখ্যা 1 ম চৌম্বক, পরবর্তী 25% 2 য় চতুর্থাংশ এবং আরও অনেক কিছু তৈরি করে। আমরা প্রথমে এই পদক্ষেপটি গ্রহণ করেছি কারণ আউটলারের সর্বাধিক ব্যবহৃত সংজ্ঞাটি এমন একটি ডেটা পয়েন্ট যা 1 ম কোয়ার্টাইলের নীচে 1.5 ইন্টারকোটারাইল রেঞ্জ (আইকিউআর) এর বেশি এবং তৃতীয় কোয়ার্টাইলের উপরে 1.5 ইন্টারকোটারিল রেঞ্জ রয়েছে। এই মানগুলি নির্ধারণ করতে, আমাদের প্রথমে কোয়ার্টাইলগুলি কী তা নির্ধারণ করতে হবে।

এক্সটেল কোয়ার্টাইল গণনা করার জন্য একটি কোয়ার্টাইল ফাংশন সরবরাহ করে। এর জন্য দুটি টুকরো তথ্যের প্রয়োজন: অ্যারে এবং কোয়ার্ট।

= কোয়ার্টাইল (অ্যারে, কোয়ার্ট)

দ্য অ্যারে আপনি যে মূল্যবোধগুলি মূল্যায়ন করছেন তার পরিসর is এবং কোয়ার্ট এমন একটি সংখ্যা যা আপনি প্রত্যাবর্তন করতে চান এমন চতুর্ভুজকে উপস্থাপন করে (উদাঃ, 1 ম চতুর্থ অংশের 1, 2 য় চতুর্থের জন্য 2 এবং আরও)।

বিঃদ্রঃ: এক্সেল 2010 এ, মাইক্রোসফ্ট কোয়ার্টাইল ফাংশনের উন্নতি হিসাবে কোয়ার্টাইল.আইএনসি এবং কোয়ার্টাইল.এক্সসি ফাংশন প্রকাশ করেছে। এক্সেলের একাধিক সংস্করণ জুড়ে কাজ করার সময় কোয়ার্টাইল আরও পিছিয়ে উপযুক্ত।

আসুন আমাদের উদাহরণ সারণীতে ফিরে আসি।

1 ম কোয়ারটাইল গণনা করতে আমরা সেল F2 এ নিম্নলিখিত সূত্রটি ব্যবহার করতে পারি।

= কোয়ার্টাইল (বি 2: বি 14,1)

আপনি সূত্রটি প্রবেশ করার সাথে সাথে এক্সেল কোয়ার্ট আর্গুমেন্টের জন্য বিকল্পগুলির একটি তালিকা সরবরাহ করে।

তৃতীয় চতুর্থাংশ গণনা করতে, আমরা সেল এফ 3 তে আগের মতো একটি সূত্র প্রবেশ করতে পারি, তবে একটিটির পরিবর্তে তিনটি ব্যবহার করতে পারি।

= কোয়ার্টাইল (বি 2: বি 14,3)

এখন, আমরা কোষগুলিতে প্রদর্শিত কোয়ার্টাল ডেটা পয়েন্ট পেয়েছি।

দ্বিতীয় ধাপ: আন্তঃদেশীয় রেঞ্জের মূল্যায়ন করুন

আন্তঃদেশীয় পরিসর (বা আইকিউআর) হ'ল আপনার ডেটাতে 50% মানের মান। এটি 1 ম চতুর্ভুজ মান এবং 3 য় চতুর্ভুজ মানের পার্থক্য হিসাবে গণনা করা হয়।

আমরা সেল এফ 4 তে একটি সাধারণ সূত্র ব্যবহার করব যা তৃতীয় কোয়ার্টিটাল থেকে 1 ম কোয়ার্টিটালকে বিয়োগ করে:

= এফ 3-এফ 2

এখন, আমরা আমাদের আন্তঃদেশীয় পরিসর প্রদর্শন করতে পারি।

তৃতীয় ধাপ: নিম্ন এবং উচ্চতর সীমাগুলি ফিরিয়ে দিন

নিম্ন এবং উপরের সীমাগুলি আমরা ব্যবহার করতে চাইছি এমন ডেটা রেঞ্জের ক্ষুদ্রতম এবং বৃহত্তম মান। এই সীমাবদ্ধ মানগুলির চেয়ে ছোট বা বড় কোনও মান হ'ল প্রকারের li

আমরা আইকিউআর মান 1.5 দ্বারা গুণমান এবং তারপরে এটি Q1 ডেটা পয়েন্ট থেকে বিয়োগ করে সেল এফ 5 এর নিম্ন সীমাবদ্ধতা গণনা করব:

= এফ 2- (1.5 * এফ 4)

বিঃদ্রঃ: এই সূত্রের বন্ধনীগুলি প্রয়োজনীয় নয় কারণ বিয়োগের অংশটি বিয়োগের অংশের আগে গণনা করবে তবে তারা সূত্রটি পড়তে সহজ করে তোলে।

এফ 6 সেলের উপরের সীমাটি গণনা করতে, আমরা আবার আইকিউআর 1.5 কে গুন করব, তবে এবার যোগ করুন এটি Q3 তথ্য পয়েন্ট:

= এফ 3 + (1.5 * এফ 4)

চতুর্থ ধাপ: আউটলিয়ারদের সনাক্ত করুন

এখন যেহেতু আমরা আমাদের সমস্ত অন্তর্নিহিত ডেটা সেট আপ করেছি, এখন আমাদের বহির্মুখী ডেটা পয়েন্টগুলি সনাক্ত করার সময় এসেছে — সেগুলি নিম্ন সীমা মান থেকে কম বা উপরের সীমিত মানের চেয়ে বেশি।

আমরা এই লজিকাল পরীক্ষাটি সম্পাদন করতে ও ফাংশনটি ব্যবহার করব এবং নীচের সূত্রটি ঘরে সি 2 এ প্রবেশ করে এই মানদণ্ডগুলির সাথে মেলে এমন মানগুলি দেখাব:

= বা (বি 2 $ এফ $ 6)

তারপরে আমরা সেই মানটি আমাদের C3-C14 কোষগুলিতে অনুলিপি করব। একটি সত্য মান একটি বাহককে নির্দেশ করে এবং আপনি দেখতে পাচ্ছেন যে, আমাদের ডেটাতে আমরা দুটি পেয়েছি।

গড় গড় গণনা করার সময় আউটলিয়ারদের উপেক্ষা করা

কোয়ার্টাইল ফাংশনটি ব্যবহার করে আসুন আমরা আইকিউআর গণনা করি এবং একজন বহিরাগতের সর্বাধিক ব্যবহৃত সংজ্ঞা দিয়ে কাজ করি। যাইহোক, যখন বিভিন্ন মানের মূল্যগুলির গড় গড় গণনা করা হয় এবং বহিরাগতদের উপেক্ষা করা হয়, তখন ব্যবহার করার জন্য আরও দ্রুত এবং সহজ ফাংশন রয়েছে। এই কৌশলটি আগের মতো কোনও আউটলেট সনাক্ত করতে পারে না, তবে এটি আমাদের আউটরিয়র অংশটি বিবেচনা করতে পারে তার সাথে আমাদের নমনীয় হতে দেয়।

আমাদের যে ক্রিয়াকলাপটির প্রয়োজন তা ট্রিমিয়ান বলা হয় এবং আপনি নীচের বাক্য গঠনটি দেখতে পারেন:

= ট্রিমিয়ান (অ্যারে, শতাংশ)

দ্য অ্যারে আপনি গড় করতে চান এমন মানের সীমা। দ্য শতাংশ ডেটা সেটের উপরে এবং নীচে থেকে বাদ দেওয়ার জন্য ডেটা পয়েন্টগুলির শতাংশ (আপনি এটি শতাংশ বা দশমিক মান হিসাবে প্রবেশ করতে পারেন)।

গড় গণনা করতে এবং 20% বহিরাগতকে বাদ দিতে আমরা উদাহরণের নীচে সেল ডি 3 তে সূত্রটি প্রবেশ করলাম।

= ট্রিমিয়ান (বি 2: বি 14, 20%)

আউটলিয়ারদের পরিচালনা করার জন্য আপনার দুটি পৃথক ফাংশন রয়েছে। আপনি কিছু প্রতিবেদনের প্রয়োজনের জন্য সেগুলি সনাক্ত করতে চান বা গড় হিসাবে গণনা থেকে এগুলি বাদ দিতে চান না কেন, এক্সেল আপনার প্রয়োজন অনুসারে কাজ করে।


$config[zx-auto] not found$config[zx-overlay] not found