Как нормировать данные в excel
Перейти к содержимому

Как нормировать данные в excel

  • автор:

Как нормализовать данные в Excel

Как нормализовать данные в Excel

«Нормализация» набора значений данных означает масштабирование значений таким образом, чтобы среднее значение всех значений равнялось 0, а стандартное отклонение равнялось 1.

В этом руководстве объясняется, как нормализовать данные в Excel.

Пример: как нормализовать данные в Excel

Предположим, у нас есть следующий набор данных в Excel:

Необработанные данные в Excel в один столбец

Выполните следующие шаги, чтобы нормализовать этот набор значений данных.

Шаг 1: Найдите среднее значение.

Во-первых, мы будем использовать функцию =AVERAGE(диапазон значений) , чтобы найти среднее значение набора данных.

Средняя функция в Excel

Шаг 2: Найдите стандартное отклонение.

Далее мы будем использовать функцию = СТАНДОТКЛОН (диапазон значений) , чтобы найти стандартное отклонение набора данных.

Функция стандартного отклонения в Excel

Шаг 3: нормализуйте значения.

Наконец, мы будем использовать функцию STANDARDIZE(x, mean, standard_dev) для нормализации каждого из значений в наборе данных.

ПРИМЕЧАНИЕ:

Функция СТАНДАРТИЗАЦИЯ использует следующую формулу для нормализации заданного значения данных:

Нормализованное значение = (x – x ) / с

  • х = значение данных
  • x = среднее значение набора данных
  • s = стандартное отклонение набора данных

На следующем изображении показана формула, используемая для нормализации первого значения в наборе данных:

Нормализация данных в Excel

Как только мы нормализуем первое значение в ячейке B2, мы можем навести указатель мыши на правый нижний угол ячейки B2, пока не появится маленький +.Дважды щелкните + , чтобы скопировать формулу в оставшиеся ячейки:

Нормализованные данные в Excel

Теперь каждое значение в наборе данных нормализовано.

Как интерпретировать нормализованные данные

Формула, которую мы использовали для нормализации заданного значения данных x, была следующей:

Нормализованное значение = (x – x ) / с

  • х = значение данных
  • x = среднее значение набора данных
  • s = стандартное отклонение набора данных

Если конкретная точка данных имеет нормализованное значение больше 0, это указывает на то, что точка данных больше среднего. И наоборот, нормализованное значение меньше 0 указывает на то, что точка данных меньше среднего значения.

В частности, нормализованное значение говорит нам, сколько стандартных отклонений исходной точки данных от среднего. Например, рассмотрим точку данных «12» в нашем исходном наборе данных:

Формула нормализованных данных в Excel

Нормализованное значение для «12» оказалось равным -1,288, которое было рассчитано как:

Нормализованное значение = (х – х ) / с = (12 – 22,267) / 7,968 = -1,288

Это говорит нам о том, что значение «12» на 1,288 стандартных отклонения ниже среднего значения в исходном наборе данных.

Каждое из нормализованных значений в наборе данных может помочь нам понять, насколько близко или далеко конкретное значение данных от среднего. Небольшое нормализованное значение указывает, что значение близко к среднему, в то время как большое нормализованное значение указывает, что значение далеко от среднего.

Функция НОРМАЛИЗАЦИЯ

В этой статье описаны синтаксис формулы и использование функции НОРМАЛИЗАЦИЯ в Microsoft Excel.

Описание

Возвращает нормализованное значение для распределения, характеризуемого средним и стандартным отклонением.

Синтаксис

Аргументы функции НОРМАЛИЗАЦИЯ описаны ниже.

  • X Обязательный. Нормализуемое значение.
  • Среднее Обязательный. Среднее арифметическое распределения.
  • Стандартное_откл Обязательный. Стандартное отклонение распределения.

Замечания

  • Если standard_dev ≤ 0, функция STANDARDIZE возвращает #NUM! (значение ошибки).
  • Уравнение для нормализованного значения имеет следующий вид:

Пример

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу Enter. При необходимости измените ширину столбцов, чтобы видеть все данные.

Значение, которое нужно нормализовать.

Среднее арифметическое распределения.

Стандартное отклонение распределения.

Нормализованное значение числа 42, полученное с использованием числа 40 в качестве среднего арифметического и числа 1,5 в качестве стандартного отклонения.

Функция НОРМАЛИЗАЦИЯ

В этой статье описаны синтаксис формулы и использование функции НОРМАЛИЗАЦИЯ в Microsoft Excel.

Описание

Возвращает нормализованное значение для распределения, характеризуемого средним и стандартным отклонением.

Синтаксис

Аргументы функции НОРМАЛИЗАЦИЯ описаны ниже.

  • X Обязательный. Нормализуемое значение.
  • Среднее Обязательный. Среднее арифметическое распределения.
  • Стандартное_откл Обязательный. Стандартное отклонение распределения.

Замечания

  • Если standard_dev ≤ 0, функция STANDARDIZE возвращает #NUM! (значение ошибки).
  • Уравнение для нормализованного значения имеет следующий вид:

Пример

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу Enter. При необходимости измените ширину столбцов, чтобы видеть все данные.

Значение, которое нужно нормализовать.

Среднее арифметическое распределения.

Стандартное отклонение распределения.

Нормализованное значение числа 42, полученное с использованием числа 40 в качестве среднего арифметического и числа 1,5 в качестве стандартного отклонения.

Как нормализовать данные в Excel?

Термин «нормализация» сам по себе является модным словечком, которое популярно среди людей, работающих в различных областях, таких как машинное обучение, наука о данных, статистика и т. д. Нормализация — это общий термин, означающий уменьшение значений в пределах определенного диапазона. Происхождение слова «нормализация» как модного слова связано с тем, что оно часто неправильно понимается людьми и взаимозаменяемо используется с другим статистическим термином «стандартизация». В этой статье мы собираемся демистифицировать оба этих термина, а позже мы прочитаем, как мы можем реализовать эти методы на образце набора данных в Excel.

Нормализация (или масштабирование Min-Max) данных в excel

Это процесс масштабирования данных таким образом, чтобы все точки данных находились в диапазоне от 0 до 1. Таким образом, этот метод позволяет привести все точки данных к общему масштабу. Математическая формула нормализации имеет вид:

, где X — точка данных, X max и X min — максимальное и минимальное значение в группе записей соответственно. Процесс нормализации обычно используется, когда распределение данных не соответствует распределению Гаусса.

Давайте посмотрим на один пример, чтобы увидеть, как мы можем выполнить нормализацию для примера набора данных. Предположим, у нас есть запись о росте 10 учеников в классе, как показано ниже:

Рост (в см)
152
155
168
175
153
162
173
166
158
156

Шаг 1: Рассчитайте минимальное значение в распределении. Его можно рассчитать с помощью функции MIN(). Минимальное значение получается равным 152, которое хранится в ячейке B14.

Шаг 2: Рассчитайте максимальное значение в распределении. Его можно рассчитать с помощью функции MAX(). Максимальное значение равно 175, которое хранится в ячейке B15.

Шаг 3: Найдите разницу между максимальным и минимальным значениями. Их разница получается 175 – 152 = 23, которая хранится в ячейке B16.

Шаг 4: Для первых данных, хранящихся в ячейке A2, мы рассчитаем нормализованное значение, как показано на видео ниже.

Шаг 5: Мы можем вручную вычислить все значения по одному для каждой записи данных или мы можем напрямую получить значения для всех других ячеек, используя функцию автоматического заполнения Excel. Для этого перейдите в правый угол ячейки B2, пока не появится символ (+), а затем перетащите курсор вниз, чтобы автоматически заполнить значения внутри всех ячеек.

Примечание. При вычислении первого нормализованного значения в ячейке B2 следует убедиться, что эталонный адрес для ячеек B14 и B16 должен быть заблокирован с помощью кнопки Fn + F4, иначе будет выдана ошибка.

Если мы внимательно посмотрим на результаты, то заметим, что все значения лежат в диапазоне от 0 до 1.

Стандартизация (или нормализация Z-оценки)

Стандартизация — это процесс, в котором мы хотим масштабировать наши данные таким образом, чтобы распределение наших данных имело среднее значение, равное 0, и стандартное отклонение, равное 1. Математическая формула стандартизации задается как:

, где где X — точка данных, X mean — среднее значение распределения, а σ x — стандартное отклонение распределения.

Процесс стандартизации обычно используется, когда мы знаем, что распределение данных соответствует распределению Гаусса.

Метод 1: расчет нормализации z-показателя вручную

Шаг 1: Рассчитайте среднее/среднее значение распределения. Это можно сделать с помощью функции СРЗНАЧ(). Среднее значение получается равным 161,8 и сохраняется в ячейке B14.

Шаг 2: Рассчитайте стандартное отклонение распределения, которое можно выполнить с помощью функции СТАНДОТКЛОН(). Стандартное отклонение получается равным 8,323994767, которое хранится в ячейке B15.

Шаг 3: Для первых данных, хранящихся в ячейке A2, мы рассчитаем стандартизированное значение, как показано на изображении ниже.

Шаг 4: После ручного вычисления первого значения мы можем просто использовать функцию автоматического заполнения Excel, чтобы заполнить стандартизированными значениями все остальные записи.

Примечание. При вычислении первого стандартизированного значения в ячейке B2 следует убедиться, что эталонный адрес для ячеек B14 и B15 должен быть заблокирован с помощью кнопки Fn+F4, иначе будет выдана ошибка.

Метод 2. Вычисление нормализации Z-показателя с помощью функции СТАНДАРТИЗАЦИЯ()

Мы даже можем использовать встроенную функцию STANDARDIZE(), чтобы найти стандартизированное значение элемента. Синтаксис функции СТАНДАРТИЗАЦИЯ() выглядит следующим образом:

Где x — конкретный элемент/диапазон ячеек, mean — среднее/среднее арифметическое всех элементов в записи, а std_dev — стандартное отклонение всех элементов в записи.

Шаг 1: Рассчитайте среднее/среднее значение распределения. Это можно сделать с помощью функции СРЗНАЧ(). Среднее значение получается равным 161,8 и сохраняется в ячейке B14.

Шаг 2: Рассчитайте стандартное отклонение распределения, которое можно выполнить с помощью функции СТАНДОТКЛОН(). Стандартное отклонение получается равным 8,323994767, которое хранится в ячейке B15.

Шаг 3: Для первых данных, хранящихся в ячейке A2, мы рассчитаем стандартизированное значение, как показано на рисунке ниже.

Шаг 4: После ручного вычисления первого значения мы можем просто использовать функцию автоматического заполнения Excel, чтобы заполнить стандартизированными значениями все остальные записи.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *