Частотное сравнение
Данный вид сравнения помогает определить, сколько объектов попадает в определенные последовательные области числовых значений. Например, частотное сравнение используется для того, чтобы показать, сколько работников зарабатывают менее чем 30 тыс. долл., сколько - 30-60 тыс. долл. и т. д.; сколько жителей относятся к возрастной группе до 10 лет, сколько - от 10 до 20, от 20 до 30 и т. д. Примеры типичных формулировок такого вида:
► В мае сделки в основном заключались в диапазоне от одной до двух тысяч долларов.
► Большая часть грузов была получена за 2-5 дней.
► Возрастная структура штата нашей компании сильно отличается от структуры штата нашего конкурента.
Термины, характерные для этого вида сравнения, - "в диапазоне от х до у", "концентрация", "частотность" и "распределение".
Частотное сравнение
Частотное сравнение показывает, сколько значений данного параметра (частотность) попадает в последовательные области числовых значений. Этот тип сравнения применяется в двух основных случаях. Во-первых, для обобщения сходных событий на основе выборки наблюдений. Здесь частотное сравнение используется для того, чтобы предсказывать риск, вероятность или возможность. К примеру, посредством данного вида сравнения можно показать, что в 25 % случаев грузы доставляются за пять или менее дней или выразить в процентах некую возможность, скажем, выбросить несчастливую семерку при игре в кости (берегите свои деньги - подобное происходит в одном случае из шести).
с применением частотного распределения, подчиняются
Колоколообразные кривые и многоугольники, связанные с применением частотного распределения, подчиняются математическим правилам. Облегчите себе жизнь и доверьте их подготовку профессиональному статистику. Поскольку эти кривые используются преимущественно в аналитических целях, мы не будем касаться их в этой книге.
Второй случай использования этого типа сравнения, нередко встречающийся в презентациях и докладах, - суммирование больших объемов информации для того, чтобы продемонстрировать значимую взаимосвязь (например, 25 % грузов доставляются за 5-6 дней). Подобное применение особенно полезно для отражения демографической информации - количества работников по размерам заработной платы, распределения семей по уровням дохода или модели голосования по возрастным группам. Неудивительно, что такой тип сравнения данных особенно часто используется во время переписи населения или президентских выборов.
В вышеназванных целях данный тип
В вышеназванных целях данный тип сравнения лучше всего иллюстрировать с помощью ступенчатых гистограмм или графиков. Гистограммы нагляднее, когда используется не больше 5-7 областей числовых значений, в противном случае следует воспользоваться графиком.
Эти типы диаграмм содержат две шкалы - вертикальную (частотности), где указывается количество (иногда в процентах) анализируемых элементов или явлений, и горизонтальную (распределения) для диапазонов. Шкала распределения требует особого внимания.
и количество диапазонов весьма важны
Размер диапазонов. Размер и количество диапазонов весьма важны для демонстрации модели распределения. Слишком малое количество не позволяет проследить модель, а слишком большое - разбивает ее на мелкие части. Как правило, применяется не менее пяти, но не более двадцати областей числовых значений. При этом вы должны подобрать такие размеры диапазонов, которые нагляднее всего продемонстрируют вашу основную мысль. Обратимся к конкретному примеру. Допустим, мы хотим создать модель распределения среднегодовых заработков учителей государственных школ в пятидесяти штатах.
При использовании диапазона в 500 долл. проследить зависимость не удается.
Если мы увеличим размер диапазона
Если мы увеличим размер диапазона до 1 тыс. долл., модель начинает вырисовываться.
Но лишь при использовании диапазона
Но лишь при использовании диапазона в 2 тыс. долл. мы получаем наглядную модель. Здесь мы ясно видим колоколообразную кривую, которая обычно изображает частотное
распределение. Кривая сдвинута влево, то есть к низшей стороне распределения. Это иллюстрирует основную идею: почти в половине штатов (в 23-х из 50-ти) учителям платят менее 16 тыс. долл. в год.
Размер интервалов. Лучше всего использовать
Размер интервалов. Лучше всего использовать интервалы одинакового размера. Если один интервал отражает разницу в 5 долл., а другой - в 20, кривая распределения получится искаженной. Исключением из этого правила являются случаи, когда информация фиксируется в неравных диапазонах (например, уровни образования) или когда неравные интервалы помогают лучше усвоить информацию (как в случае с разбросом подоходного налога). Разброс доходов настолько велик, что близко к низшей точке оказывается слишком много людей, а к высшей - слишком мало. Поэтому равные интервалы здесь применять нельзя. При использовании интервалов по 1 тыс. долл. придется чертить диаграмму в несколько метров шириной, а при интервалах по 40 тыс. долл. практически все население окажется в пределах первого интервала. Диаграмма будет наиболее информативной, если более мелкие интервалы использовать ближе к низшей точке, а более крупные - ближе к высшей.
Четкие границы. Размеры интервалов должны быть четко обозначены. "Перекрывающиеся" границы (0-10, 10-20, 20-30) не объясняют, к каким интервалам относятся цифры, повторяющиеся по два раза (10, 20). Для непрерывных величин (например, объемов долларовых продаж) предпочтительнее всего следующие границы - менее 10,00 долл., 10,00-19,99 долл., 20,00 29,99 долл. и т. д. Для дискретных величин (количество произведенных автомобилей и т. п.) - менее 10, 10-19, 20-29 и т. д.
И гистограммы, и графики можно совмещать. Например, для того, чтобы сравнить данные по двум разным годам или сопоставить возрастной состав сотрудников вашей компании и компаний-конкурентов или в отрасли в целом. Кроме того, при иллюстрации конкретных величин можно применять диаграммы с накоплением, чтобы показать вклад каждого параметра в общую сумму[1].
Двойное сравнение
Вы заметите, что в некоторых примерах диаграммы выглядят так, как будто принадлежат к другому разделу. Это сделано потому, что иногда та идея, которую вы сформулировали на основе анализа данных, требует двойного сравнения, например, позиционного и покомпонентного или временного и позиционного. В таких случаях необходимо решить, какое сравнение первично, а какое вторично. Разберем в качестве примера следующую фразу, содержащую и временное, и позиционное сравнение: "По прогнозам, в течение следующих 10 лет объем продаж увеличится, однако роста прибыли может не произойти". Первая часть фразы - временное сравнение. Однако утверждение "роста прибыли может не произойти" добавляет еще одно, позиционное сравнение. Другими словами, нас интересует не только изменение объема продаж за некий период (временное сравнение), но и сравнение поведения показателей - продаж (позиция 1) и прибыли (позиция 2). Однако первичным является временное сравнение, поэтому мы используем базовый тип диаграммы, наиболее подходящий для временного сравнения. В данном случае лучше всего подойдет график с отдельной линией для каждой позиции. В наших примерах такие двойные диаграммы включены в разделы в соответствии с тем сравнением, которое я определил как первичное.
Формулирование идеи (от данных к идее)
Выбирать тип диаграммы, не сформулировав окончательно идею, которую вы хотите донести с ее помощью, - это все равно что подбирать предметы гардероба по цвету с закрытыми глазами.
Выбор правильного типа диаграммы целиком и полностью зависит от того, насколько четко вы представляете себе, что вы хотите ею сказать. Тип диаграммы определяют вовсе не данные (доллары или иены, проценты или литры) и не те или иные параметры (прибыль, рентабельность инвестиций или зарплата), а ваша идея - то, что вы хотите показать, тот смысл, который вы хотите в диаграмму вложить.
Чтобы понять важность первого шага, набросайте как можно больше диаграмм в пустых рамках на следующей странице, используя данные (процентное соотношение объема продаж по регионам для каждой компании) из таблицы в правом верхнем углу. Не думайте об аккуратности, просто нарисуйте как можно больше диаграмм, после чего переходите на следующую страницу.
Говори на языке диаграмм
Вперед