Introducing 

Prezi AI.

Your new presentation assistant.

Refine, enhance, and tailor your content, source relevant images, and edit visuals quicker than ever before.

Loading content…
Loading…
Transcript

Мода

Как Netflix выбирает фильмы?

Методология статистики довольно обширна

Когда речь идет о показателях центра распределения, также всегда упоминается мода. Мода — это значение, которое встречается наиболее часто. В выборке 0, 2, 7, 2, 8, 2, 5, 4 мода равна 2. Ее имеет смысл использовать для качественных показателей. Так, например, если в выборке новорожденных чаще всего встречаются карие глаза, то мода равна карему цвету. Она не содержит какой-то другой информации. Использование моды в этом контексте обусловлено скорее традициями, чем реальной полезностью.

Графики-одно из основных средств статистики

Netflix — это американская компания, которая поставляет фильмы и сериалы на основе потоковых мультимедиа. Ее рекомендации каждому конкретному зрителю отличаются высокой степенью попадания в яблочко. Все дело в мастерском использовании статистических данных.

Процесс происходит следующим образом. Кинозритель выставляет рейтинг фильму, а программа запоминает оценку. Затем она ищет тех, кто поставил фильму такую же оценку, и уже из их просмотренных картин выбирает те, которые были оценены ими так же высоко. Данные фильмы и рекомендуются к просмотру этому телезрителю.

Размах вариации

Размах вариации — это разность между наибольшим и наименьшим значением. Например, если дана выборка 2, 6, 7,12,12,18, размах вариации равен 18 — 2 = 16. Этот показатель очень просто вычислить, но он обладает определенным недостатком: в нем не учитывается информация, содержащаяся во всей выборке. Анализ только крайних значений, которые могут встречаться очень редко, явно недостаточен, особенно если выборка велика. Если элементов выборки мало (например, 4–5), размах вариации — подходящий показатель. Если число элементов выборки равно двум, то этот показатель столь же удобен, как и все остальные.

Для визуализации используют диаграммы

Что статистика говорит о лотереях?

В истории США был случай, когда один человек дважды выигрывал в лотерею главный приз — миллион долларов. Вероятность такого совпадения примерно 1 к 27 триллионам! Что ж, бывает и такое тоже, хотя счастливчика стоило бы проверить на предмет родственных связей с организаторами лотереи.

В остальном, что касается лотерей, вероятность выигрыша в них подсчитывается путем сложения вероятностей всех категорий призов — от минимального до главного. Например, если билет стоит 1 доллар, а главный приз в 1000 долларов выпадает 1 раз из 4000, то средний выигрыш будет составлять около 56 центов. Вполне возможно, что вы случайно выиграете 20 или 200 долларов, купив один или два билета. Но если вы купите тысячу билетов, то статистика одержит верх над гипотетической удачей и, скорее всего, общий выигрыш составит лишь 560 долларов.

СТАТИСТИКА

История сатистики

Как Голливуд делает рейтинги фильмам?

Статистика как практическая деятельность людей зародилась в глубокой древности. Ее возникновение и развитие были обусловлены общественными потребностями: подсчет населения, скота, учет земельных угодий, имущества и т.д.

Теперь посмотрим, как можно манипулировать статистикой в свою пользу. Например, в списке самых кассовых голливудских фильмов на 2011-й год на первом месте стоит «Аватар», а пятое занимает «Шрек». А как же классика кинематографа и такие шедевры, как «Крестный отец» или «Унесенные ветром»?

Задача Голливуда — показать, что каждое его новое творение круче предыдущего. Тем самым создается имидж и бесперебойно пополняется бюджет. Для того чтобы выявить истинную картину, необходимо учитывать такой фактор, как поправка на инфляцию. С этой — настоящей — точки зрения список возглавили бы «Унесенные ветром». «Аватар» оказался бы на 14-м месте, а «Шрек» вообще начинал бы четвертый десяток фильмов этого списка.

Наиболее ранние сведения о таких работах в Китае относятся к V веку II тыс. до н.э. В Древнем Риме проводились учеты свободных граждан и их имущества. Учёт осуществлялся по полу и возрасту, собирались сведения о состоянии промышленности и сельского хозяйства.

В античном мире учитывали родившихся; в специальные списки вносились юноши, достигшие возраста военнообязанных (18 лет), а также 20 лет (возраст полноправных граждан). Составлялись земельные списки (кадастры), в которые включались сведения о строениях, рабах, скоте, инвентаре, доходах. Греческий философ Аристотель ещё за триста лет до нашей эры составил описание 157 городов государств.

В 1061 г. в Англии проведена всеобщая перепись населения, в ходе которой обследовано 240 тысяч дворов. Монгольские ханы проводили переписи в середине XIIIв. для взимания дани с захваченных русских земель.

На Руси первыми статистическими источниками были летописи, в которых упоминается о сборе различной информации в IX-XIвв.: возникновении и развитии городских поселений, расположенных на водных путях, о наличии в них храмов, церквей, монастырей, жилых строений.

В XVIв. в Венеции, Голландии появляются сборники, характеризующие политическое устройство, население, основные занятия, производимую продукцию в странах, с которыми устанавливалась торговля.

Секреты статистики

Learn more about creating dynamic, engaging presentations with Prezi