Я прохожу серию курсов HarvardX по R, и в Data Science: Visualization в качестве примеров для построения графиков, сравнений и прочего использовались данные организации Gapminder. Они упарываются по статистике как по средству борьбы со стереотипами — и у них много данных по доходам, фертильности и проч. стран «развивающихся» и «развитых». Они утверждают, что это разделение давно неактуально. На курсе действительно интересно показывается работа с этой статистикой, но меня заинтересовало другое.
Вот график доходов на душу населения по регионам (график увеличивается):
Чтобы было понятно: это сравнение доходов стран по регионам, указанным внизу, за два года — красным показываются доходы за 1970, голубым — за 2010. Доход показывается с помощью прямоугольника-боксплота. Если говорить просто, внутри него отображается медиана, верх — максимальное значение, низ — минимальное, а точки — это отклоняющиеся от общей массы максимумы и минимумы. Такой взгляд значительно лучше описывает ситуацию, чем безликие «средние» значения.
График и так интересный, но меня дико заинтересовало, что это за богатая страна в Центральной Африке, имеющая европейские доходы при полной нищете соседей. Посмотрела в данных — оказывается, это Габон. Вот вы что-нибудь знаете про Габон? Наверняка нет. А там войска комплектуются на добровольной основе, полно бабла от нефти и большая часть людей исповедует христианство. Удивительное дело! Это такой же разрыв шаблона, как когда португальский таксист рассказывал мне, что все таксисты из Португалии едут зарабатывать в Анголу.
Если вас заинтересовал пик для Западной Африки, который уделал даже Габон, то это были туристические Сейшелы, а в Северной Европе всех подвела Латвия.